IRVINE, California: Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI per sviluppare GigaSpeech 2, un’iniziativa coronata dal successo. I set di sviluppo e test di GigaSpeech 2 vengono etichettati da un’équipe di professionisti Dataocean AI.

Panoramica su GigaSpeech 2

GigaSpeech 2 è un corpus di riconoscimento del discorso multilingue e multidominio, su grande scala, in continua espansione, progettato per promuovere la ricerca e lo sviluppo nel riconoscimento del discorso in lingue a ridotte risorse. La versione grezza di GigaSpeech 2 contiene 30.000 ore di audio trascritto automaticamente per le lingue della Thailandia, dell’Indonesia e del Vietnam.

Fonte: Business Wire

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con le notizie diiscriviti alla nostra Newsletter gratuita