Dataocean AI ha partecipato alla creazione del set di dati open source GigaSpeech 2, un corpus ASR multidominio su grande scala per lingue con ridotte risorse

Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI per sviluppare GigaSpeech 2, un’iniziativa coronata dal successo. I set di sviluppo e test di GigaSpeech 2 vengono etichettati da un’équipe di professionisti Dataocean AI. Questo comunicato stampa include contenuti multimediali. Visualizzare l’intero comunicato qui…

IRVINE, California, 25/09/2024 (informazione.it - comunicati stampa - servizi)

Questo comunicato stampa include contenuti multimediali. Visualizzare l’intero comunicato qui: https://www.businesswire.com/news/home/20240924070570/it/

Dataocean AI ha partecipato alla creazione del set di dati open source GigaSpeech 2, un corpus ASR multidominio su grande scala per lingue con ridotte risorse

(Photo: Business Wire)

Panoramica su GigaSpeech 2

GigaSpeech 2 è un corpus di riconoscimento del discorso multilingue e multidominio, su grande scala, in continua espansione, progettato per promuovere la ricerca e lo sviluppo nel riconoscimento del discorso in lingue a ridotte risorse. La versione grezza di GigaSpeech 2 contiene 30.000 ore di audio trascritto automaticamente per le lingue della Thailandia, dell’Indonesia e del Vietnam.

Il testo originale del presente annuncio, redatto nella lingua di partenza, è la versione ufficiale che fa fede. Le traduzioni sono offerte unicamente per comodità del lettore e devono rinviare al testo in lingua originale, che è l'unico giuridicamente valido.