Nueva versión de Mozilla Common Voice 7.0 (el conjunto de datos de voz de datos abiertos más grande del mundo, diseñado para democratizar la tecnología de voz), llega con más de 13.000 horas de datos de voz y la adición de 16 idiomas.
Los modelos adiestrados están disponibles de forma gratuita a través de un kit de herramientas de software libre llamado NVIDIA Nemo.
El proyecto tiene como objetivo organizar el trabajo conjunto para acumular una base de datos de voz, teniendo en cuenta toda la variedad de voces y formas de hablar. La base de datos se puede utilizar sin restricciones en sistemas de machine learning y en proyectos de investigación.
