Mancomún

Preservando el estoniano con software libre

martes, 9 julio 2024
Preservando el estoniano con software libre

La campaña de Estonia «Dona una voz» fue lanzada en 2023, para mejorar la tecnología de procesamiento de lenguaje para la lengua estoniana, está alojada como software libre y tiene el objetivo de avanzar en las capacidades de procesamiento de voz de su asistente virtual de IA libre y de código abierto (Bürokratt).

Logo de Estonian open data

Organizado como parte de la Estrategia de la Lengua Estoniana 2021-2035, el primer paso del proyecto fue recoger muestras de voz de tantas personas como fuera posible a través del Portal de Datos Abiertos de Estonia. Los materiales de voz están en una base de datos que también es libre y de código abierto, destacando cómo el software libre y de código abierto permite mejoras sociales proporcionando los bloques de construcción de software para una amplia variedad de propósitos.

Estas muestras serán usadas para mejorar el reconocimiento de voz del asistente virtual Bürokratt, haciendo que los servicios de e-gobierno de Estonia sean accesibles para más personas. El proyecto también tiene como objetivo contribuir a preservar la lengua, registrando cómo se habla — ahora y con el paso del tiempo.

Los materiales de voz producidos también estarán disponibles a través del Portal de Datos Abiertos, con el objetivo de ayudar tanto al desarrollo de software del sector público como del sector privado.

Esto será usado para subtítulos automáticos (emisoras públicas y privadas), transcripciones de reuniones, software controlado por voz, llamadas telefónicas impulsadas por servicios, así como servicios generales para personas con discapacidad auditiva. Se espera que esto ayude tanto a hablantes nativos como no nativos.

Aunque la producción de voz puede centrarse en una sola pronunciación, el reconocimiento de voz debe tratar las complejidades de los acentos y dialectos, así como la voz poco clara y los impedimentos del habla. El objetivo inicial es aumentar el reconocimiento de la voz espontánea del 85% al 91%, pero las personas que trabajan en este proyecto también señalan que la lengua y la pronunciación están en constante evolución, y mantener la precisión requerirá un trabajo continuo.

Xunta

Xunta de Galicia, Información mantenida y publicada en internet por Xunta de Galicia

Atención a la ciudadanía - Accesibilidad - Aviso legal - Mapa del portal