A campaña de Estonia “Doa unha fala” foi lanzada en 2023, para mellorar a tecnoloxía de procesamento de linguaxe para a lingua estoniana, está aloxada como software libre e ten o obxectivo de avanzar nas capacidades de procesamento de fala do seu asistente virtual de IA libre e de código aberto (Bürokratt).

Organizado como parte da Estratexia da Lingua Estoniana 2021-2035, o primeiro paso do proxecto foi recoller mostras de fala de tantas persoas como fora posible a través do Portal de Datos Abertos de Estonia. Os materiais de fala están nunha base de datos que tamén é libre e de código aberto, destacando como o software libre e de código aberto permite melloras sociais proporcionando os bloques de construción de software para unha ampla variedade de propósitos.
Estas mostras serán usadas para mellorar o recoñecemento de fala do asistente virtual Bürokratt, facendo que os servizos de e-goberno de Estonia sexan accesibles para máis persoas. O proxecto tamén ten como obxectivo contribuír a preservar a lingua, rexistrando como se fala — agora e co paso do tempo.
Os materiais de fala producidos tamén estarán dispoñibles a través do Portal de Datos Abertos, co obxectivo de axudar tanto ao desenvolvemento de software do sector público como do sector privado.
Isto será usado para subtítulos automáticos (emisoras públicas e privadas), transcricións de reunións, software controlado por voz, chamadas telefónicas impulsadas por servizos, así como servizos xerais para persoas con discapacidade auditiva. Espérase que isto axude tanto a falantes nativos como non nativos.
Aínda que a produción de fala pode centrarse nunha soa pronunciación, o recoñecemento de fala debe tratar as complexidades dos acentos e dialectos, así como a fala pouco clara e os impedimentos da fala. O obxectivo inicial é aumentar o recoñecemento da fala espontánea do 85% ao 91%, pero as persoas que traballan neste proxecto tamén sinalan que a lingua e a pronunciación están en constante evolución, e manter a precisión requirirá un traballo continuo.
