{"id":61845,"date":"2024-07-08T07:49:12","date_gmt":"2024-07-08T05:49:12","guid":{"rendered":"https:\/\/mancomun.gal\/novas\/carballo-primer-gran-modelo-de-linguaxe-para-o-galego\/"},"modified":"2024-07-08T07:55:03","modified_gmt":"2024-07-08T05:55:03","slug":"carballo-primer-gran-modelo-de-linguaxe-para-o-galego","status":"publish","type":"mncmn-nova","link":"https:\/\/mancomun.gal\/es\/novas\/carballo-primer-gran-modelo-de-linguaxe-para-o-galego\/","title":{"rendered":"Carballo, primer gran modelo de lenguaje para el gallego"},"content":{"rendered":"\n<p>CiTIUS y el Instituto da Lingua Galega presentan el primer modelo ling\u00fc\u00edstico de Inteligencia Artificial para el gallego. <a href=\"https:\/\/huggingface.co\/proxectonos\/Carballo-bloom-1.3B\">Carballo<\/a> permitir\u00e1 el desarrollo de herramientas tecnol\u00f3gicas y sistemas inteligentes creados espec\u00edficamente para el gallego.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"845\" height=\"498\" src=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/Carballo.jpg\" alt=\"Ilustraci\u00f3n de un \u00e1rbol saliendo de un libro\" class=\"wp-image-61839\" style=\"width:800px\" srcset=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/Carballo.jpg 845w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/Carballo-300x177.jpg 300w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/Carballo-768x453.jpg 768w\" sizes=\"auto, (max-width: 845px) 100vw, 845px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"carballo\">Carballo<\/h2>\n\n\n\n<p>Se trata de un <strong>modelo conocido como fundacional<\/strong>, por ser la pieza b\u00e1sica para construir herramientas vers\u00e1tiles y de muy alta calidad mediante IA generativa con tecnolog\u00eda ling\u00fc\u00edstica, como chatbots, traductores o correctores autom\u00e1ticos.<\/p>\n\n\n\n<p><strong>Carballo necesita a\u00fan adaptaciones t\u00e9cnicas para convertirse en un sistema de di\u00e1logo<\/strong> con el que poder mantener una conversaci\u00f3n fluida y ofrecer respuestas autom\u00e1ticas con una interacci\u00f3n sencilla e intuitiva.<\/p>\n\n\n\n<p>Carballo es fruto de dos proyectos de investigaci\u00f3n: N\u00f3s, impulsado por la Xunta de Galicia, e ILENIA, promovido por el Ministerio para la Transformaci\u00f3n Digital y de la Funci\u00f3n P\u00fablica para el impulso de todas las lenguas oficiales del Estado. En este sentido, el modelo gallego est\u00e1 basado en Flor1.3, el modelo hom\u00f3logo desarrollado previamente para el catal\u00e1n en el marco del proyecto AINA-ILENIA, que se desarrolla en el Barcelona Supercomputing Centre (BSC-CNS).<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"351\" src=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/carballo-hugginface-1024x351.png\" alt=\"Captura de pantalla de hugging face Proxectonos\/Carballo-bloom-1.3B\" class=\"wp-image-61841\" style=\"width:600px\" srcset=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/carballo-hugginface-1024x351.png 1024w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/carballo-hugginface-300x103.png 300w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/carballo-hugginface-768x263.png 768w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/07\/carballo-hugginface.png 1256w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Carballo cuenta con una arquitectura GPT de <strong>1.300 millones de \u2018par\u00e1metros\u2019<\/strong>.<\/p>\n\n\n\n<p>Para el entrenamiento de Carballo se us\u00f3 un corpus masivo de textos en gallego, llamado CorpusN\u00f3s, formado por aproximadamente 2.100 millones de palabras.<\/p>\n\n\n\n<p>Una parte significativa de este corpus fue elaborada en el contexto del propio Proyecto N\u00f3s, en virtud de numerosos convenios y acuerdos de cesi\u00f3n con empresas y organizaciones proveedoras de datos textuales.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"recursos-libres-e-gratu\u00edtos\">Recursos libres y gratuitos<\/h2>\n\n\n\n<p>El proyecto ILENIA, impulsado por el Ministerio para la Transformaci\u00f3n Digital y de la Funci\u00f3n P\u00fablica, tiene como objetivo generar recursos digitales que permitan desarrollar aplicaciones multiling\u00fces en las diferentes lenguas oficiales del Estado. Junto a la USC (N\u00f3s, gallego) y el BSC-CNS (AINA, catal\u00e1n), en el proyecto participan tambi\u00e9n los centros CENID (proyecto VIVES, valenciano) y HiTZ (proyecto NEL-GAITU, euskera). Cabe destacar que, junto a Carballo, fue tambi\u00e9n desarrollado en colaboraci\u00f3n con la Universidad de \u00c9vora, el primer modelo fundacional gallego y portugu\u00e9s, Carvalho, con el objetivo de fortalecer nuestra lengua mediante la inclusi\u00f3n del portugu\u00e9s europeo.<\/p>\n\n\n\n<p>El modelo fundacional Carballo para el gallego <strong>es un paso m\u00e1s en esta estrategia de disponer de las capacidades cient\u00edfico-tecnol\u00f3gicas para no depender de grandes corporaciones ajenas a la realidad social y cultural de Galicia, creando recursos abiertos y libres<\/strong> para que otras empresas e instituciones puedan desarrollar tecnolog\u00edas ling\u00fc\u00edsticas en gallego de amplio inter\u00e9s social, e incluso econ\u00f3mico.<\/p>\n\n\n\n<p>Con respecto al Proyecto N\u00f3s, el equipo responsable de Carballo contin\u00faa trabajando en la mejora de la calidad del modelo, as\u00ed como en el incremento del tama\u00f1o de nuevos modelos fundacionales y su adaptaci\u00f3n a la resoluci\u00f3n de m\u00faltiples tareas, tal y como ya hacen herramientas comerciales de uso extendido como ChatGPT. Por ahora ya est\u00e1 disponible un <a href=\"https:\/\/huggingface.co\/spaces\/proxectonos\/Nos_LLM_galician\">demostrador<\/a>, que incluso permite un uso b\u00e1sico del modelo, junto con algunos ejemplos preconstruidos.<\/p>\n","protected":false},"featured_media":61844,"template":"","categories":[711],"tags":[283],"class_list":["post-61845","mncmn-nova","type-mncmn-nova","status-publish","has-post-thumbnail","hentry","category-ciudadania-es","tag-ia-es"],"acf":[],"_links":{"self":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/mncmn-nova\/61845","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/mncmn-nova"}],"about":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/types\/mncmn-nova"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/media\/61844"}],"wp:attachment":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/media?parent=61845"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/categories?post=61845"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/tags?post=61845"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}