Continuamos coa publicación de artigos sobre proxectos libres relacionados coa Intelixencia Articial.
Co lanzamento dos seus primeiros modelos de linguaxe extensa (LLM), o proxecto EuroLLM pretende ofrecer un modelo LLM multilingüe e multimodal competitivo para os 24 idiomas oficiais europeos.
Iniciado en setembro de 2024 e publicado baixo a licenza de código aberto Apache 2.0, os primeiros modelos de EuroLLM exemplifican como a intelixencia artificial (IA) pode adaptarse á diversidade lingüística de Europa, fomentando ao mesmo tempo un ecosistema europeo innovador en IA.

Os primeiros modelos de EuroLLM, o EuroLLM-1.7B e o seu modelo complementario de afinación, EuroLLM-1.7B-Instruct, teñen como obxectivo proporcionar aos usuarios europeos un LLM competitivo que poida recibir indicacións e xerar texto en todos os idiomas oficiais europeos.
Os LLM establecidos adoitan centrarse no inglés e noutros poucos idiomas amplamente falados. En cambio, EuroLLM propón unha solución enfocada a unha ampla variedade de linguas faladas.
Para crear capacidades multilingües e multimodais, EuroLLM adestrou o seu modelo EuroLLM-1.7B cun amplo conxunto de datos que inclúe 4 billóns de tokens, representando diferentes fontes de datos e todos os idiomas considerados. Para a afinación en tarefas de instrución, desenvolveuse o modelo EuroLLM-1.7B-Instruct empregando EuroBlocks, un conxunto de datos multilingües creado por EuroLLM para estas tarefas.

O EuroLLM-1.7B-Instruct destacou especialmente ao superar o rendemento de Gemma-2B, o modelo “aberto” de Google baseado na mesma investigación que os seus modelos Gemini.
Desenvolvendo LLM dispoñibles en todos os idiomas oficiais europeos, así como noutros idiomas importantes como o ruso, o árabe e o chinés, EuroLLM proporciona aos usuarios europeos e globais acceso a tecnoloxía de IA competitiva nos seus idiomas preferidos.
EuroLLM é un proxecto cofinanciado pola Unión Europea e conformado por un consorcio de nove socios, incluíndo universidades europeas de prestixio, laboratorios técnicos de investigación establecidos e empresas especializadas en tradución con IA, tanto de Europa como doutros lugares. O proxecto tamén está vinculado á Empresa Común Europea de Computación de Alto Rendemento (EuroHPC JU), formando parte dun obxectivo estratéxico máis amplo: crear un ecosistema de IA europeo competitivo e innovador.
Coa publicación dos seus modelos baixo unha licenza de código aberto, que inclúe pesos abertos, o proxecto ten o potencial de fomentar a innovación europea no ámbito da intelixencia artificial de código aberto.

Presentándose como un proxecto de “código aberto” e “pesos abertos”, os modelos de EuroLLM foron publicados en HuggingFace tras o seu lanzamento. A decisión de abrir os modelos proporciona unha base para un desenvolvemento innovador posterior e demostra como as infraestruturas de supercomputación da UE poden ser utilizadas para impulsar a innovación aberta.
