{"id":43823,"date":"2024-02-16T07:00:00","date_gmt":"2024-02-16T06:00:00","guid":{"rendered":"https:\/\/mancomun.gal\/?post_type=ficha&#038;p=43823"},"modified":"2024-02-15T09:06:35","modified_gmt":"2024-02-15T08:06:35","slug":"proxectos-libres-de-ia-a-evolucion-dos-llms","status":"publish","type":"ficha","link":"https:\/\/mancomun.gal\/es\/ficha\/proxectos-libres-de-ia-a-evolucion-dos-llms\/","title":{"rendered":"Proyectos libres de IA \u2013 La evoluci\u00f3n de los LLMs"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Comenzamos con la publicaci\u00f3n de una serie de art\u00edculos sobre proyectos libres relacionados con la Inteligencia Artificial. En este primer art\u00edculo haremos un repaso a los Modelos de Lenguaje Grande, m\u00e1s conocidos como LLMs.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"500\" height=\"500\" src=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/intelixencia-artificial.jpg\" alt=\"\" class=\"wp-image-43816\" srcset=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/intelixencia-artificial.jpg 500w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/intelixencia-artificial-300x300.jpg 300w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/intelixencia-artificial-150x150.jpg 150w\" sizes=\"auto, (max-width: 500px) 100vw, 500px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"llms\">LLMs<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Los LLMs, o \u00abLarge Language Models\u00bb (Modelos de Lenguaje Grande), son <strong>sistemas de inteligencia artificial dise\u00f1ados para entender, generar y trabajar con texto de manera avanzada<\/strong>. Estos modelos son entrenados con enormes cantidades de datos textuales para aprender patrones de lenguaje, gram\u00e1tica, e incluso estilo y contexto.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Su capacidad para procesar y generar lenguaje los hace herramientas poderosas para una variedad de aplicaciones, incluyendo traducci\u00f3n autom\u00e1tica, generaci\u00f3n de texto, resumen, y otros. Estos sistemas <strong>experimentaron un aumento de su popularidad desde principios del a\u00f1o 2023<\/strong>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Los LLM libres, se distinguen por ser desarrollados y distribuidos bajo licencias que permiten a cualquiera acceder, modificar y compartir el c\u00f3digo fuente. Esto tiene varias implicaciones importantes:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8211; <strong>Transparencia<\/strong>. Al ser abiertos, es posible revisar y entender c\u00f3mo funcionan estos modelos, lo que contribuye a un mayor entendimiento de sus mecanismos y limitaciones.<br>&#8211; <strong>Personalizaci\u00f3n<\/strong>. Los usuarios pueden adaptar los modelos a sus necesidades espec\u00edficas, mejorando o modificando su comportamiento seg\u00fan requieran sus proyectos.<br>&#8211; <strong>Comunidad y colaboraci\u00f3n<\/strong>. Fomenta una comunidad de desarrolladores y usuarios que colaboran para mejorar el modelo, compartir soluciones y crear nuevas aplicaciones.<br>&#8211; <strong>Accesibilidad<\/strong>. Al estar disponibles de manera gratuita, reducen las barreras de entrada para individuos y organizaciones que desean explorar o utilizar inteligencia artificial, democratizando el acceso a tecnolog\u00edas avanzadas.<br>&#8211; <strong>\u00c9tica y responsabilidad<\/strong>. La filosof\u00eda del software libre promueve un debate abierto sobre el uso \u00e9tico de la inteligencia artificial, incluyendo la preocupaci\u00f3n por la privacidad, el sesgo de los datos y el impacto social de los LLM.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"500\" height=\"500\" src=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/llm-libres.jpg\" alt=\"LLMs libres\" class=\"wp-image-43817\" srcset=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/llm-libres.jpg 500w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/llm-libres-300x300.jpg 300w, https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/llm-libres-150x150.jpg 150w\" sizes=\"auto, (max-width: 500px) 100vw, 500px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"ejemplos-de-llms-libres\">Ejemplos de LLMs libres<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">&#8211; <strong>GPT-Neo y GPT-NeoX<\/strong>. Desarrollados por EleutherAI, estos modelos son alternativas de c\u00f3digo abierto a las versiones comerciales de GPT (Generative Pre-trained Transformer) de OpenAI. GPT-Neo y GPT-NeoX est\u00e1n dise\u00f1ados para ser escalables y accesibles, permitiendo a investigadores y desarrolladores trabajar con tecnolog\u00eda puntera en procesamiento de lenguaje natural (PLN) sin restricciones de licencia.<br>&#8211; <strong>GPT-J<\/strong>. Tambi\u00e9n una iniciativa de EleutherAI, GPT-J es un modelo de lenguaje de gran escala que destaca por su capacidad de generaci\u00f3n de texto y comprensi\u00f3n.<br>&#8211; <strong>Stable Diffusion<\/strong>. Aunque es m\u00e1s conocido como un modelo de generaci\u00f3n de im\u00e1genes, Stable Diffusion tambi\u00e9n  incluye capacidades de procesamiento de texto a trav\u00e9s de CLIP, un modelo que puede entender y generar descripciones a partir de im\u00e1genes. Es un proyecto de c\u00f3digo abierto que fomenta la innovaci\u00f3n en varios campos de la IA.<br>&#8211; <strong>Bloom<\/strong>: Desarrollado por Hugging Face y BigScience, entrenado en un conjunto de datos masivo de texto y c\u00f3digo.<br>&#8211; <strong>LaMDA<\/strong>. Desarrollado por Google AI, conocido por su capacidad para generar conversaciones fluidas y coherentes.<br>&#8211; <strong>Megatron-Turing NLG<\/strong>. Desarrollado por NVIDIA y Microsoft, entrenado en un conjunto de datos de texto y c\u00f3digo con enfoque en tareas de lenguaje natural.<br>&#8211; <strong>WuDao 2.0.<\/strong> Desarrollado por la Academia de Inteligencia Artificial de Beijing (BAAI), entrenado principalmente en chino, pero tambi\u00e9n con capacidades en ingl\u00e9s.<br>&#8211; <strong>BERT<\/strong> (Bidirectional Encoder Representations from Transformers) es un modelo desarrollado por Google que fue pionero en el uso de transformadores para entender el contexto de las palabras en un texto de forma bidireccional. Aunque el BERT original no es un LLM en el mismo sentido que los modelos GPT, su arquitectura abri\u00f3 el camino para el desarrollo de muchos modelos derivados que son libres.<br>&#8211; <strong>RoBERTa<\/strong>. Desarrollado por Facebook AI, RoBERTa es una optimizaci\u00f3n de BERT que mejora su rendimiento mediante el ajuste del proceso de entrenamiento y el aumento de la cantidad de datos de entrenamiento.<br>&#8211; <strong>XLNet<\/strong>. XLNet es otro modelo basado en transformadores, desarrollado por Google Brain y Carnegie Mellon University, que supera a BERT en varias tareas de comprensi\u00f3n de texto.<br>&#8211; <strong>OpenAI&#8217;s GPT-2<\/strong>. Aunque OpenAI limit\u00f3 inicialmente el acceso a su modelo GPT-3 debido a preocupaciones sobre su potencial mal uso, la versi\u00f3n anterior, GPT-2, fue liberada completamente como c\u00f3digo abierto. Esto permiti\u00f3 a investigadores y desarrolladores explorar y experimentar con las capacidades del modelo.<br>&#8211; <strong>FairSeq<\/strong>. Desarrollado por Facebook AI Research, FairSeq es una biblioteca de aprendizaje profundo para secuencia a secuencia (seq2seq) que incluye implementaciones de BART, RoBERTa, y otros modelos basados en transformadores. Aunque FairSeq en s\u00ed mismo es m\u00e1s un marco de trabajo que un modelo espec\u00edfico, proporciona las herramientas necesarias para entrenar y desplegar LLMs.<br>&#8211; <strong>TensorFlow Model Garden<\/strong>. Aunque TensorFlow en s\u00ed mismo es una biblioteca de aprendizaje autom\u00e1tico de c\u00f3digo abierto desarrollada por Google, el Model Garden ofrece un conjunto de modelos pre-entrenados e implementaciones que incluyen t\u00e9cnicas de \u00faltima generaci\u00f3n.<br>&#8211; <strong>AllenNLP<\/strong>. Desarrollado por el Allen Institute for AI, AllenNLP es una plataforma de c\u00f3digo abierto dise\u00f1ada para la investigaci\u00f3n en PLN. Ofrece una amplia gama de modelos pre-entrenados y herramientas para facilitar la experimentaci\u00f3n en comprensi\u00f3n de lectura, inferencia textual, y m\u00e1s.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Estos modelos y herramientas representan solo una muestra del amplio y creciente ecosistema de inteligencia artificial libre y de c\u00f3digo abierto. La disponibilidad de estos recursos permite a una amplia gama de usuarios, desde investigadores hasta entusiastas, explorar las fronteras de la tecnolog\u00eda de IA y contribuir a su desarrollo de forma colaborativa.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"plataformas-de-acceso-a-llms\">Plataformas de acceso a LLMs<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Para acceder a estos recursos de una forma sencilla, se puede hacer a trav\u00e9s de plataformas en l\u00ednea como:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8211; <a href=\"https:\/\/huggingface.co\/\">Hugging Face<\/a>. Ofrece una amplia gama de LLMs pre-entrenados, incluyendo algunos de c\u00f3digo abierto como Bloom y LaMDA, con interfaces f\u00e1ciles de usar para su implementaci\u00f3n.<br>&#8211; <a href=\"https:\/\/cloud.google.com\/ai-platform\/docs\/technical-overview?hl\n\n=es-419\">Google AI Platform<\/a>. Proporciona acceso a algunos de sus LLMs m\u00e1s avanzados, como LaMDA y Meena.<br>&#8211; <a href=\"https:\/\/deepmind.google\/\">DeepMind<\/a>. Ofrece acceso a algunos de sus LLMs de investigaci\u00f3n, como Gopher y Gato.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"problemas-de-los-llms\">Problemas de los LLMs<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Aunque esta tecnolog\u00eda tiene un gran potencial, hay que tener en cuenta que pueden presentarse diferentes problemas con su uso:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8211; <strong>Sesgos<\/strong>. Los LLMs pueden heredar sesgos presentes en los datos de entrenamiento, lo que puede generar resultados discriminatorios o injustos. Por ejemplo, si un LLM se entrena con un conjunto de datos que contiene principalmente textos escritos por hombres, es probable que genere resultados que favorezcan a los hombres.<br>&#8211; <strong>Interpretabilidad<\/strong>. La complejidad de los LLMs dificulta la comprensi\u00f3n de c\u00f3mo funcionan y por qu\u00e9 generan ciertos resultados. Esto puede dificultar la detecci\u00f3n de errores o sesgos en el modelo, as\u00ed como la confianza en sus decisiones.<br>&#8211; <strong>Seguridad y \u00e9tica<\/strong>. Es importante utilizar los LLMs de forma responsable y \u00e9tica para evitar su uso con fines maliciosos. Los LLMs podr\u00edan ser utilizados para generar contenido falso, propaganda o para manipular a las personas.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"evoluci\u00f3n-de-los-modelos\">Evoluci\u00f3n de los modelos<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">A lo largo de los \u00faltimos a\u00f1os, estos modelos han tenido una r\u00e1pida evoluci\u00f3n que podemos resumir en los siguientes puntos:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8211; <strong>Aumento del tama\u00f1o y la complejidad<\/strong>. Los LLMs experimentaron un crecimiento exponencial en su tama\u00f1o, con algunos modelos actuales que albergan miles de millones de par\u00e1metros, lo que les permite procesar informaci\u00f3n con mayor precisi\u00f3n y generar resultados m\u00e1s complejos.<br>&#8211; <strong>Mejora en la generaci\u00f3n de texto creativo<\/strong>. Los LLMs ahora pueden escribir poemas, historias, guiones y incluso c\u00f3digo con un nivel de calidad comparable al de un humano.<br>&#8211; <strong>Desarrollo de nuevas aplicaciones.<\/strong> Se han implementado LLMs en diversos campos como la educaci\u00f3n, la atenci\u00f3n sanitaria, el servicio al cliente y el desarrollo de software, entre otros. En el \u00e1mbito educativo, por ejemplo, se utilizan LLMs para crear plataformas de aprendizaje personalizadas que se adaptan a las necesidades de cada estudiante.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En conclusi\u00f3n, en los \u00faltimos a\u00f1os han tenido lugar grandes avances en el campo de los LLMs. Estos modelos tienen el potencial de transformar la forma en que interactuamos con las computadoras y el mundo que nos rodea. No obstante, a\u00fan hay desaf\u00edos que abordar, como los sesgos, la interpretabilidad y la seguridad, para garantizar un desarrollo y uso responsable de esta tecnolog\u00eda.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">P\u00edldora en v\u00eddeo del art\u00edculo<\/h2>\n\n\n\n<figure class=\"wp-block-video aligncenter\"><video height=\"1080\" style=\"aspect-ratio: 1920 \/ 1080;\" width=\"1920\" controls src=\"https:\/\/mancomun.gal\/wp-content\/uploads\/2024\/02\/Proxectos-libres-de-IA-\u2013-A-evolucion-dos-LLMs.mp4\"><\/video><\/figure>\n","protected":false},"featured_media":43822,"template":"","categories":[46],"tags":[283],"area":[707],"class_list":["post-43823","ficha","type-ficha","status-publish","has-post-thumbnail","hentry","category-empresa-es","tag-ia-es","area-pildoras-es"],"acf":[],"_links":{"self":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/ficha\/43823","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/ficha"}],"about":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/types\/ficha"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/media\/43822"}],"wp:attachment":[{"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/media?parent=43823"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/categories?post=43823"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/tags?post=43823"},{"taxonomy":"area","embeddable":true,"href":"https:\/\/mancomun.gal\/es\/wp-json\/wp\/v2\/area?post=43823"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}