La Unión Europea tendrá su propio ChatGPT. Un grupo de instituciones y empresas europeas ha empezado a desarrollar su propio modelo de lenguaje, OpenEuroLLM, con el objetivo de lanzar la primera versión a mediados de 2026. Será de código abierto y multilingüe para cubrir todos los idiomas del espacio comunitario. El proyecto está financiado con fondos europeos y cuenta con un presupuesto de 37,4 millones de euros.
El proyecto acaba de arrancar con el fin de desarrollar un ChatGPT comunitario, ha anunciado la Comisión Europea. Un total de 20 organizaciones forman parte del proyecto, entre ellas, universidades y centros de investigación, empresas y centros de computación. Dos entidades españolas trabajan en el modelo de lenguaje, la firma Prompsit y el Centro Nacional de Supercomputación (CNS), que está en Barcelona.
La creación de este modelo de lenguaje europeo ha empezado este mismo mes de febrero y el proyecto durará tres años. Los responsables de la iniciativa han especificado que la intención es lanzar la primera versión a mediados de 2026 y otra al finalizar el periodo de vida de la iniciativa, en 2028. “Dada la velocidad a la que los modelos están saliendo al mercado, nos vamos a esforzar para acelerar los tiempos todo lo posible”, apuntan desde OpenEuroLLM.
La iniciativa europea tiene dos ventajas claras. Por un lado, será de código abierto, lo que implica que cualquier individuo o empresa puede usarlo y ejecutarlo para sus propios fines. “[El código] puede ser refinado y personalizado para las necesidades específicas de cada industria y del sector público”, detalla la iniciativa. Es decir, Europa proporcionará la herramienta inicial para que las empresas, la administración y los individuos puedan ofrecer sus versiones adaptadas a sus negocios o servicios.
Los datos para entrenar el modelo se obtendrán de dos firmas que generan colecciones de datos específicas para entrenar inteligencia artificial (IA), High Performance Language Technologies (HPLT) y de CoommonCrawl. Además, se espera que se vayan añadiendo otras fuentes y que se enriquezca la base de datos, especialmente para perfeccionar los idiomas en los que los recursos disponibles son más escasos.
Por otra parte, OpenEuroLLM será nativo en todas las lenguas europeas, algo que no ofrece el modelo de lenguaje líder en el mercado, el de OpenAI. Este presenta un nivel avanzado en español, portugués, francés y alemán, pero su fluidez merma si se trata del italiano, el polaco, el sueco y el resto de los idiomas del grupo. Además, la intención del modelo europeo es poder preservar la lingüística, los matices y la diversidad de cada lengua.
Es cierto que la iniciativa europea arranca varios años después de cuando empezaron las empresas que ahora lideran el mercado. Las grandes tecnológicas de Estados Unidos llevan años trabajando en sus modelos de lenguaje y OpenAI fue fundada en 2015. Queda por ver si OpenEuroLLM será capaz de competir en este ámbito y un aspecto clave será su calidad. Aunque puede no llegar a equipararse a sus rivales, sí podría ser una solución para empresas e instituciones que quieran usar un modelo de lenguaje para tareas sencillas y limitadas. Otro aspecto positivo es que podrá integrarse en la administración pública.
De momento, el proyecto está financiado con fondos europeos y su presupuesto es de 37,5 millones de euros. La partida es pequeña, ya que desarrollar y entrenar los modelos de lenguaje es una tarea compleja y costosa, que requiere de capacidad de computación y recursos energéticos. Los líderes del mercado invierten miles de millones en desarrollar sus modelos.
Esta iniciativa no está abierta a la inversión privada, salvo la que proceda de los socios y participantes del proyecto, detallan sus responsables a este medio. Sin embargo, cualquier entidad involucrada puede crear un grupo o una firma que busque capital. Es decir, la financiación tiene que proceder de los integrantes de la organización.
“Los modelos de código abierto democratizarán el acceso a las tecnologías de inteligencia artificial (IA) y reforzarán la capacidad de las empresas europeas de competir en un mercado global. Permitirán a las organizaciones públicas producir y ofrecer servicios de calidad”, apunta el comunicado de OpenEuroLLM.