Latam-GPT: América Latina lanza su primera gran inteligencia artificial con identidad propia

Presentado junto al presidente Gabriel Boric, impulsa la soberanía tecnológica regional con un modelo abierto, colaborativo y ético que articula academia, sector público y privado para investigación e innovación, posicionando a América Latina y el Caribe como desarrolladores de IA.
América Latina lanza Latam-GPT primer modelo de lenguaje abierto con identidad regional.
América Latina lanza Latam-GPT primer modelo de lenguaje abierto con identidad regional.

Este martes 10 de febrero se lanzó Latam-GPT, el primer Gran Modelo de Lenguaje abierto de la región, diseñado con identidad propia desde y para América Latina y el Caribe, y que es fruto de un trabajo coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) en colaboración con diversas entidades regionales.

Latam-GPT representa un avance relevante para la región al proponer un modelo de Inteligencia Artificial (IA) construido con idiomas, datos y contextos propios de América Latina y el Caribe, desarrollado por talento regional para la región.

Qué es Latam-GPT

A diferencia de los modelos entrenados principalmente con información en inglés y marcos culturales del Norte Global, Latam-GPT comprende los matices culturales, lingüísticos y los contextos históricos y políticos latinoamericanos.

El Presidente Gabriel Boric destacó el valor cultural y estratégico de la inteligencia artificial, subrayando que Latam-GPT permitirá proyectar la identidad latinoamericana en el desarrollo tecnológico.
El Presidente Gabriel Boric destacó el valor cultural y estratégico de la inteligencia artificial, subrayando que Latam-GPT permitirá proyectar la identidad latinoamericana en el desarrollo tecnológico.

Este modelo, desarrollado por investigadores, científicos y profesionales de la región, posiciona a América Latina no solo como usuaria de tecnología de vanguardia, sino como protagonista en su creación, fortaleciendo la capacidad regional para innovar con identidad propia.

Latam-GPT explicado: el modelo de IA abierto creado desde y para América Latina y el Caribe

El desarrollo del primer Gran Modelo de Lenguaje abierto de la región fue liderado por el Centro Nacional de Inteligencia Artificial con la colaboración del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, el Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el centro tecnológico Data Observatory, además de la colaboración de diversos Estados de la región y alianzas desde la academia, organismos internacionales, y líderes tecnológicos.

El hito tecnológico contó con la presencia del Presidente de la República, Gabriel Boric; el ministro de Ciencia, Aldo Valle; el director CENIA, Álvaro Soto; el Especialista Principal de Ciudades Inteligentes y Desarrollo Digital  del Banco de Desarrollo de América Latina y el Caribe, Marcelo Facchina; el líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina, Rafael Mattje; y el director ejecutivo del Data Observatory, Rodrigo Roa. Al evento asistieron también destacadas autoridades nacionales y regionales, miembros del cuerpo diplomático y diversos representantes del ecosistema tecnológico latinoamericano.

A diferencia de las soluciones comerciales cerradas, Latam-GPT fue concebido como un bien público orientado a democratizar el acceso a esta tecnología y habilitar su uso en ámbitos estratégicos como educación, gestión pública e innovación productiva. Ello, gracias a su diseño de código abierto, que permitiría a universidades, gobiernos, startups y diversas comunidades, desarrollar soluciones propias sobre una base común, transparente y trazable.

Rafael Mattje, líder de Tecnología de Amazon Web Services (AWS) para el Cono Sur, destacó que la colaboración regional y el uso de infraestructura en la nube permitieron optimizar el entrenamiento de Latam-GPT, reduciendo los tiempos de procesamiento en un 64%.
Rafael Mattje, líder de Tecnología de Amazon Web Services (AWS) para el Cono Sur, destacó que la colaboración regional y el uso de infraestructura en la nube permitieron optimizar el entrenamiento de Latam-GPT, reduciendo los tiempos de procesamiento en un 64%.

Quiénes pueden usar Latam-GPT y para qué aplicaciones fue concebido

Con un tono más político y estratégico, el presidente Gabriel Boric puso el foco en el impacto cultural de la inteligencia artificial y en la necesidad de asumirla como una oportunidad. “Hoy el lenguaje está profundamente determinado por la IA, y no debemos verla sólo como una amenaza, sino como una herramienta para proyectar nuestra identidad”, señaló, al destacar el potencial de LATAM-GPT para comprender los contextos regionales con mayor precisión que los modelos desarrollados fuera de la región.

En la misma línea, el director de CENIA, Álvaro Soto, subrayó que la iniciativa marca un punto de inflexión: “Latam-GPT permite que América Latina se suba a la revolución de la IA como actor, desarrollando tecnología propia y demostrando lo que es posible cuando la región trabaja unida”.

Desde el plano institucional, el ministro Aldo Valle remarcó que el proyecto se sostiene en una visión de largo plazo. Según explicó, la integración regional es clave para avanzar hacia una soberanía tecnológica con sentido democrático, apoyada en una gobernanza público-privada y en políticas e inversiones concretas en supercómputo, formación y modernización del Estado. En ese marco, añadió que Chile impulsa una infraestructura “al servicio de nuestras lenguas, valores y tradiciones”, pensada como herramienta de innovación y mejora de la calidad de vida.

Latam-GPT fue concebido como un bien público digital de código abierto, orientado a democratizar el acceso a la inteligencia artificial en educación, gestión pública e innovación productiva.
Latam-GPT fue concebido como un bien público digital de código abierto, orientado a democratizar el acceso a la inteligencia artificial en educación, gestión pública e innovación productiva.

El aporte del sector tecnológico también fue central. Rafael Mattje, líder de Tecnología de AWS para el Cono Sur, afirmó que LATAM-GPT evidencia cómo la colaboración regional, respaldada por infraestructura de nube e inteligencia artificial, puede traducirse en impacto real. Detalló que la compañía participó en el entrenamiento del modelo, optimizando la infraestructura y reduciendo los tiempos en un 64%, y consideró que la iniciativa sienta un marco replicable para que gobiernos, universidades y empresas desarrollen soluciones alineadas con los contextos culturales y lingüísticos de América Latina.

Desde una mirada regional, el presidente ejecutivo de CAF, Sergio Díaz-Granados, advirtió que América Latina necesita construir capacidades propias en IA para integrarse plenamente a la transformación digital global. En ese sentido, definió a Latam-GPT como un paso concreto hacia la soberanía tecnológica y cultural, y como una oportunidad para posicionar a la región como actor activo en la economía digital.

Por su parte, Rodrigo Roa, director ejecutivo de Data Observatory, destacó el carácter estratégico del desarrollo al afirmar que el proyecto “marca un hito en la soberanía digital de América Latina”. Según precisó, la organización aportó infraestructura en la nube, capacidad de procesamiento de datos y la experiencia técnica necesaria para operar la tecnología con eficiencia.

El director ejecutivo del Data Observatory, Rodrigo Roa, destacó el aporte en infraestructura y procesamiento de datos para el entrenamiento del modelo.

Idiomas y datos locales

La construcción de Latam-GPT responde a una brecha histórica en el desarrollo de modelos de lenguaje a nivel global, ya que, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan -respectivamente- apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.

Esta subrepresentación implicó que las realidades latinoamericanas no fueran consideradas de manera adecuada ni en el diseño ni en el entrenamiento inicial de gran parte de los modelos disponibles hoy, quedando incorporadas, en muchos casos, a través de ajustes posteriores y mecanismos de corrección, y no como parte constitutiva de su arquitectura.

Frente a este escenario, Latam-GPT fue entrenado desde su origen para comprender las variantes del español y el portugués, así como las historias, memorias e identidades culturales de la región. Esto permitió procesar, generar y analizar idiomas de manera situada y contextualizada, con potencial aplicación en investigación, gestión pública y desarrollo tecnológico.

El modelo representa un avance hacia una mayor autonomía tecnológica y cultural en el desarrollo de inteligencia artificial.
El modelo representa un avance hacia una mayor autonomía tecnológica y cultural en el desarrollo de inteligencia artificial.

Una colaboración regional sin precedentes liderada por talento latinoamericano

Para llegar a la creación de un modelo 1.0 de Latam-GPT, el proceso consideró la recolección y curaduría de datos, además de un periodo de pre-training y post-training.

Cabe mencionar que el modelo se desarrolló sobre una arquitectura base Llama 3.1 – 70 mil millones de parámetros, complementada con un corpus regional -un conjunto organizado de textos y contenidos con los que se entrena un modelo de lenguaje y que le permite comprender el contexto cultural e identitario de la región- obtenido bajo permisos. Ello, además de benchmarks adaptados al contexto latinoamericano y una documentación rigurosa en materia ética y de gobernanza.

La construcción de Latam-GPT fue posible gracias a una colaboración inédita entre instituciones públicas, académicas y tecnológicas de la región, articulando a más de 100 profesionales y más de 60 instituciones de 15 países, que aportaron datos, conocimiento y experiencia técnica.

En este esfuerzo regional, el CENIA y el Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, desempeñaron un rol clave al coordinar puntos focales en los países participantes, lo que permitió canalizar la búsqueda, selección y aporte de datasets representativos de la región.

A diferencia de los modelos comerciales cerrados, Latam-GPT fue concebido como un bien público digital de código abierto.
A diferencia de los modelos comerciales cerrados, Latam-GPT fue concebido como un bien público digital de código abierto.

En total, se reunieron más de 300 mil millones de tokens de texto plano, equivalentes a alrededor de 230 mil millones de palabras, obtenidos bajo permisos y licencias explícitas, curados de tal manera de asegurar la anonimización de datos y eliminar elementos tóxicos (como noticias falsas o discriminación, por ejemplo).

Gracias a ese proceso, el modelo cuenta con un dataset de alta calidad en áreas como humanidades y ciencias sociales, educación, ciencias de la salud, políticas públicas, economía, medioambiente, artes y pueblos indígenas.

Impulso a la innovación

Latam-GPT nace con una convicción estratégica: poner la Inteligencia Artificial al servicio de las personas, propósito que requiere dominar la tecnología, comprender sus impactos y definir reglas claras para un diseño responsable.

Uno de los objetivos centrales del proyecto es fortalecer las capacidades técnicas de América Latina para liderar sus propios procesos de innovación.

La iniciativa podría contribuir a mejorar la productividad de hasta el 50% de la fuerza laboral latinoamericana.
La iniciativa podría contribuir a mejorar la productividad de hasta el 50% de la fuerza laboral latinoamericana.

Para el director de CENIA, “Latam-GPT no es un fin en sí mismo, sino una base tecnológica abierta que permite desarrollar modelos derivados y aplicaciones adaptadas a distintos contextos regionales, apoyadas por herramientas y materiales que facilitan su uso y evolución. De este modo, la región no es solo usuaria de IA, sino que puede crear soluciones propias a partir de capacidades compartidas”.

Con un impacto proyectado que podría mejorar la productividad de hasta el 50% de la fuerza laboral latinoamericana, Latam-GPT queda a disposición de gobiernos, universidades y emprendedores como una plataforma abierta para el desarrollo de soluciones éticas, transparentes y alineadas con las necesidades de la región.

El éxito del proyecto posiciona a Chile y a América Latina como referentes globales en el desarrollo de una Inteligencia Artificial abierta, colaborativa y con identidad propia.

Leer más

Publicaciones Relacionadas

Scroll to Top