Este martes 10 de febrero se lanzó Latam-GPT, el primer Gran Modelo de Lenguaje abierto de la región, diseñado con identidad propia desde y para América Latina y el Caribe, y que es fruto de un trabajo coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) en colaboración con diversas entidades regionales.
Latam-GPT representa un avance relevante para la región al proponer un modelo de Inteligencia Artificial (IA) construido con idiomas, datos y contextos propios de América Latina y el Caribe, desarrollado por talento regional para la región.
Qué es Latam-GPT
A diferencia de los modelos entrenados principalmente con información en inglés y marcos culturales del Norte Global, Latam-GPT comprende los matices culturales, lingüísticos y los contextos históricos y políticos latinoamericanos.

Este modelo, desarrollado por investigadores, científicos y profesionales de la región, posiciona a América Latina no solo como usuaria de tecnología de vanguardia, sino como protagonista en su creación, fortaleciendo la capacidad regional para innovar con identidad propia.
Latam-GPT explicado: el modelo de IA abierto creado desde y para América Latina y el Caribe
El desarrollo del primer Gran Modelo de Lenguaje abierto de la región fue liderado por el Centro Nacional de Inteligencia Artificial con la colaboración del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, el Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el centro tecnológico Data Observatory, además de la colaboración de diversos Estados de la región y alianzas desde la academia, organismos internacionales, y líderes tecnológicos.
El hito tecnológico contó con la presencia del Presidente de la República, Gabriel Boric; el ministro de Ciencia, Aldo Valle; el director CENIA, Álvaro Soto; el Especialista Principal de Ciudades Inteligentes y Desarrollo Digital del Banco de Desarrollo de América Latina y el Caribe, Marcelo Facchina; el líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina, Rafael Mattje; y el director ejecutivo del Data Observatory, Rodrigo Roa. Al evento asistieron también destacadas autoridades nacionales y regionales, miembros del cuerpo diplomático y diversos representantes del ecosistema tecnológico latinoamericano.
A diferencia de las soluciones comerciales cerradas, Latam-GPT fue concebido como un bien público orientado a democratizar el acceso a esta tecnología y habilitar su uso en ámbitos estratégicos como educación, gestión pública e innovación productiva. Ello, gracias a su diseño de código abierto, que permitiría a universidades, gobiernos, startups y diversas comunidades, desarrollar soluciones propias sobre una base común, transparente y trazable.

Quiénes pueden usar Latam-GPT y para qué aplicaciones fue concebido
Con un tono más político y estratégico, el presidente Gabriel Boric puso el foco en el impacto cultural de la inteligencia artificial y en la necesidad de asumirla como una oportunidad. “Hoy el lenguaje está profundamente determinado por la IA, y no debemos verla sólo como una amenaza, sino como una herramienta para proyectar nuestra identidad”, señaló, al destacar el potencial de LATAM-GPT para comprender los contextos regionales con mayor precisión que los modelos desarrollados fuera de la región.
En la misma línea, el director de CENIA, Álvaro Soto, subrayó que la iniciativa marca un punto de inflexión: “Latam-GPT permite que América Latina se suba a la revolución de la IA como actor, desarrollando tecnología propia y demostrando lo que es posible cuando la región trabaja unida”.
Desde el plano institucional, el ministro Aldo Valle remarcó que el proyecto se sostiene en una visión de largo plazo. Según explicó, la integración regional es clave para avanzar hacia una soberanía tecnológica con sentido democrático, apoyada en una gobernanza público-privada y en políticas e inversiones concretas en supercómputo, formación y modernización del Estado. En ese marco, añadió que Chile impulsa una infraestructura “al servicio de nuestras lenguas, valores y tradiciones”, pensada como herramienta de innovación y mejora de la calidad de vida.

El aporte del sector tecnológico también fue central. Rafael Mattje, líder de Tecnología de AWS para el Cono Sur, afirmó que LATAM-GPT evidencia cómo la colaboración regional, respaldada por infraestructura de nube e inteligencia artificial, puede traducirse en impacto real. Detalló que la compañía participó en el entrenamiento del modelo, optimizando la infraestructura y reduciendo los tiempos en un 64%, y consideró que la iniciativa sienta un marco replicable para que gobiernos, universidades y empresas desarrollen soluciones alineadas con los contextos culturales y lingüísticos de América Latina.
Desde una mirada regional, el presidente ejecutivo de CAF, Sergio Díaz-Granados, advirtió que América Latina necesita construir capacidades propias en IA para integrarse plenamente a la transformación digital global. En ese sentido, definió a Latam-GPT como un paso concreto hacia la soberanía tecnológica y cultural, y como una oportunidad para posicionar a la región como actor activo en la economía digital.
Por su parte, Rodrigo Roa, director ejecutivo de Data Observatory, destacó el carácter estratégico del desarrollo al afirmar que el proyecto “marca un hito en la soberanía digital de América Latina”. Según precisó, la organización aportó infraestructura en la nube, capacidad de procesamiento de datos y la experiencia técnica necesaria para operar la tecnología con eficiencia.

Idiomas y datos locales
La construcción de Latam-GPT responde a una brecha histórica en el desarrollo de modelos de lenguaje a nivel global, ya que, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan -respectivamente- apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.
Esta subrepresentación implicó que las realidades latinoamericanas no fueran consideradas de manera adecuada ni en el diseño ni en el entrenamiento inicial de gran parte de los modelos disponibles hoy, quedando incorporadas, en muchos casos, a través de ajustes posteriores y mecanismos de corrección, y no como parte constitutiva de su arquitectura.
Frente a este escenario, Latam-GPT fue entrenado desde su origen para comprender las variantes del español y el portugués, así como las historias, memorias e identidades culturales de la región. Esto permitió procesar, generar y analizar idiomas de manera situada y contextualizada, con potencial aplicación en investigación, gestión pública y desarrollo tecnológico.

Una colaboración regional sin precedentes liderada por talento latinoamericano
Para llegar a la creación de un modelo 1.0 de Latam-GPT, el proceso consideró la recolección y curaduría de datos, además de un periodo de pre-training y post-training.
Cabe mencionar que el modelo se desarrolló sobre una arquitectura base Llama 3.1 – 70 mil millones de parámetros, complementada con un corpus regional -un conjunto organizado de textos y contenidos con los que se entrena un modelo de lenguaje y que le permite comprender el contexto cultural e identitario de la región- obtenido bajo permisos. Ello, además de benchmarks adaptados al contexto latinoamericano y una documentación rigurosa en materia ética y de gobernanza.
La construcción de Latam-GPT fue posible gracias a una colaboración inédita entre instituciones públicas, académicas y tecnológicas de la región, articulando a más de 100 profesionales y más de 60 instituciones de 15 países, que aportaron datos, conocimiento y experiencia técnica.
En este esfuerzo regional, el CENIA y el Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, desempeñaron un rol clave al coordinar puntos focales en los países participantes, lo que permitió canalizar la búsqueda, selección y aporte de datasets representativos de la región.

En total, se reunieron más de 300 mil millones de tokens de texto plano, equivalentes a alrededor de 230 mil millones de palabras, obtenidos bajo permisos y licencias explícitas, curados de tal manera de asegurar la anonimización de datos y eliminar elementos tóxicos (como noticias falsas o discriminación, por ejemplo).
Gracias a ese proceso, el modelo cuenta con un dataset de alta calidad en áreas como humanidades y ciencias sociales, educación, ciencias de la salud, políticas públicas, economía, medioambiente, artes y pueblos indígenas.
Impulso a la innovación
Latam-GPT nace con una convicción estratégica: poner la Inteligencia Artificial al servicio de las personas, propósito que requiere dominar la tecnología, comprender sus impactos y definir reglas claras para un diseño responsable.
Uno de los objetivos centrales del proyecto es fortalecer las capacidades técnicas de América Latina para liderar sus propios procesos de innovación.

Para el director de CENIA, “Latam-GPT no es un fin en sí mismo, sino una base tecnológica abierta que permite desarrollar modelos derivados y aplicaciones adaptadas a distintos contextos regionales, apoyadas por herramientas y materiales que facilitan su uso y evolución. De este modo, la región no es solo usuaria de IA, sino que puede crear soluciones propias a partir de capacidades compartidas”.
Con un impacto proyectado que podría mejorar la productividad de hasta el 50% de la fuerza laboral latinoamericana, Latam-GPT queda a disposición de gobiernos, universidades y emprendedores como una plataforma abierta para el desarrollo de soluciones éticas, transparentes y alineadas con las necesidades de la región.
El éxito del proyecto posiciona a Chile y a América Latina como referentes globales en el desarrollo de una Inteligencia Artificial abierta, colaborativa y con identidad propia.
Leer más
- Blue Monday: el 22% de los chilenos recurre a chatbots en momentos de tristeza
- La adopción de IA avanza lento, pero las empresas chilenas ya se preparan para el salto
- OCDE y Cisco revelan brechas generacionales y regionales en la adopción de la IA y el bienestar digital









