En el universo de la inteligencia artificial generativa, donde cada palabra puede marcar la diferencia, una idea tan simple como repetir un pedido podría cambiar la calidad de las respuestas. Así lo sugiere un reciente estudio de Google Research, que plantea una mejora práctica, de bajo costo y fácil implementación para usuarios y empresas.
Lejos de las complejas técnicas de optimización o del diseño avanzado de prompts, la propuesta es casi contraintuitiva: duplicar la instrucción dentro del mismo mensaje. Es decir, decir lo mismo dos veces.
Un hallazgo simple con impacto potencial
El trabajo, titulado “Prompt Repetition Improves Non-Reasoning LLMs” y publicado en arXiv, parte de una premisa técnica clara: los modelos de lenguaje procesan el texto de manera secuencial, por lo que el orden y la repetición de los tokens influyen en cómo interpretan la información.
Según los autores, repetir el prompt hace que cada parte clave del pedido reaparezca en el contexto, lo que mejora la capacidad del modelo para “entender” y utilizar correctamente esa información. El resultado: respuestas más precisas en determinados escenarios.
Llevado al uso cotidiano, el truco es extremadamente sencillo. En lugar de escribir una instrucción una sola vez, el usuario puede incluirla dos veces seguidas dentro del mismo mensaje. Por ejemplo:
- En lugar de: “Resumí este texto en cinco líneas.”
- Probar con: “Resumí este texto en cinco líneas. Resumí este texto en cinco líneas.”
Aunque parezca redundante, el paper sostiene que este pequeño cambio puede mejorar el rendimiento sin alterar el formato de salida ni requerir modificaciones en el sistema.
Cómo probarlo en un chat de IA
El método no requiere conocimientos técnicos ni herramientas adicionales. Cualquier usuario puede experimentarlo en plataformas basadas en modelos de lenguaje.
La recomendación es simple: si una respuesta resulta poco precisa o incompleta, repetir exactamente el mismo pedido dentro del mensaje puede ayudar a mejorar el resultado.
Este enfoque es especialmente útil en tareas donde la claridad y la estructura son clave. Entre los casos más favorables se encuentran:
- Preguntas concretas
- Tareas de extracción de información
- Respuestas breves y estructuradas
- Modelos sin razonamiento extendido o con esta función desactivada
En estos escenarios, la repetición parece reforzar la instrucción y guiar mejor al modelo hacia el objetivo.
Cuándo funciona y cuándo no
Como toda técnica, este truco tiene límites claros. El propio estudio advierte que no se trata de una solución universal.
Por ejemplo, no se esperan grandes mejoras en:
- Tareas complejas que requieren razonamiento extendido
- Prompts demasiado largos
- Casos donde el problema es una consigna mal formulada
En particular, cuando los modelos utilizan capacidades de razonamiento avanzado —como cadenas de pensamiento—, el efecto de la repetición tiende a ser neutral o apenas positivo.
Esto sugiere que el beneficio ocurre principalmente en la etapa de interpretación del prompt, y no en el proceso posterior de generación de la respuesta.
Los modelos y pruebas detrás del estudio
El equipo de Google Research evaluó esta técnica en siete modelos de distintos proveedores, entre ellos:
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
- GPT-4o
- GPT-4o-mini
- Claude 3 Haiku
- Claude 3.7 Sonnet
- DeepSeek V3
Las pruebas se realizaron entre febrero y marzo de 2025 utilizando las API oficiales de cada empresa.
Además, el análisis incluyó siete benchmarks reconocidos, como ARC, OpenBookQA, GSM8K, MMLU-Pro y MATH, junto con dos pruebas personalizadas.
El resultado general fue contundente: la repetición del prompt mejoró el rendimiento en 47 de 70 combinaciones entre modelo y benchmark, sin registrar caídas significativas bajo los criterios estadísticos del estudio.
Un caso extremo que llamó la atención
Uno de los datos más llamativos aparece en una prueba personalizada llamada NameIndex. Allí, el modelo Gemini 2.0 Flash Lite pasó de un 21,33% a un 97,33% de aciertos simplemente repitiendo el prompt.
Si bien este resultado no es extrapolable a todos los casos, muestra con claridad cómo una modificación mínima en el formato puede tener un impacto drástico en el desempeño.
Bajo costo, alta eficiencia
Uno de los aspectos más atractivos de esta técnica es su eficiencia. A diferencia de otras estrategias, como pedirle al modelo que “piense paso a paso”, la repetición del prompt no implica necesariamente:
- Más tokens generados
- Mayor tiempo de respuesta (en la mayoría de los casos)
- Cambios en la experiencia del usuario
Esto la convierte en una opción especialmente interesante para aplicaciones en producción, como asistentes virtuales, buscadores o sistemas de atención al cliente, donde cada milisegundo y cada costo computacional importan.
La principal excepción detectada aparece en modelos de Anthropic con prompts muy largos, donde sí puede haber un aumento en la latencia.
Lo que el estudio no demuestra
Pese a sus resultados prometedores, el trabajo también marca límites importantes:
- No prueba que repetir un prompt mejore siempre la respuesta
- No garantiza el mismo efecto en todos los modelos
- No reemplaza la necesidad de un buen prompt
- Aún no fue revisado por pares (es un preprint)
Estos puntos son clave para evitar interpretaciones exageradas del hallazgo.
Más allá del truco: cómo hablamos con la IA
Más allá de la técnica puntual, el estudio refuerza una idea central en la era de la inteligencia artificial generativa: no solo importa qué se pregunta, sino cómo se pregunta.
Incluso en sistemas cada vez más sofisticados, pequeños cambios en la forma de presentar la información pueden tener un impacto significativo en la calidad de las respuestas.
En ese contexto, la repetición del prompt aparece como una herramienta más dentro del repertorio de estrategias de interacción con IA. No es mágica ni infalible, pero sí lo suficientemente simple como para probarla.
Y quizás ese sea su mayor valor: demostrar que, en un campo dominado por avances complejos, a veces las mejoras más interesantes empiezan con un gesto mínimo.
Leer más
- Ciberdefensa, inteligencia artificial y riesgo cuántico: una agenda estratégica para la Argentina
- Robots médicos y asistentes virtuales: así cambia la atención sanitaria con inteligencia artificial
- Qué es la API de Qwen y cómo integrarla en tus proyectos de inteligencia artificial