En la carrera por liderar el desarrollo de la inteligencia artificial, el ritmo se ha convertido en una sucesión de movimientos encadenados. El 12 de noviembre llegaba GPT-5.1, una actualización orientada a pulir la experiencia y mantener satisfechos a los usuarios. Apenas unos días más tarde, el 18 de noviembre, Google respondía con Gemini 3, una evolución de su modelo estrella que dejó muy buenas sensaciones entre quienes empezaron a probarlo.
A raíz de ese lanzamiento comenzaron a circular rumores: la startup dirigida por Sam Altman habría activado un supuesto “código rojo” al ver cómo su rival directo tomaba ventaja. Y este parece ser el primer resultado de ese movimiento interno. No ha pasado ni un mes desde la anterior actualización de su modelo insignia y ya está aquí GPT-5.2. La promesa aquí es resolver algunos problemas conocidos, disminuir la latencia y ganar en razonamiento.
Una evolución dentro de la serie 5. GPT-5.2 aparece como una versión diseñada para impulsar el trabajo del conocimiento, con avances en codificación, visión, análisis documental y proyectos de varios pasos. OpenAI lo incorpora como la evolución directa de GPT-5.1, no como un salto generacional. De acuerdo con la empresa, la actualización mejora la gestión de contextos largos, reduce errores y aumenta la capacidad de coordinar herramientas.
Capas de uso más diferenciadas. Las tres variantes habituales quedan algo más diferenciadas en su uso, no por funciones nuevas, sino por la forma en que integran las mejoras anunciadas por OpenAI. Thinking absorbe gran parte del avance en razonamiento, manejo de documentos extensos y coordinación de herramientas. Pro eleva el listón en tareas especializadas, sobre todo en código y cálculos técnicos. Instant, por su parte, se beneficia de explicaciones más estables y de una reducción de errores. El resultado es una separación más clara entre tareas cotidianas, trabajos complejos y necesidades expertas.
Una mejora visible en múltiples evaluaciones. OpenAI presenta cifras que muestran a GPT-5.2 por encima de GPT-5.1 en ámbitos muy distintos, desde razonamiento científico hasta programación y tareas de conocimiento. En GDPval, la evaluación que mide trabajos bien especificados en 44 ocupaciones, el modelo alcanza un 70,9% de victorias o empates frente a profesionales humanos. En GPQA Diamond sube hasta el 92,4% y en AIME 2025 logra un 100%. La tendencia se repite en pruebas técnicas como FrontierMath o ARC-AGI, donde el rendimiento también se incrementa respecto a la versión anterior.







