GPT 5.4 Pro sorprende a los matemáticos resolviendo el problema #1196 de Erdős

En los últimos meses hemos leído muchos titulares sobre modelos de IA resolviendo problemas matemáticos abiertos. Incluso han obtenido resultados olímpicos. No es la primera vez que resuelven un problema de Erdős pero lo que ha pasado recientemente con el problema #1196 tiene un matiz distinto. No es solo que se haya resuelto otro problema abierto, sino que varios matemáticos importantes -gente que trabaja activamente en ese área- están señalando que aquí hay algo más: una solución sorprendentemente elegante, con ideas que parecen nuevas y potencial para ir más allá del problema concreto.

Según el foro de los problemas de Erdős, Liam Price consiguió que GPT 5.4 Pro generara la solución para el problema #1196 en solo 80 minutos, one shot. Después la preparó como un documento formal en LaTeX en solo 30 minutos adicionales. Si esto se confirma del todo la corrección (comentaré más adelante que aún no está formalmente aceptado aunque se da por buena), podría ser uno de los primeros casos en los que una IA no solo da el resultado, sino que lo hace de una forma que recuerda a lo que en matemáticas se considera creatividad.

Qué son los problemas de Erdős

Paul Erdős fue uno de los matemáticos más prolíficos del siglo XX. Entre otras cosas, tenía la costumbre de formular problemas: algunos profundos, otros más técnicos, algunos casi recreativos. Con el tiempo, muchos de esos problemas se recopilaron en listas que hoy funcionan como un banco de pruebas bastante representativo de distintas áreas de la matemática, sobre todo combinatoria y teoría de números.

Resolver un problema de Erdős tiene prestigio, pero hay que matizar: no todos los problemas de Erdős son igual de importantes. Algunos son relativamente fáciles pero periféricos; otros son centrales y están conectados con teorías amplias. Además, en el contexto de la IA hay otro matiz importante: en algunos casos anteriores, la “solución” consistía esencialmente en reformular o recombinar resultados ya conocidos, sin aportar una idea verdaderamente nueva. Por eso, cada vez que aparece un nuevo problema de Erdős resuelto por IA, tenemos que ver la dificultad de este problema, su relevancia y la manera en la que ha sido resuelto.

El problema #1196

El problema #1196, atribuido a Erdős junto con Sárközy y Szemerédi (finales de los años 60), está en el ámbito de la teoría de números multiplicativa y, más concretamente, en el estudio de conjuntos primitivos. Si no te interesa el detalle del problema, pasa al siguiente apartado.

Una forma razonable de explicar el enunciado es la siguiente. Un conjunto $A$ de enteros mayores que 1 se llama primitivo si ningún elemento del conjunto divide a otro. Los ejemplos más obvios son los números primos: si $p$ y $q$ son primos distintos, ninguno divide al otro. Pero también hay conjuntos primitivos mucho menos triviales, formados por números compuestos. Erdős había demostrado ya en 1935 que, para cualquier conjunto primitivo $A$ , la serie $\sum_{a\in A} \frac{1}{a\log a}$ siempre converge; es decir, por muy “grande” o “denso” que uno intente hacer un conjunto primitivo, esa suma no puede dispararse arbitrariamente.

Más tarde, la teoría de conjuntos primitivos llevó a otra pregunta más fina: no ya cuánto puede valer esa suma en total, sino qué ocurre si obligamos a que todos los elementos del conjunto sean grandes, por ejemplo mayores que un umbral $x$ .

Ahí entra exactamente el problema #1196. La conjetura de Erdős, Sárközy y Szemerédi pregunta si, para cualquier $x$ , todo conjunto primitivo $A \subset [x,\infty)$ satisface:

\sum_{a\in A} \frac{1}{a\log a} \le 1 + o(1) \quad \text{cuando } x \to \infty.

Dicho de forma menos técnica: si descartamos todos los números pequeños y miramos solo la “cola” del conjunto, ¿es cierto que el peso total que puede concentrar cualquier conjunto primitivo está esencialmente acotado por 1? Ese 1 no aparece por casualidad: es el valor natural que da, asintóticamente, el ejemplo más simple posible, el conjunto de los números primos mayores que $x$ . En otras palabras, la conjetura dice que, en esa escala, ni siquiera los conjuntos primitivos más ingeniosos pueden superar de verdad al ejemplo básico de los primos.

La solución atribuida a GPT-5.4 Pro demuestra una versión incluso un poco más fuerte:

\sum_{\substack{a\in A \ a > x}} \frac{1}{a\log a} \le 1 + O!\left(\frac{1}{\log x}\right),

que implica precisamente la conjetura buscada.

Lo que dicen los expertos

Paul Erdos had a concept of "Proofs from The Book", meaning that the argument is so compact and elegant that this is the proof God would've written down in "The Book."

After reading the GPT5.4 proof of Erdos #1196, I would say this is a Book Proof of the result. The conjecture… https://t.co/rUav1FcU28
— Jared Duker Lichtman (@jdlichtman) April 15, 2026

Este es el mensaje que ha puesto en X Jared Duker Lichtman, profesor en Stanford y especialista en este tipo de problemas. Lichtman no es un cualquiera: lleva años trabajando en este tipo de problemas. En su doctorado, demostró la Conjetura de Conjuntos Primitivos de Erdős. Lo intentó con el problema #1196 y consiguió acercarse con una cota, aunque no fue capaz de resolverlo. Ahora se encuentra impresionado por la solución de GPT 5.4 Pro.

La demostración generada por la IA le parece una “demostración de libro”. Un argumento compacto y elegante. La demostración encontrada es sorprendentemente corta (del orden de pocas páginas) y utiliza una construcción ingeniosa que condensa mucha complejidad.

En el foro de los problemas de Erdős tenemos también un comentario de Terence Tao, probablemente el matemático vivo más influyente. Tao no se limita a decir que la demostración es correcta o elegante, señala que introduce o pone de relieve una conexión más estrecha entre dos mundos que no estaban tan claramente unidos en la literatura previa: la anatomía de los enteros (cómo se descomponen en factores primos), y ciertos procesos de Markov.

Paul Erdős con Terence Tao cuando este tenía 10 años

En matemáticas, resolver un problema es valioso, pero identificar una estructura o una herramienta nueva lo es aún más, porque puede aplicarse en otros contextos. Tao, de hecho, va más allá y empieza a formular cómo esa idea podría desarrollarse en términos de medidas invariantes y procesos asociados. Es decir, no está simplemente validando la demostración: está haciendo matemáticas nuevas a partir de ella.

Esto conecta con la intuición de Lichtman. La sensación que transmiten ambos es que aquí no estamos ante una solución larga y técnica que empuja resultados conocidos hasta el final, sino ante una idea conceptual limpia, de esas que, una vez vistas, parecen obvias en retrospectiva.

¿De verdad era un problema difícil?

Sí, no parece un caso del tipo “nadie lo había resuelto porque no era importante”. Hay varios indicios sólidos.

El problema se formuló en los años 60 y ha sobrevivido décadas sin resolverse. Matemáticos activos en el área habían trabajado en él y en problemas relacionados. Se habían obtenido resultados parciales relativamente sofisticados (con cotas cercanas como la de Lichtman, pero no óptimas). Expertos relevantes estaban al tanto del problema y lo discutían. El propio Lichtman ha dicho explícitamente que no era un problema de baja visibilidad.

Como es habitual en matemáticas, la dificultad no siempre se traduce en una demostración larga. A veces lo que falta es la idea adecuada. Y cuando aparece, la solución puede comprimirse mucho. Esa es precisamente la razón por la que la comunidad está prestando atención a este caso.

Algo de precaución

Dicho todo lo anterior, conviene ser cautos. A día de hoy, la demostración no está completamente formalizada ni publicada en una revista con revisión por pares. Lo que hay es una aceptación bastante amplia a nivel informal entre expertos que la han revisado, con ausencia, hasta donde se sabe, de errores detectados en las partes clave. Hay ya intentos en curso de formalización pero aún incompletos.

Esto es un estado intermedio bastante típico en matemáticas, una demostración puede ser considerada correcta por la comunidad antes de que exista una verificación formal completa. Pero también es cierto que, hasta que no se recorren todos los detalles con lupa siempre cabe la posibilidad de que haya algún error sutil. Así que la posición razonable es de alta confianza, pero no certeza absoluta todavía.

Por otra parte, aunque estamos hablando de una diferencia notable entre esta y otras demostraciones anteriores de otros problemas de Erdős resueltos por inteligencias artificiales, conviene comentar algunos otros ejemplos.

El problema #1148, por ejemplo, que era también un problema difícil fue resuelto de forma relativamente directa a partir de resultados profundos ya existentes. Es un logro legítimo, pero conceptualmente menos llamativo: la novedad está más en la conexión que en la idea central.

El #1202, por otro lado, sí tenía peso dentro de la combinatoria aditiva (aparecía en listas influyentes de problemas abiertos). Su resolución es relevante, pero no ha generado el mismo tipo de reacción en cuanto a “elegancia inesperada” o nuevas conexiones estructurales, porque la demostración no era tan limpia ni introducía una idea claramente nueva.

GPT 5.4 pro ha encontrado una construcción que expertos humanos no habían articulado así en décadas de trabajo, y que además encaja bien con los criterios estéticos internos de las matemáticas (brevedad, inevitabilidad, capacidad de generalización). Falta ver si, con el tiempo, esta impresión se consolida. Pero si lo hace, este episodio podría marcar un cambio cualitativo, pasar de ver a la IA como una herramienta que explora combinaciones a verla como algo que -por ahora ocasionalmente- da con ideas que los humanos reconocen como matemáticamente profundas.

Volviendo al tuit de Lichtman, compara esta demostración con “encontrar una nueva línea de apertura en ajedrez, que es potente pero contraintuitiva”. No puedo evitar pensar en si estamos ante un momento disruptivo como el que vivimos con AlphaGo y su famoso movimiento 37.

Dos errores en ‘Maniac’ de Labatut. Turing y Stockfish.

Qué son los problemas de Erdős

El problema #1196

Lo que dicen los expertos

¿De verdad era un problema difícil?

Algo de precaución

Iñaki Ortiz Gascón