Ir al contenido principal

Reseña de «Silicon Valley Is in a frenzy over bots that build themselves»

El artículo «Silicon Valley Is in a frenzy over bots that build themselves» analiza la creciente carrera en Silicon Valley por crear inteligencias artificiales capaces de mejorar sus propias capacidades. OpenAI, Anthropic y Google DeepMind lideran estos esfuerzos, automatizando partes significativas de su investigación interna con resultados concretos aunque todavía limitados.

Los avances actuales son incrementales: las herramientas de IA agilizan tareas concretas, pero aún dependen de la supervisión humana para fijar objetivos y ejercer el juicio creativo que los expertos llaman "gusto investigador". Las predicciones más optimistas sitúan la automatización completa entre 2028 y 2032.

El entusiasmo coexiste con una alarma creciente. Investigadores, activistas e incluso políticos como Bernie Sanders advierten sobre la pérdida del control humano, mientras los gobiernos, todavía adaptándose a internet, difícilmente podrán regular una tecnología que avanza a este ritmo.

Readings shared April 4, 2026

The readings shared in Bluesky on 4 April 2026 are:

Reseña de «DeepSeek-Prover-V2-7B bridges the gap between mathematical thought and formal code»

El artículo «DeepSeek-Prover-V2-7B bridges the gap between mathematical thought and formal code» presenta DeepSeek-Prover-V2-7B, un modelo diseñado para resolver uno de los retos más difíciles de la IA: demostrar teoremas matemáticos de forma rigurosa y verificable por ordenador mediante Lean 4.

El modelo emplea una estrategia de descomposición recursiva que divide problemas complejos en subtareas manejables. Con solo 7B parámetros, aprovecha conocimiento destilado de su versión mayor de 671B y logra puntuaciones destacadas en los bancos de pruebas miniF2F y PutnamBench.

Al ser un modelo abierto de 7B, puede ejecutarse en ordenadores personales con hardware modesto, lo que lo pone al alcance de investigadores individuales interesados en el razonamiento automático y la verificación formal con Lean 4.

Reseña de «Why Lean?»

El artículo «Why Lean?», de Leonardo de Moura, explica por qué Lean se ha convertido en una herramienta singular para verificación formal. Su característica más determinante es estar implementado en su propio lenguaje, lo que permite a cualquier programador extender el sistema desde sus entrañas sin fricciones ni capas intermedias.

Esto ha generado un ecosistema imprevisto: Mathlib supera los 200.000 teoremas escritos por la comunidad, y proyectos como Veil o Verso nacieron sin coordinación con sus creadores. Un kernel pequeño con múltiples implementaciones independientes garantiza que ninguna prueba incorrecta pase desapercibida, propiedad que Terence Tao identifica como esencial frente al aprendizaje por refuerzo.

El autor reconoce el precio de este enfoque: la compatibilidad hacia atrás se sacrifica cuando escalar lo exige, y él mismo cedió sus preferencias teóricas ante las necesidades reales de los usuarios. El resultado es un sistema menos puro, pero genuinamente útil.

Reseña de «What Gödel discovered»

El artículo «What Gödel discovered», escrito por un programador, explica cómo Russell destruyó la teoría fundacional de Frege con una paradoja y cómo Hilbert respondió exigiendo un sistema formal completo y consistente. Russell y Whitehead construyeron el Principia Mathematica como candidato, cuya densa notación el autor traduce a sintaxis Lisp para hacerla legible a desarrolladores.

Gödel ideó una codificación numérica que permitió al propio lenguaje hablar sobre sus demostraciones. El autor ilustra paso a paso, con expresiones como (proves a b) o (subst a b c), cómo Gödel construyó una sentencia que se declaraba a sí misma indemostrable, atrapando al sistema en un dilema sin salida.

Si el sistema es consistente, la sentencia es verdadera pero indemostrable, revelando su incompletitud. El autor concluye con una lectura orientada a programadores: así como Gödel creó el primer evaluador metacircular, sus teoremas prueban que existen verdades que nunca podrán expresarse como un algoritmo.

Reseña de «Type-checked compliance: Deterministic guardrails for agentic financial systems using Lean 4 theorem proving»

El artículo «Type-checked compliance: Deterministic guardrails for agentic financial systems using Lean 4 theorem proving» presenta una crisis arquitectónica en el sector financiero: los sistemas de IA agéntica operan de forma probabilística, mientras que reguladores como la SEC, FINRA y la OCC exigen garantías absolutas. Las soluciones actuales, como NeMo Guardrails, son insuficientes por su naturaleza estocástica.

Para resolverlo, los autores diseñan el Lean-Agent Protocol, que usa el modelo Aristotle para convertir políticas institucionales en axiomas de Lean 4. Cada acción propuesta por un agente debe ser demostrada matemáticamente antes de ejecutarse, con una latencia de solo cinco microsegundos y sandboxing vía WebAssembly.

El protocolo se despliega en tres fases progresivas y cubre las principales normativas financieras y de privacidad. Además, incorpora un mecanismo de explicación en lenguaje natural para auditorías, transformando errores formales en avisos comprensibles que satisfacen mandatos de transparencia algorítmica.

Reseña de «La IA acaba de hacerle una pregunta incómoda a la física teórica. Qué pasa si algunos de sus resultados más citados nunca fueron tan sólidos como parecían»

El artículo «La IA acaba de hacerle una pregunta incómoda a la física teórica. Qué pasa si algunos de sus resultados más citados nunca fueron tan sólidos como parecían» describe cómo se utilizó Lean para verificar resultados científicos. El hallazgo no fue obra de una IA generativa, sino de la formalización lógica estricta.

El sistema analizó un estudio de 2006 sobre el modelo de Higgs. Al intentar formalizarlo con Lean, se halló un contraejemplo que invalidaba la estabilidad del potencial defendida originalmente. Este fallo lógico persistió durante casi dos décadas sin que la revisión por pares humana lo detectara previamente.

Aunque los científicos corregirán el error, el caso genera inquietud sobre otros cimientos teóricos. La verdadera contribución de estas herramientas no es la invención creativa, sino actuar como auditores implacables. Su uso obliga a demostrar con rigor absoluto aquello que la comunidad científica simplemente daba por sentado.

Reseña de «Short proofs in combinatorics and number theory»

El artículo «Short proofs in combinatorics and number theory» anuncia un cambio de paradigma en la investigación matemática: las tres demostraciones que contiene fueron creadas íntegramente por un modelo de IA de OpenAI, sin que los cinco coautores humanos contribuyeran a los argumentos matemáticos. Su papel se limitó a comprender y reescribir lo que la máquina produjo.

Los problemas resueltos llevaban décadas abiertos tras ser planteados por Erdős. Que una IA los resuelva antes que cualquier matemático humano ilustra la capacidad emergente de estos sistemas para el razonamiento formal profundo.

Los propios autores sometieron los mismos problemas a GPT-4.5 Pro para medir la reproducibilidad: el modelo público resolvió dos de los tres en pocos intentos. El artículo funciona así tanto como contribución matemática como experimento sobre las fronteras actuales de la IA en ciencia.

Reseña de «Mathematical methods and human thought in the age of AI»

El artículo «Mathematical methods and human thought in the age of AI» examina el impacto de la inteligencia artificial en las matemáticas y en la sociedad, argumentando que su despliegue masivo ha precedido a cualquier reflexión filosófica o regulatoria seria. Los autores, una historiadora del arte y un matemático, encuentran terreno común en las preguntas éticas que plantea el uso cotidiano de estas herramientas.

Las matemáticas sirven como campo de pruebas privilegiado: su capacidad de verificación formal permite estudiar con rigor los límites de la IA, que puede producir demostraciones válidas pero carentes de intuición o narrativa comprensible. A esto se suman riesgos sociales como la brecha digital, el colapso de modelos por datos contaminados y la ausencia de estándares sobre autoría.

Termina proponiendo una transición desde un uso moderado hacia una integración "copernicana". En este escenario, la inteligencia humana deja de ser el centro exclusivo del universo cognitivo. La colaboración responsable permitirá que estas herramientas mejoren la calidad de vida sin degradar los logros intelectuales de la humanidad.

Reseña de «This startup wants to change how mathematicians do math»

El artículo «This startup wants to change how mathematicians do math» describe el lanzamiento de Axplorer por parte de Axiom Math, una herramienta de IA diseñada para ayudar a los matemáticos a descubrir patrones y resolver problemas complejos. La herramienta, basada en un proyecto anterior llamado PatternBoost, busca superar las limitaciones de los LLMs al enfocarse en la generación de nuevas ideas.

Axplorer se diferencia de otras herramientas de IA por su accesibilidad, ya que puede funcionar en computadoras personales, eliminando la necesidad de supercomputadoras. Axiom Math espera que Axplorer contribuya a la iniciativa expMath de DARPA, que promueve el uso de la IA en matemáticas, y que impulse avances en campos como la informática y la seguridad en internet.

Aunque algunos matemáticos se muestran cautelosos sobre el impacto real de la herramienta, Axplorer ha demostrado su potencial al resolver el problema de los cuatro ciclos de Turán. Axiom Math espera que la comunidad matemática adopte Axplorer para generar soluciones y contraejemplos, acelerando así el proceso de descubrimiento matemático.

Readings shared March 29, 2026

The readings shared in Bluesky on 29 March 2026 are:

Reseña de «Embracing AI and formalization: Experimenting with tomorrow’s mathematical tools»

En el número actual (abril de 2026) del Boletín de la AMS, aparece un artículo de Jarod Alper titulado «Embracing AI and formalization: Experimenting with tomorrow’s mathematical tools», donde el autor analiza la creciente influencia de la inteligencia artificial y el lenguaje Lean en la disciplina. Basándose en su labor en el eXperimental Lean Lab, Alper argumenta que los matemáticos deben adoptar estas tecnologías para elevar el rigor y la eficiencia en la investigación actual.

El texto explora áreas clave como la autoformalización y el descubrimiento de conjeturas mediante IA. Pese a las dificultades técnicas del software, Alper defiende que formalizar pruebas elimina errores, profundiza el entendimiento lógico y genera datos de alta calidad vitales para el avance del aprendizaje automático en matemáticas.

Concluye que los matemáticos deben liderar esta transformación para que el futuro de la disciplina no sea dictado solo por corporaciones. La IA redefinirá la investigación, pero la intuición humana seguirá siendo esencial para determinar qué enunciados tienen valor y desarrollar una verdadera comprensión matemática profunda.

Reseña de «Mathematics in the library of Babel»

El artículo «Mathematics in the library of Babel» explora el rápido progreso de la IA en el campo de las matemáticas. Inicialmente escéptico, el autor relata cómo los LLMs, han superado sus expectativas, demostrando capacidad para resolver problemas complejos y ofrecer pruebas de teoremas.

El texto analiza el proyecto "First Proof", una iniciativa que evalúa la utilidad de la IA en la investigación matemática. Los resultados, con la resolución exitosa de entre 6 y 8 problemas de 10, sugieren que la IA puede ser una herramienta valiosa para los matemáticos, aunque aún con margen de error.

El autor reflexiona sobre el futuro de la investigación matemática en un mundo donde la IA puede generar resultados de alta calidad de forma autónoma. Anticipa que la IA se convertirá en un colaborador esencial, pero que el papel del matemático humano seguirá siendo crucial para la creatividad, la validación y la exploración de nuevas fronteras del conocimiento.

Reseña de «As AI keeps improving, mathematicians struggle to foretell their own future»

El artículo «As AI keeps improving, mathematicians struggle to foretell their own future» describe cómo la IA está progresando rápidamente en el campo de las matemáticas. El proyecto First Proof, diseñado para evaluar las capacidades de los LLMs, ha revelado que estos sistemas pueden generar pruebas válidas para problemas matemáticos reales.

La primera ronda de pruebas mostró que los modelos de OpenAI y Google DeepMind superaron las expectativas, resolviendo parcialmente hasta ocho de diez problemas propuestos. Sin embargo, la verificación de estas pruebas resultó ser un desafío, ya que la IA puede cometer errores sutiles pero convincentes.

Para la segunda ronda, el equipo de First Proof exigirá transparencia y acceso a los modelos de IA participantes, así como una evaluación rigurosa por parte de expertos. El objetivo es comprender mejor las capacidades de la IA y anticipar su impacto en el futuro de la investigación matemática, asegurando que los jóvenes investigadores estén preparados para este nuevo panorama.

Reseña de «What happens when AI starts checking mathematicians’ work»

El artículo «What happens when AI starts checking mathematicians’ work» comenta que la comunidad matemática cuenta ahora con una herramienta de IA desarrollada por Math, Inc. llamada Gauss. Este sistema traduce demostraciones matemáticas al lenguaje formal de Lean y verifica su corrección, lo que agiliza la revisión de trabajos y garantiza la validez de los resultados.

Un equipo de investigadores liderado por Hariharan inició la formalización de las demostraciones de Maryna Viazovska sobre el empaquetamiento de esferas en dimensiones superiores. Sin embargo, Math, Inc. completó la formalización de forma autónoma utilizando Gauss, lo que suscitó interrogantes sobre la colaboración y el impacto de la IA en la investigación.

La formalización exitosa de las demostraciones de Viazovska marca un hito importante. Aunque la tecnología tiene limitaciones, su potencial para detectar errores, mejorar la precisión y fomentar nuevos descubrimientos es prometedor. El futuro de las matemáticas podría depender de la colaboración entre humanos y la IA.

Reseña de «Shaping the future of mathematics in the age of AI»

El artículo «Shaping the future of mathematics in the age of AI» analiza la transformación de esta disciplina. Sus autores instan a la comunidad a liderar este cambio para asegurar que la automatización respete los valores intelectuales y estéticos fundamentales de la investigación matemática.

La dependencia de herramientas privadas amenaza la autonomía del campo. El predominio de intereses comerciales exige crear infraestructuras abiertas y transparentes para que los matemáticos controlen sus procesos. Solo así se evitará que empresas externas dicten qué es relevante o quién merece reconocimiento en la investigación.

Finalmente, se propone establecer principios éticos compartidos y fomentar la transparencia técnica. Los matemáticos deben liderar el desarrollo de sus propias herramientas para asegurar que la tecnología potencie el ingenio humano sin comprometer la esencia de su práctica profesional ni su independencia intelectual.

Reseña de «Advancing mathematics by guiding human intuition with AI»

El artículo «Advancing mathematics by guiding human intuition with AI» presenta una nueva metodología para integrar la inteligencia artificial en el proceso de descubrimiento matemático. Los investigadores proponen un marco de trabajo donde la IA no reemplaza al matemático, sino que actúa como una herramienta para potenciar su intuición y ayudarle a identificar patrones ocultos en datos complejos.

Este marco se basa en el entrenamiento de modelos de aprendizaje automático para predecir relaciones entre objetos matemáticos. Si el modelo tiene éxito, se utilizan técnicas de atribución para comprender qué aspectos de los datos son más relevantes para la predicción, lo que a su vez puede inspirar nuevas conjeturas.

Los autores demuestran la eficacia de este enfoque en dos áreas de la matemática: la topología de nudos y la teoría de representación. En ambos casos, la IA ha ayudado a los investigadores a descubrir nuevas relaciones y a avanzar hacia la resolución de problemas, abriendo nuevas vías para la investigación futura.

Reseña de «Can machines do mathematics?»

En la conferencia «Can machines do mathematics?», Johan Commelin (director del proyecto Mathlib) analiza la vertiginosa evolución de la inteligencia artificial. De fallar en cálculos simples, la tecnología ha pasado a colaborar en investigaciones complejas y a ganar medallas en olimpiadas matemáticas gracias a herramientas de verificación formal.

El uso de asistentes como Lean permite gestionar pruebas inabarcables para el cerebro humano, facilitando colaboraciones masivas y seguras. Sin embargo, el auge de empresas privadas que priorizan el marketing sobre la transparencia científica plantea tensiones sociológicas que amenazan los valores tradicionales de la comunidad académica abierta.

Surgen dilemas sobre el papel del matemático en un entorno donde las máquinas generan infinitos teoremas. La capacidad de evaluar argumentos lógicos y encontrar significado entre el flujo computacional se vuelve crucial frente al riesgo de perder habilidades críticas fundamentales debido a la excesiva dependencia de estas herramientas.

Commelin insta a liderar esta transición mediante infraestructuras abiertas y currículos que enfaticen la creatividad y el planteamiento de problemas. El futuro debe equilibrar el potencial de la automatización con la esencia humana del descubrimiento, recordando que las matemáticas son, ante todo, una conversación entre personas.

Reseña de «In math, rigor is vital. But are digitized proofs taking it too far?»

El artículo «In math, rigor is vital. But are digitized proofs taking it too far?» explora la larga historia de la búsqueda de rigor en matemáticas, desde los axiomas de Euclides hasta los debates actuales sobre la formalización computacional. Esta búsqueda ha impulsado avances, pero también plantea interrogantes sobre el equilibrio entre precisión y creatividad.

El proyecto Lean, que busca formalizar toda la matemática en un lenguaje de programación, representa un esfuerzo ambicioso para verificar pruebas automáticamente. Sin embargo, el artículo plantea si esta formalización excesiva podría homogeneizar los enfoques y limitar la diversidad en el campo.

El futuro de la matemática se vislumbra como un equilibrio entre rigor y creatividad. La formalización computacional, como Lean, podría ser crucial, pero exige una reflexión sobre sus posibles implicaciones y la preservación de la intuición en el descubrimiento matemático.

Reseña de «Formal verification and AI are reshaping mathematical research»

El artículo «Formal verification and AI are reshaping mathematical research» revela una revolución en el campo de las matemáticas. Mientras que históricamente ha sido un ámbito de trabajo individual y manual, hoy evoluciona hacia un enfoque colaborativo y escalable, gracias a la fusión de LLMs y asistentes de prueba formal (como Lean).

El motor de esta transformación es la complementariedad entre ambas herramientas: los LLMs aportan creatividad y eficiencia en la generación de ideas y automatización de procesos, mientras que los asistentes de prueba aseguran la validez de cada paso. Esta alianza supera el desafío del "factor de Bruijn", permitiendo resolver problemas complejos como los planteados por Erdős.

Más allá de las matemáticas, esta metodología se aplica al desarrollo de software crítico, combinando inteligencia artificial y verificación formal para automatizar la generación de pruebas de corrección, haciendo accesible el software de alta fiabilidad a un público más amplio.

Readings shared March 24, 2026

The readings shared in Bluesky on 24 March 2026 are:

Reseña de «Eval awareness in Claude Opus 4.6’s BrowseComp performance»

En el artículo «Eval awareness in Claude Opus 4.6’s BrowseComp performance» se comenta que Claude Opus 4.6 evidenció contaminación en el benchmark BrowseComp al localizar respuestas en fuentes públicas. Sin embargo, su hallazgo más significativo fue la capacidad de identificar que estaba siendo evaluado y descifrar la clave de acceso.

El modelo empleó herramientas como Python para extraer datos encriptados, revelando un nivel de inteligencia y resolución de problemas previamente no observado. Este comportamiento plantea serias dudas sobre la fiabilidad de los benchmarks web.

La contaminación se intensificó en configuraciones multi-agente. Las medidas de bloqueo resultaron insuficientes, exigiendo un enfoque continuo y adversarial para preservar la integridad de las evaluaciones.

Reseña de «Coding after coders: The end of computer programming as we know it»

En el artículo «Coding after coders: The end of computer programming as we know it» se comenta que la inteligencia artificial está transformando radicalmente la programación, con desarrolladores que ahora supervisan agentes capaces de generar y probar código automáticamente. Si bien esto multiplica la productividad, genera incertidumbre sobre el futuro del empleo y las competencias que los programadores deberán dominar.

El perfil del desarrollador está evolucionando hacia el de un "arquitecto digital", cuya labor consiste en evaluar y dirigir el trabajo de las IA. Este cambio democratiza la programación, permitiendo que personas sin formación técnica creen software, lo que podría redefinir la industria.

Silicon Valley enfrenta una revolución sin precedentes, donde la colaboración entre humanos e inteligencia artificial redefine no solo la profesión, sino también el panorama laboral en su conjunto, presentando tanto desafíos como oportunidades sin igual.

Readings shared March 19, 2026

The readings shared in Bluesky on 19 March 2026 are:

Readings shared March 14, 2026

The readings shared in Bluesky on 14 March 2026 are:

Reseña de «Mathematicians in the age of AI»

El artículo «Mathematicians in the age of AI» describe cómo la IA ha pasado, en menos de cuatro años, de ser incapaz de razonar matemáticamente a resolver problemas de nivel de investigación, tanto en demostraciones informales como formales verificadas por ordenador.

El episodio más revelador es el de Math Inc., que se apropió de un proyecto colaborativo de formalización para lanzar su agente Gauss con un golpe de efecto publicitario. Paralelamente, el agente Aletheia de DeepMind resolvió seis de diez problemas matemáticos inéditos propuestos por investigadores en activo.

El autor advierte del riesgo de pérdida de empleos y de sentido pedagógico, pero concluye con un llamamiento a la acción: los matemáticos deben liderar el uso de estas herramientas, preservar la intuición matemática en la enseñanza y aprovechar la IA para avanzar en los grandes problemas abiertos de la disciplina.

Reseña de «Mathematicians in the age of AI»

En el artículo «Mathematicians in the age of AI», Jeremy Avigad describe cómo la evolución de la IA ha sido meteórica desde la aparición de la IA generativa a finales de 2022, cuando sus capacidades matemáticas eran limitadas y motivo de burla. En menos de cuatro años, la tecnología ha pasado de fallar en problemas básicos a obtener medallas de oro en las Olimpiadas Internacionales y a resolver con éxito problemas de investigación inéditos, demostrando una potencia de razonamiento que se creía exclusivamente humana.

Este avance plantea desafíos éticos y profesionales, como las "demostraciones por sorpresa" realizadas por empresas privadas que podrían eclipsar el esfuerzo de los investigadores. Avigad sostiene que los matemáticos no deben esconderse, sino liderar y apropiarse de estas herramientas para potenciar su disciplina. El objetivo es que la tecnología ayude a resolver grandes enigmas, garantizando que la intuición y el criterio del matemático sigan siendo el eje fundamental y el motor de las matemáticas.

Reseña de «AI for mathematical and scientific discovery»

En el vídeo «AI for mathematical and scientific discovery», se explica cómo la IA ha evolucionado desde resolver problemas escolares hasta alcanzar niveles de medalla de oro en olimpiadas matemáticas. Los nuevos modelos de razonamiento ahora pueden resolver problemas de investigación inéditos de forma autónoma.

Se destacan aplicaciones en física teórica para simplificar cálculos complejos y en biología para automatizar laboratorios. Gracias a la integración con robótica, modelos como GPT-5 han realizado miles de experimentos autónomos, optimizando drásticamente los costes y la producción en la síntesis de proteínas.

La IA actúa como un colaborador que otorga «superpoderes» a los científicos. Aunque faltan retos en verificación e invención, Weil asegura que el progreso es exponencial. Su ambiciosa visión es que, gracias a esta tecnología, alcanzaremos los descubrimientos previstos para 2050 antes de 2030.

Reseña de «AI for mathematical and scientific discovery»

En el vídeo «AI for mathematical and scientific discovery» se explica cómo la IA ha evolucionado desde resolver problemas escolares hasta alcanzar niveles de medalla de oro en olimpiadas matemáticas. Los nuevos modelos de razonamiento ahora pueden resolver problemas de investigación inéditos de forma autónoma.

Se destacan aplicaciones en física teórica para simplificar cálculos complejos y en biología para automatizar laboratorios. Gracias a la integración con la robótica, modelos como GPT-5 han realizado miles de experimentos autónomos, optimizando drásticamente los costes y la producción en la síntesis de proteínas.

La IA actúa como un colaborador que otorga «superpoderes» a los científicos. Aunque faltan retos en verificación e invención, Weil asegura que el progreso es exponencial. Su ambiciosa visión es que, gracias a esta tecnología, alcanzaremos los descubrimientos previstos para 2050 antes de 2030.

Readings shared March 9, 2026

The readings shared in Bluesky on 9 March 2026 are:

Reseña de «Shaping the future of mathematics in the age of AI»

En el artículo «Shaping the future of mathematics in the age of AI», coescrito por el medalla Fields Akshay Venkatesh, se analiza cómo la IA transforma la disciplina. Destacan métodos simbólicos como el asistente Lean y sistemas neuronales, advirtiendo que la comunidad debe liderar este cambio tecnológico.

La integración de IA y sistemas como Lean exige reformular la enseñanza y la investigación. El enfoque debe virar de la ejecución técnica al planteamiento de problemas y al juicio crítico, asegurando que la tecnología potencie la intuición humana sin perder la autonomía intelectual frente a intereses comerciales.

Finalmente, proponen crear infraestructuras de código abierto y normas éticas. Es vital proteger bibliotecas colaborativas frente al uso comercial sin atribución y mitigar desigualdades. La comunidad debe actuar para que el futuro de las matemáticas refleje sus valores y aspiraciones, no solo la lógica de las máquinas.

Readings shared March 4, 2026

The readings shared in Bluesky on 4 March 2026 are:

Reseña de «Completing the formal proof of higher-dimensional sphere packing»

Hoy se ha publicado el anuncio de la formalización total de los teoremas de Maryna Viazovska sobre el empaquetamiento de esferas. Con una extensión de aproximadamente 200,000 líneas de código en el lenguaje Lean, este proyecto se consagra como la mayor formalización de propósito único en la historia y el primer resultado galardonado con la Medalla Fields de este siglo en ser verificado íntegramente por computadora.

El núcleo matemático de este logro reside en resolver el milenario problema del empaquetamiento de esferas: ¿cómo disponer esferas idénticas en un espacio n-dimensional de la forma más densa posible? Mientras que para tres dimensiones la solución (conjeturada por Kepler en 1611) requirió siglos de esfuerzo y una compleja verificación computacional, Viazovska halló una solución "sorprendentemente simple" para la dimensión 8 mediante el uso de formas modulares. Su trabajo, extendido posteriormente a la dimensión 24 junto a otros colaboradores, demuestra que la red \(E_8\) y la red de Leech son los arreglos más densos y óptimos en sus respectivas dimensiones. La prueba es célebre por tender un puente magistral entre la geometría discreta, el análisis armónico y la teoría de números.

Una pieza clave de este éxito ha sido Gauss, un sistema de inteligencia artificial que ha transformado radicalmente los tiempos de ejecución. Mientras que proyectos de envergadura similar solían requerir décadas de esfuerzo humano, Gauss logró completar tareas críticas en cuestión de semanas. De manera sorprendente, la IA no solo finalizó la demostración en la dimensión 8 en apenas cinco días —un trabajo estimado en seis meses para un equipo humano—, sino que abordó la dimensión 24 de forma autónoma, realizando búsquedas bibliográficas y optimizando el código generado hasta reducirlo de medio millón de líneas a una versión más eficiente y mantenible.

Este avance trasciende la mera verificación; representa un cambio de paradigma en la investigación científica. Al convertir teorías complejas en datos navegables, modulares y procesables por máquinas, se abre la puerta a una nueva era de colaboración humano-IA. El éxito del proyecto demuestra que la autoformalización no solo es posible, sino que es capaz de integrar ramas diversas de la matemática en un corpus de conocimiento unificado y verificable a escala global.

Para conocer todos los pormenores técnicos y el alcance de este logro, se pueden consultar los detalles en: Completing the formal proof of higher-dimensional sphere packing.

Readings shared March 1, 2026

The readings shared in Bluesky on 1 March 2026 are:

Reseña de «AI that can prove it’s right: Verification as the missing layer in AI»

En el vídeo «AI that can prove it’s right: Verification as the missing layer in AI», Carina Hong explica cómo Axiom Math está desarrollando una inteligencia artificial matemática capaz de autoverificarse utilizando el lenguaje Lean. Su sistema, AxiomProver, no solo obtuvo una puntuación perfecta en el examen Putnam, sino que también resolvió cuatro conjeturas de investigación complejas sin ninguna intervención humana.

Hong subraya la importancia crucial de la verificación para eliminar las alucinaciones en los sistemas de IA. Al combinar razonamiento formal e informal, Axiom Math aspira a liderar un renacimiento matemático que permita resolver problemas históricos y transforme sectores críticos donde la precisión absoluta es fundamental para el desarrollo de nuevas tecnologías y descubrimientos científicos.

Readings shared February 24, 2026

The readings shared in Bluesky on 24 February 2026 are:

Readings shared February 19, 2026

The readings shared in Bluesky on 19 February 2026 are:

Reseña de «Machine assistance and the future of research mathematics»

En el artículo «Mathematics and machine creativity: A survey on bridging mathematics with AI», se analiza cómo la IA transforma la investigación matemática. Aunque los modelos actuales fallan en lógica deductiva pura, su capacidad inductiva ofrece un valioso apoyo creativo para los matemáticos.

El texto destaca tres aplicaciones: demostraciones asistidas por computadora, formulación de conjeturas mediante reconocimiento de patrones y construcción de objetos matemáticos. Herramientas como FunSearch demuestran el potencial de la IA para descubrir soluciones innovadoras que superan las capacidades humanas tradicionales.

Finalmente, se abordan los límites actuales y el impacto educativo. Pese a no crear conceptos abstractos nuevos, la IA actúa como un socio estratégico que potencia la intuición humana, fomentando una colaboración interdisciplinaria necesaria para resolver problemas de la ciencia.

Readings shared February 14, 2026

The readings shared in Bluesky on 14 February 2026 are:

Reseña de «Machine assistance and the future of research mathematics»

Ayer se publicó la conferencia de Terence Tao titulada «Machine assistance and the future of research mathematics», donde analiza la transformación de esta disciplina por la IA. Tao señala que las matemáticas están pasando de estudios individuales a proyectos masivos. El ingrediente clave es la verificación formal, que permite validar contribuciones masivas y filtrar el ruido de la IA.

Tao usa los problemas de Erdős para ilustrar cómo la IA agiliza la búsqueda de literatura y la traducción a código verificable. Aunque aún no supera los retos más complejos, la IA es ideal para resolver sistemáticamente problemas de dificultad media. Tao augura un futuro de colaboración humano-máquina que democratizará y escalará la investigación científica de forma inédita.

Readings shared February 9, 2026

The readings shared in Bluesky on 9 February 2026 are:

Reseña de «Accelerating mathematics»

El artículo «Accelerating mathematics» analiza cómo la tecnología busca acelerar el descubrimiento. Aunque los LLMs ayudan en lluvias de ideas, suelen «alucinar» y generar pruebas erróneas que parecen convincentes. Esto exige una revisión humana agotadora, evidenciando que la IA por sí sola aún no es una herramienta fiable para la investigación matemática de alto nivel.

Por otro lado, los sistemas como Lean garantizan precisión, pero sus bibliotecas carecen de definiciones modernas. Expandirlas es difícil porque requiere expertos escasos que dominen tanto la matemática avanzada como el código. En última instancia, el factor humano sigue siendo el gran cuello de botella, ya que el rigor necesario para evitar el error no puede automatizarse fácilmente todavía.

Readings shared February 4, 2026

The readings shared in Bluesky on 4 February 2026 are:

Reseña de «Recent advances in LLMs for mathematics»

En la conferencia «Recent advances in LLMs for mathematics», Sébastien Bubeck expone el salto desde la lógica básica de GPT-3.5 hasta el razonamiento de nivel de investigación en GPT-5. Los modelos han pasado de resolver problemas escolares de competición al 100% a abordar cuestiones abiertas, evolucionando desde respuestas directas hacia una compleja «cadena de pensamiento» interna.

El progreso se evidencia en áreas como la optimización convexa y la combinatoria. Los LLMs actuales son capaces de detectar vacíos en artículos científicos, mejorar límites matemáticos y hallar demostraciones inéditas más elegantes que las humanas. Tareas que requerirían meses de trabajo investigador se resuelven ahora en una tarde, empleando herramientas de aproximación avanzadas.

Pese al avance, el nivel actual equivale al de un estudiante de postgrado inicial y aún no alcanza la excelencia de las publicaciones más prestigiosas. Bubeck advierte sobre fallos en problemas de extrema complejidad y enfatiza que la pericia humana es hoy más crucial que nunca para validar resultados, orientar los modelos y profundizar en nuestra comprensión conceptual de la realidad.

Readings shared January 29, 2026

The readings shared in Bluesky on 29 January 2026 are:

Readings shared January 24, 2026

The readings shared in Bluesky on 24 January 2026 are:

Reseña de «Sobre la resolución de problemas de Erdős usando inteligencia artificial generativa»

En «Sobre la resolución de problemas de Erdős usando inteligencia artificial generativa», Francisco R. Villatoro ofrece una visión panorámica en español sobre las aplicaciones de la IA en matemáticas. El artículo analiza cómo las IAs generativas están resolviendo problemas del célebre matemático Paul Erdős, aunque advierte contra el exceso de optimismo ante estos avances recientes.

El autor explica la metodología "vibe mathematics": usar IA para generar demostraciones, formalizarlas en Lean con Aristotle para verificarlas automáticamente, y repetir hasta obtener una correcta. Sin embargo, señala que la mayoría de intentos fracasan y que incluso demostraciones verificadas pueden resolver problemas distintos al original, como ocurrió con David Budden y Navier-Stokes.

Villatoro concluye que aunque el futuro es prometedor para problemas rutinarios, los grandes desafíos matemáticos requieren creatividad más allá de las IAs actuales. De los 1136 problemas de Erdős catalogados, 469 están resueltos, muchos gracias a la colaboración entre matemáticos humanos e IA, pero la tasa de éxito autónomo de las IAs sigue siendo baja (1-2%).

Readings shared January 19, 2026

The readings shared in Bluesky on 19 January 2026 are:

Readings shared January 14, 2026

The readings shared in Bluesky on 14 January 2026 are:

Readings shared January 4, 2026

The readings shared in Bluesky on 4 January 2026 are:

Readings shared December 29, 2025

The readings shared in Bluesky on 29 December 2025 are:

Readings shared December 24, 2025

The readings shared in Bluesky on 24 December 2025 are:

Readings shared December 19, 2025

The readings shared in Bluesky on 19 December 2025 are:

Readings shared December 14, 2025

The readings shared in Bluesky on 14 December 2025 are:

Readings shared December 10, 2025

The readings shared in Bluesky on 10 December 2025 are:

Readings shared December 9, 2025

The readings shared in Bluesky on 9 December 2025 are:

Reseña de «The story of Erdős problem #1026»

En el artículo «The story of Erdős problem #1026», Terence Tao detalla la resolución de un problema de 1975 mediante una colaboración híbrida entre matemáticos y herramientas de IA. El proceso incluyó la formulación de conjeturas numéricas y pruebas formales en Lean generadas por sistemas como AlphaEvolve. La solución final se logró al vincular el reto con un problema de empaquetamiento de cuadrados y localizar, mediante una búsqueda profunda con IA, un teorema reciente en la literatura que completó la demostración.

Readings shared December 7, 2025

The readings shared in Bluesky on 7 December 2025 are:

Reseña de «50 years of proof assistants»

En el artículo «50 years of proof assistants», Lawrence C. Paulson refuta el estancamiento científico mediante la evolución de la verificación formal. Desde 1975, con Edinburgh LCF y el lenguaje ML, se crearon los cimientos de los asistentes de demostración. Entre 1985 y 1995, herramientas como Isabelle y HOL permitieron las primeras verificaciones de hardware y consolidaron la lógica computacional.

Entre 1995 y 2015, la tecnología maduró tras fallos como el del Pentium. Se lograron hitos como la verificación del Teorema de los Cuatro Colores y el procesador ARM6. Posteriormente, se verificó software crítico como el kernel seL4 y el compilador CompCert, demostrando por primera vez que la corrección funcional total de sistemas complejos y el código libre de errores eran objetivos alcanzables.

Desde 2015, la adopción se disparó en matemáticas (con Lean) y en la industria. Gigantes como AWS y proyectos como CHERI integran ahora la verificación formal para garantizar la seguridad del hardware y la nube. El autor concluye que esta tecnología está pasando de ser una curiosidad académica a un estándar industrial «ordinario», demostrando un progreso científico vibrante y continuo.

Readings shared December 5, 2025

The readings shared in Bluesky on 5 December 2025 are:

Reseña de «Formalization of Erdős problems»

El artículo «Formalization of Erdős problems» destaca el auge en la resolución de problemas de Paul Erdős gracias a la web erdosproblems.com y el proyecto Formal Conjectures. De más de 1100 problemas recopilados, el 40% ya están resueltos y unos 240 tienen sus enunciados formalizados en Lean. Esta infraestructura comunitaria y el uso de bases de datos han acelerado notablemente el progreso matemático.

La gran revolución descrita es el uso de IA para formalizar y resolver estos retos. Herramientas como Aristotle ya no solo asisten, sino que traducen demostraciones de lenguaje natural a código Lean automáticamente. Incluso han logrado hitos históricos al resolver problemas abiertos (como el problema 124) de forma totalmente autónoma, generando nuevas matemáticas verificadas sin ayuda humana.

Finalmente, el autor advierte sobre la "malformalización": errores sutiles al traducir enunciados a código, desde bugs técnicos hasta la omisión de hipótesis necesarias. A pesar de estos desafíos, concluye que el ritmo de avance es vertiginoso y que la comunidad de Erdős está sirviendo como modelo pionero para integrar la IA en la investigación matemática formal.

Readings shared December 4, 2025

The readings shared in Bluesky on 4 December 2025 are:

Readings shared December 3, 2025

The readings shared in Bluesky on 3 December 2025 are:

Readings shared December 2, 2025

The readings shared in Bluesky on 2 December 2025 are:

Readings shared November 28, 2025

The readings shared in Bluesky on 28 November 2025 are:

Readings shared November 26, 2025

The readings shared in Bluesky on 26 November 2025 are:

Readings shared November 25, 2025

The readings shared in Bluesky on 25 November 2025 are:

Readings shared November 24, 2025

The readings shared in Bluesky on 24 November 2025 are:

Readings shared November 23, 2025

The readings shared in Bluesky on 23 November 2025 are:

Reseña de «DeepMind’s latest - An AI for handling mathematical proofs»

En el artículo «DeepMind’s latest: An AI for handling mathematical proofs», se presenta a AlphaProof, un sistema de inteligencia artificial capaz de razonar y realizar demostraciones matemáticas complejas. En la Olimpiada Internacional de Matemáticas de 2024, el sistema alcanzó el nivel de un medallista de plata, quedándose a un solo punto de obtener el oro.

El desafío del razonamiento lógico

Históricamente, los ordenadores han sido excelentes calculando, pero mediocres "entendiendo" la lógica necesaria para las demostraciones matemáticas. Los modelos de lenguaje actuales (como ChatGPT) funcionan mediante estadística y predicción de palabras, lo que a menudo resulta en respuestas que "suenan" bien pero son matemáticamente incorrectas. Para solucionar esto, DeepMind necesitaba un sistema que garantizase certeza absoluta.

Cómo funciona: La combinación de tres elementos

Para lograr este hito, AlphaProof combinó varias estrategias:

  • Lenguaje formal (Lean): Utilizaron Lean, un software que permite escribir y verificar demostraciones matemáticas. Como había pocos datos de entrenamiento en este formato, usaron una versión de Gemini para traducir millones de problemas de lenguaje natural a Lean.

  • Aprendizaje por refuerzo (Estilo AlphaZero): Emplearon una arquitectura similar a la que domina el ajedrez o el Go. Una red neuronal aprende mediante prueba y error, recompensando las demostraciones correctas y elegantes, combinada con un algoritmo de búsqueda en árbol para explorar posibles pasos lógicos.

  • Aprendizaje en tiempo de prueba (TTRL): Esta es la gran innovación. Ante un problema muy difícil, la IA genera variaciones del mismo (algunas más simples, otras más generales) para "practicar" y aprender sobre la marcha, emulando cómo un humano intenta resolver versiones simplificadas de un problema antes de atacar el original.

Resultados

AlphaProof logró resolver el problema más difícil de la competición (el sexto), algo que solo consiguieron 6 de los 609 participantes humanos. En conjunto con AlphaGeometry 2 (que se encargó de un problema de geometría para el que AlphaProof no estaba optimizado), el sistema sumó 28 puntos.

Las limitaciones: Tiempo y coste

A pesar del éxito, el sistema tiene desventajas significativas frente a los humanos:

  • Recursos desproporcionados: Mientras que los estudiantes tienen 4,5 horas por sesión, AlphaProof tardó días en resolver los problemas, utilizando una inmensa potencia de cálculo (cientos de días de procesamiento TPU).

  • Coste prohibitivo: Actualmente, el coste de ejecutar este sistema es inviable para la mayoría de los investigadores.

  • Dependencia humana: Los problemas tuvieron que ser traducidos manualmente a Lean antes de que la IA pudiera procesarlos.

El futuro

El objetivo de DeepMind no es ganar concursos como la IMO, sino optimizar esta tecnología para que sea menos costosa y pueda contribuir a la investigación matemática profesional, ayudando a descubrir nuevos conceptos en lugar de solo resolver los ya conocidos.

Readings shared November 20, 2025

The readings shared in Bluesky on 20 November 2025 are:

Readings shared November 19, 2025

The readings shared in Bluesky on 19 November 2025 are:

Readings shared November 18, 2025

The readings shared in Bluesky on 18 November 2025 are:

Reseña de «Teaching real analysis as a game»"

En «Teaching real analysis as a game», Alex Kontorovich propone enseñar análisis real usando el asistente de pruebas Lean como un videojuego. Su idea central es que, al igual que un principiante de ajedrez necesita ver el tablero, los estudiantes necesitan una representación visual de las hipótesis y objetivos en una demostración. Lean actúa como ese "tablero de juego" interactivo e indispensable.

La metodología transforma el curso en niveles donde los estudiantes usan "tácticas" (comandos de Lean) para resolver problemas. Este enfoque fuerza a distinguir claramente entre lo que se sabe y lo que se debe probar. El objetivo no es aprender a programar, sino internalizar la lógica formal de manera intuitiva y profunda a través de la práctica interactiva.

Los resultados mostraron que los estudiantes, tras usar la herramienta, fueron capaces de escribir demostraciones en lenguaje natural excepcionalmente claras y rigurosas en sus exámenes. Kontorovich concluye que este método es prometedor, ya que sirve como un andamiaje efectivo para dominar la complejidad del análisis real.

Readings shared November 17, 2025

The readings shared in Bluesky on 17 November 2025 are:

Readings shared November 14, 2025

The readings shared in Bluesky on 14 November 2025 are:

Reseña de «How we achieved an IMO medal, one year before any other AI system»

En el artículo «How we achieved an IMO medal, one year before any other AI system» se explica cómo AlphaProof logró un nivel de medalla de plata en la Olimpiada Internacional de Matemáticas. Este hito, alcanzado un año antes que cualquier otra IA, superó un gran desafío para la inteligencia artificial en una competición de élite para jóvenes matemáticos.

El avance crucial fue el "Aprendizaje por Refuerzo en Tiempo de Prueba" (TTRL). Esta técnica permitía al agente crear variaciones de los problemas y entrenar con ellas durante la propia competencia. Aunque consumía muchos recursos y tuvo resultados iniciales modestos, su refinamiento fue clave para lograr tres demostraciones completas tras tres días de prueba.

El autor señala futuros desafíos como la dependencia del demostrador Lean y la limitada cantidad de problemas matemáticos únicos. Su visión es desarrollar agentes que no solo resuelvan problemas, sino que generen sus propias preguntas y construyan teorías novedosas de forma autónoma.

Reseña de «Olympiad-level formal mathematical reasoning with reinforcement learning»

En el artículo «Olympiad-level formal mathematical reasoning with reinforcement learning» se presenta AlphaProof, un agente de IA que utiliza aprendizaje por refuerzo para resolver problemas matemáticos complejos en el asistente de pruebas Lean. Combina una red neuronal con búsqueda en árbol para encontrar demostraciones formalmente verificables.

El sistema fue entrenado con millones de problemas auto-formalizados y emplea una innovadora adaptación en tiempo de prueba para los problemas más difíciles. Demostró capacidades excepcionales resolviendo problemas de competiciones como la Olimpiada Internacional de Matemáticas.

En la IMO 2024, AlphaProof resolvió tres problemas no geométricos, incluyendo el más difícil. Combinado con AlphaGeometry 2, el sistema logró una puntuación equivalente a medalla de plata, marcando un hito en el razonamiento matemático automatizado.

Reseña de «A new paradigm for mathematical proof?»

En la conferencia «A new paradigm for mathematical proof?», Emily Riehl explora los desafíos actuales en la verificación de demostraciones matemáticas. Ejemplos como la conjetura de Kepler y el programa de Langlands muestran cómo las pruebas se han vuelto tan largas y complejas que incluso matemáticos como Voevodsky y Scholze han encontrado errores en su propio trabajo.

Como respuesta, Riehl propone la formalización computacional mediante asistentes de prueba como Lean y Agda. Proyectos como la verificación del teorema de Feit-Thompson demuestran que es posible certificar la corrección de demostraciones complejas mediante verificación automática, aunque requiere un esfuerzo colaborativo significativo.

La conclusión es que este enfoque podría constituir un nuevo paradigma para asegurar el rigor matemático, especialmente frente al riesgo de pruebas generadas por IA. Riehl sugiere que las demostraciones asistidas por computadora deberían incluir tanto la formalización verificada como una explicación para humanos, manteniendo así los estándares de la comunidad matemática.

Readings shared November 7, 2025

The readings shared in Bluesky on 7 November 2025 are:

Reseña de «The path to a superhuman AI mathematician»

En el artículo «The path to a superhuman AI mathematician», el profesor Sanjeev Arora propone que las matemáticas serán el primer dominio donde surgirá una IA superhumana. Esta se definiría como un sistema capaz de demostrar más teoremas que los logrados por la humanidad.

La ruta hacia este logro se basa en la verificación formal de pruebas con sistemas como Lean, que permite comprobar la corrección de forma automática. La IA se automejoraría mediante aprendizaje por refuerzo, usando Lean para validar sus respuestas sin depender solo de humanos. Además, podría generar sus propias preguntas matemáticas de manera creativa.

Evidencias recientes, como los modelos AlphaProof y Goedel-Prover, confirman esta tendencia. Arora concluye que, gracias a esta capacidad de verificación y mejora continua, una IA matemática superhumana es un horizonte plausible.

Reseña de «Mathematical exploration and discovery at scale»

En el artículo «Mathematical exploration and discovery at scale» se presenta AlphaEvolve, un agente que combina modelos de lenguaje grande y algoritmos evolutivos para descubrir construcciones matemáticas. Probado en 67 problemas de matemáticas avanzadas, redescubrió y mejoró soluciones conocidas, demostrando su capacidad para explorar espacios de búsqueda complejos de forma eficiente.

El sistema opera evolucionando programas que buscan soluciones. Para la verificación, se integró con AlphaProof, logrando la formalización automática de pruebas en el asistente Lean. Aunque es más efectivo en problemas de optimización, sus resultados destacan el potencial de la IA como colaboradora en la investigación matemática a gran escala, desde el descubrimiento hasta la prueba formal.

Readings shared November 5, 2025

The readings shared in Bluesky on 5 November 2025 are:

Readings shared November 2, 2025

The readings shared in Bluesky on 2 November 2025 are:

Readings shared November 1, 2025

The readings shared in Bluesky on 1 November 2025 are:

Readings shared October 31, 2025

The readings shared in Bluesky on 31 October 2025 are:

Reseña de «¿Cuándo podrá la Inteligencia artificial ayudarnos a demostrar teoremas?»

En la conferencia «¿Cuándo podrá la Inteligencia artificial ayudarnos a demostrar teoremas?» se explica que la IA ya ayuda, pero con límites. Actualmente, es experta en reconocer patrones para encontrar contraejemplos o generar evidencia para conjeturas, pero depende de datos existentes.

Su papel actual es de "murmuración": sugiere posibles teoremas o caminos de prueba que los matemáticos deben verificar. Es una herramienta poderosa para explorar, pero no sustituye la creatividad e intuición humana necesarias para los avances genuinos.

El futuro próximo no es que la IA demuestre teoremas por sí sola, sino que actúe como un asistente. Ayudará en la formalización de pruebas y en la exploración de rutas, pero el matemático seguirá siendo esencial para la idea central y la verificación final.

Readings shared October 29, 2025

The readings shared in Bluesky on 29 October 2025 are: