Readings shared January 9, 2026
The readings shared in Bluesky on 9 January 2026 are:
Las lecturas compartidas en Bluesky el 9 de enero de 2026 son
- Mathematical understanding. ~ Jeremy Avigad. #Math #AI
The readings shared in Bluesky on 9 January 2026 are:
Las lecturas compartidas en Bluesky el 9 de enero de 2026 son
The readings shared in Bluesky on 4 January 2026 are:
The readings shared in Bluesky on 29 December 2025 are:
The readings shared in Bluesky on 24 December 2025 are:
The readings shared in Bluesky on 19 December 2025 are:
The readings shared in Bluesky on 14 December 2025 are:
The readings shared in Bluesky on 10 December 2025 are:
The readings shared in Bluesky on 9 December 2025 are:
The readings shared in Bluesky on 8 December 2025 are:
The readings shared in Bluesky on 7 December 2025 are:
The readings shared in Bluesky on 6 December 2025 are:
The readings shared in Bluesky on 5 December 2025 are:
El artículo «Formalization of Erdős problems» destaca el auge en la resolución de problemas de Paul Erdős gracias a la web erdosproblems.com y el proyecto Formal Conjectures. De más de 1100 problemas recopilados, el 40% ya están resueltos y unos 240 tienen sus enunciados formalizados en Lean. Esta infraestructura comunitaria y el uso de bases de datos han acelerado notablemente el progreso matemático.
La gran revolución descrita es el uso de IA para formalizar y resolver estos retos. Herramientas como Aristotle ya no solo asisten, sino que traducen demostraciones de lenguaje natural a código Lean automáticamente. Incluso han logrado hitos históricos al resolver problemas abiertos (como el problema 124) de forma totalmente autónoma, generando nuevas matemáticas verificadas sin ayuda humana.
Finalmente, el autor advierte sobre la "malformalización": errores sutiles al traducir enunciados a código, desde bugs técnicos hasta la omisión de hipótesis necesarias. A pesar de estos desafíos, concluye que el ritmo de avance es vertiginoso y que la comunidad de Erdős está sirviendo como modelo pionero para integrar la IA en la investigación matemática formal.
The readings shared in Bluesky on 4 December 2025 are:
The readings shared in Bluesky on 3 December 2025 are:
The readings shared in Bluesky on 2 December 2025 are:
The readings shared in Bluesky on 28 November 2025 are:
The readings shared in Bluesky on 27 November 2025 are:
The readings shared in Bluesky on 26 November 2025 are:
The readings shared in Bluesky on 25 November 2025 are:
The readings shared in Bluesky on 24 November 2025 are:
The readings shared in Bluesky on 23 November 2025 are:
En el artículo «DeepMind’s latest: An AI for handling mathematical proofs», se presenta a AlphaProof, un sistema de inteligencia artificial capaz de razonar y realizar demostraciones matemáticas complejas. En la Olimpiada Internacional de Matemáticas de 2024, el sistema alcanzó el nivel de un medallista de plata, quedándose a un solo punto de obtener el oro.
Históricamente, los ordenadores han sido excelentes calculando, pero mediocres "entendiendo" la lógica necesaria para las demostraciones matemáticas. Los modelos de lenguaje actuales (como ChatGPT) funcionan mediante estadística y predicción de palabras, lo que a menudo resulta en respuestas que "suenan" bien pero son matemáticamente incorrectas. Para solucionar esto, DeepMind necesitaba un sistema que garantizase certeza absoluta.
Para lograr este hito, AlphaProof combinó varias estrategias:
Lenguaje formal (Lean): Utilizaron Lean, un software que permite escribir y verificar demostraciones matemáticas. Como había pocos datos de entrenamiento en este formato, usaron una versión de Gemini para traducir millones de problemas de lenguaje natural a Lean.
Aprendizaje por refuerzo (Estilo AlphaZero): Emplearon una arquitectura similar a la que domina el ajedrez o el Go. Una red neuronal aprende mediante prueba y error, recompensando las demostraciones correctas y elegantes, combinada con un algoritmo de búsqueda en árbol para explorar posibles pasos lógicos.
Aprendizaje en tiempo de prueba (TTRL): Esta es la gran innovación. Ante un problema muy difícil, la IA genera variaciones del mismo (algunas más simples, otras más generales) para "practicar" y aprender sobre la marcha, emulando cómo un humano intenta resolver versiones simplificadas de un problema antes de atacar el original.
AlphaProof logró resolver el problema más difícil de la competición (el sexto), algo que solo consiguieron 6 de los 609 participantes humanos. En conjunto con AlphaGeometry 2 (que se encargó de un problema de geometría para el que AlphaProof no estaba optimizado), el sistema sumó 28 puntos.
A pesar del éxito, el sistema tiene desventajas significativas frente a los humanos:
Recursos desproporcionados: Mientras que los estudiantes tienen 4,5 horas por sesión, AlphaProof tardó días en resolver los problemas, utilizando una inmensa potencia de cálculo (cientos de días de procesamiento TPU).
Coste prohibitivo: Actualmente, el coste de ejecutar este sistema es inviable para la mayoría de los investigadores.
Dependencia humana: Los problemas tuvieron que ser traducidos manualmente a Lean antes de que la IA pudiera procesarlos.
El objetivo de DeepMind no es ganar concursos como la IMO, sino optimizar esta tecnología para que sea menos costosa y pueda contribuir a la investigación matemática profesional, ayudando a descubrir nuevos conceptos en lugar de solo resolver los ya conocidos.
The readings shared in Bluesky on 20 November 2025 are:
The readings shared in Bluesky on 19 November 2025 are:
The readings shared in Bluesky on 18 November 2025 are:
The readings shared in Bluesky on 17 November 2025 are:
The readings shared in Bluesky on 16 November 2025 are:
The readings shared in Bluesky on 14 November 2025 are:
En el artículo «Olympiad-level formal mathematical reasoning with reinforcement learning» se presenta AlphaProof, un agente de IA que utiliza aprendizaje por refuerzo para resolver problemas matemáticos complejos en el asistente de pruebas Lean. Combina una red neuronal con búsqueda en árbol para encontrar demostraciones formalmente verificables.
El sistema fue entrenado con millones de problemas auto-formalizados y emplea una innovadora adaptación en tiempo de prueba para los problemas más difíciles. Demostró capacidades excepcionales resolviendo problemas de competiciones como la Olimpiada Internacional de Matemáticas.
En la IMO 2024, AlphaProof resolvió tres problemas no geométricos, incluyendo el más difícil. Combinado con AlphaGeometry 2, el sistema logró una puntuación equivalente a medalla de plata, marcando un hito en el razonamiento matemático automatizado.
The readings shared in Bluesky on 13 November 2025 are:
The readings shared in Bluesky on 10 November 2025 are:
The readings shared in Bluesky on 9 November 2025 are:
The readings shared in Bluesky on 8 November 2025 are:
The readings shared in Bluesky on 7 November 2025 are:
The readings shared in Bluesky on 5 November 2025 are:
The readings shared in Bluesky on 4 November 2025 are:
The readings shared in Bluesky on 2 November 2025 are:
The readings shared in Bluesky on 1 November 2025 are:
The readings shared in Bluesky on 31 October 2025 are:
The readings shared in Bluesky on 30 October 2025 are:
The readings shared in Bluesky on 29 October 2025 are:
The readings shared in Bluesky on 28 October 2025 are:
The readings shared in Bluesky on 27 October 2025 are:
The readings shared in Bluesky on 26 October 2025 are:
The readings shared in Bluesky on 25 October 2025 are:
The readings shared in Bluesky on 24 October 2025 are:
The readings shared in Bluesky on 23 October 2025 are:
The readings shared in Bluesky on 22 October 2025 are:
Terence Tao ha comentado en Mastodon otro ejemplo interesante de la asistencia informática en matemáticas, que involucra nuevamente a los problemas de Erdös: el Problema #707, anteriormente marcado como "abierto", ahora está "refutado" - con la refutación formalizada en Lean. Pero el camino hacia esa refutación fue bastante inusual, y no encajaba perfectamente en ninguna de las narrativas estándar sobre la IA en las matemáticas.
La refutación inicial fue obra de humanos usando argumentos convencionales, sin ayuda inicial de LLMs. Sin embargo, descubrieron después que el problema ya había sido resuelto tres décadas antes por Hall, un hallazgo que las búsquedas bibliográficas humanas y asistidas por IA no detectaron. Para formalizar su prueba en Lean, los autores, sin experiencia previa, usaron ChatGPT en un proceso de "codificación por vibraciones", logrando generar unas 3000 líneas de código verificadas. Este proceso incluso permitió corregir un error en la formalización original del problema.
Este caso ilustra un uso muy específico y responsable de la IA: no para generar ideas matemáticas, sino para asistir en la creación de código formal verificable. La formalización complementa, pero no reemplaza, la prueba humana central. Debido a su contribución crucial en esta etapa, tanto ChatGPT como Lean aparecen como coautores del artículo, destacando un modelo inusual de colaboración humano-IA.
The readings shared in Bluesky on 21 October 2025 are:
The readings shared in Bluesky on 20 October 2025 are:
The readings shared in Bluesky on 18 October 2025 are:
The readings shared in Bluesky on 17 October 2025 are:
The readings shared in Bluesky on 16 October 2025 are:
The readings shared in Bluesky on 15 October 2025 are:
The readings shared in Bluesky on 14 October 2025 are:
The readings shared in Bluesky on 13 October 2025 are:
The readings shared in Bluesky on 11 October 2025 are:
The readings shared in Bluesky on 10 October 2025 are:
The readings shared in Bluesky on 9 October 2025 are:
The readings shared in Bluesky on 8 October 2025 are:
The readings shared in Bluesky on 7 October 2025 are:
The readings shared in Bluesky on 6 October 2025 are:
The readings shared in Bluesky on 4 October 2025 are:
The readings shared in Bluesky on 03 October 2025 are:
The readings shared in Bluesky on 02 October 2025 are:
The readings shared in Bluesky on 01 October 2025 are:
The readings shared in Bluesky on 30 September 2025 are:
The readings shared in Bluesky on 29 September 2025 are:
The readings shared in Bluesky on 28 September 2025 are:
The readings shared in Bluesky on 26 September 2025 are:
The readings shared in Bluesky on 25 September 2025 are:
The readings shared in Bluesky on 24 September 2025 are:
The readings shared in Bluesky on 23 September 2025 are:
The readings shared in Bluesky on 22 September 2025 are:
The readings shared in Bluesky on 20 September 2025 are:
The readings shared in Bluesky on 19 September 2025 are:
The readings shared in Bluesky on 18 September 2025 are:
The readings shared in Bluesky on 17 September 2025 are:
The readings shared in Bluesky on 15 September 2025 are:
The readings shared in Bluesky on 14 September 2025 are:
The readings shared in Bluesky on 13 September 2025 are:
The readings shared in Bluesky on 12 September 2025 are
The readings shared in Bluesky on 11 September 2025 are
The readings shared in Bluesky on 10 September 2025 are
The readings shared in Bluesky on 9 September 2025 are
The readings shared in Bluesky on 8 September 2025 are
The readings shared in Bluesky on 7 September 2025 are
The readings shared in Bluesky on 6 September 2025 are
The readings shared in Bluesky on 5 September 2025 are
The readings shared in Bluesky on 4 September 2025 are
The readings shared in Bluesky on 3 September 2025 are
The readings shared in Bluesky on 2 September 2025 are
The readings shared in Bluesky on 1 September 2025 are
The readings shared in Bluesky on 31 August 2025 are
The readings shared in Bluesky on 30 August 2025 are
The readings shared in Bluesky on 29 August 2025 are
The readings shared in Bluesky on 28 August 2025 are
The readings shared in Bluesky on 27 August 2025 are