Ir al contenido principal

Readings shared October 28, 2025

The readings shared in Bluesky on 28 October 2025 are:

Reseña de «Les IA vont-elles remplacer les mathématiciens?»

En el artículo de «Les IA vont-elles remplacer les mathématiciens?» se explora el rápido avance de la IA en matemáticas. Sistemas como Gemini o AlphaProof ya resuelven problemas de olimpiadas a nivel de medalla de oro y superan exámenes complejos. Este progreso, impulsado por entrenamiento masivo y nuevos modelos de razonamiento, plantea si podrán igualar la creatividad humana.

Sin embargo, el artículo matiza estos logros. Las IA aún son inconsistentes, cometen errores en problemas simples y carecen de la comprensión profunda y creatividad necesarias para la investigación de vanguardia. Expertos coinciden en que su pensamiento es mecánico y les falta la visión intuitiva para manejar conceptos matemáticos abstractos, necesitando posiblemente una nueva arquitectura.

El futuro no es de reemplazo, sino de colaboración. La IA se vislumbra como una herramienta poderosa que automatizará tareas tediosas, ayudará a verificar pruebas e incluso podrá sugerir nuevas líneas de investigación. Los matemáticos podrían usar estas herramientas para aumentar su productividad y explorar problemas de una manera antes imposible, transformando así la profesión.

Reseña de «Gauss – towards autoformalization for the working mathematician»

En la conferencia «Gauss – towards autoformalization for the working mathematician», Jared Duker Lichtman presentó el proyecto Gauss, que busca automatizar la traducción de pruebas matemáticas a código formal verificable por máquina, haciendo esta práctica accesible para más matemáticos.

Como caso de estudio, se destacó la exitosa formalización automática de la versión "fuerte" del Teorema de los Números Primos en Lean. El agente Gauss generó 25.000 líneas de código en tres semanas, un hito de escala sin precedentes en la automatización.

El proyecto, que aún requiere un matemático en el bucle de retroalimentación, demuestra el potencial de estas herramientas para expandir y comprimir el conocimiento matemático de forma verificable, invitando a la comunidad a participar en esta visión futura.

Readings shared October 26, 2025

The readings shared in Bluesky on 26 October 2025 are:

Readings shared October 25, 2025

The readings shared in Bluesky on 25 October 2025 are:

Readings shared October 22, 2025

The readings shared in Bluesky on 22 October 2025 are:

Una refutación inusual del problema de Erdős

Terence Tao ha comentado en Mastodon otro ejemplo interesante de la asistencia informática en matemáticas, que involucra nuevamente a los problemas de Erdös: el Problema #707, anteriormente marcado como "abierto", ahora está "refutado" - con la refutación formalizada en Lean. Pero el camino hacia esa refutación fue bastante inusual, y no encajaba perfectamente en ninguna de las narrativas estándar sobre la IA en las matemáticas.

La refutación inicial fue obra de humanos usando argumentos convencionales, sin ayuda inicial de LLMs. Sin embargo, descubrieron después que el problema ya había sido resuelto tres décadas antes por Hall, un hallazgo que las búsquedas bibliográficas humanas y asistidas por IA no detectaron. Para formalizar su prueba en Lean, los autores, sin experiencia previa, usaron ChatGPT en un proceso de "codificación por vibraciones", logrando generar unas 3000 líneas de código verificadas. Este proceso incluso permitió corregir un error en la formalización original del problema.

Este caso ilustra un uso muy específico y responsable de la IA: no para generar ideas matemáticas, sino para asistir en la creación de código formal verificable. La formalización complementa, pero no reemplaza, la prueba humana central. Debido a su contribución crucial en esta etapa, tanto ChatGPT como Lean aparecen como coautores del artículo, destacando un modelo inusual de colaboración humano-IA.

Readings shared October 21, 2025

The readings shared in Bluesky on 21 October 2025 are:

Readings shared October 20, 2025

The readings shared in Bluesky on 20 October 2025 are:

Readings shared October 18, 2025

The readings shared in Bluesky on 18 October 2025 are:

Reseña de «Ax-Prover: A deep reasoning agentic framework for theorem proving in mathematics and quantum physics»

En el artículo «Ax-Prover: A deep reasoning agentic framework for theorem proving in mathematics and quantum physics» se presenta Ax-Prover, un sistema que combina modelos de lenguaje generales con el asistente de pruebas Lean. Este enfoque supera las limitaciones de los demostradores especializados, ofreciendo una solución más flexible y accesible para la verificación de teoremas.

La evaluación en dominios como álgebra abstracta y física cuántica demuestra que Ax-Prover supera significativamente a los modelos especializados. Además, probó su utilidad práctica al colaborar con un matemático en la verificación de un teorema complejo, completando el proceso en solo dos días e identificando un error en la prueba original.

Readings shared October 17, 2025

The readings shared in Bluesky on 17 October 2025 are:

Readings shared October 16, 2025

The readings shared in Bluesky on 16 October 2025 are:

Readings shared October 15, 2025

The readings shared in Bluesky on 15 October 2025 are:

Readings shared October 14, 2025

The readings shared in Bluesky on 14 October 2025 are:

Readings shared October 13, 2025

The readings shared in Bluesky on 13 October 2025 are:

Readings shared October 10, 2025

The readings shared in Bluesky on 10 October 2025 are:

Reseña de «Mathematicians’ new best friend?»

En el artículo «Mathematicians’ new best friend?», se analiza el impacto transformador de la inteligencia artificial en las matemáticas, a partir de una mesa redonda celebrada durante el 12º Foro de Laureados de Heidelberg, un encuentro internacional que reúne a jóvenes investigadores y destacados científicos. En este contexto, expertos debatieron cómo la IA ya acelera la resolución de problemas abiertos y podría incluso superar la creatividad humana en tareas como la formulación de conjeturas, lo que genera preocupación sobre el futuro del trabajo matemático. Aunque algunos comparan este cambio con actividades como el ajedrez —donde los humanos siguen participando pese a la superioridad de las máquinas—, otros subrayan que la comunidad matemática aún tiene la responsabilidad de guiar la integración de la IA para preservar el valor humano de la intuición, la interpretación y la creatividad en la disciplina.

Readings shared October 7, 2025

The readings shared in Bluesky on 7 October 2025 are:

Readings shared October 6, 2025

The readings shared in Bluesky on 6 October 2025 are:

Readings shared October 4, 2025

The readings shared in Bluesky on 4 October 2025 are:

Readings shared October 03, 2025

The readings shared in Bluesky on 03 October 2025 are:

Readings shared October 01, 2025

The readings shared in Bluesky on 01 October 2025 are:

Readings shared September 29, 2025

The readings shared in Bluesky on 29 September 2025 are:

Readings shared September 28, 2025

The readings shared in Bluesky on 28 September 2025 are:

Readings shared September 23, 2025

The readings shared in Bluesky on 23 September 2025 are:

Readings shared September 22, 2025

The readings shared in Bluesky on 22 September 2025 are:

Readings shared September 20, 2025

The readings shared in Bluesky on 20 September 2025 are:

Readings shared September 19, 2025

The readings shared in Bluesky on 19 September 2025 are:

Readings shared September 18, 2025

The readings shared in Bluesky on 18 September 2025 are:

Reseña de «Claude can (sometimes) prove it»

El artículo «Claude can (sometimes) prove it» comenta que Claude Code, el agente de IA de Anthropic, posee una capacidad sorprendente para la demostración interactiva de teoremas (ITP) en Lean, un campo reservado hasta ahora a expertos. Aunque no es totalmente autónomo y requiere supervisión humana para actuar como "gestor del proyecto", el agente puede descomponer tareas complejas, escribir definiciones, generar pruebas y refactorizar código. Su eficacia reside en la retroalimentación estricta de Lean, que le permite iterar y corregir errores. Pese a su lentitud y a algunos fallos conceptuales, supone un avance radical: acerca la verificación formal, antes prohibitiva por su complejidad, a un futuro donde podría ser accesible y automatizada.

Readings shared September 17, 2025

The readings shared in Bluesky on 17 September 2025 are:

Readings shared September 12, 2025

The readings shared in Bluesky on 12 September 2025 are

Readings shared September 11, 2025

The readings shared in Bluesky on 11 September 2025 are

Readings shared September 10, 2025

The readings shared in Bluesky on 10 September 2025 are

Readings shared September 9, 2025

The readings shared in Bluesky on 9 September 2025 are

Readings shared September 5, 2025

The readings shared in Bluesky on 5 September 2025 are

Readings shared September 4, 2025

The readings shared in Bluesky on 4 September 2025 are

Readings shared September 3, 2025

The readings shared in Bluesky on 3 September 2025 are

Readings shared September 1, 2025

The readings shared in Bluesky on 1 September 2025 are

Readings shared August 30, 2025

The readings shared in Bluesky on 30 August 2025 are

Readings shared August 29, 2025

The readings shared in Bluesky on 29 August 2025 are

Readings shared August 28, 2025

The readings shared in Bluesky on 28 August 2025 are

Readings shared August 26, 2025

The readings shared in Bluesky on 26 August 2025 are

Readings shared August 25, 2025

The readings shared in Bluesky on 25 August 2025 are

Readings shared August 24, 2025

The readings shared in Bluesky on 24 August 2025 are

Readings shared August 22, 2025

The readings shared in Bluesky on 22 August 2025 are

Readings shared August 20, 2025

The readings shared in Bluesky on 20 August 2025 are

Readings shared August 18, 2025

The readings shared in Bluesky on 18 August 2025 are

Readings shared August 17, 2025

The readings shared in Bluesky on 17 August 2025 are

Readings shared August 15, 2025

The readings shared in Bluesky on 15 August 2025 are

HaLLMos (IA para aprender a escribir demostraciones matemáticas)

HaLLMos es un sistema de inteligencia artificial gratuito diseñado para ayudar en la redacción de pruebas matemáticas de nivel básico. El sistema revisa borradores, identifica lagunas en el razonamiento y facilita el proceso de iteración sin revelar directamente la respuesta.

Es completamente gratuito, funciona desde el navegador web y no requiere crear una cuenta. Los usuarios pueden elegir entre ejercicios introductorios para aprender técnicas de demostración o utilizar el espacio de pruebas libre para trabajar con sus propios problemas.

Readings shared August 14, 2025

The readings shared in Bluesky on 14 August 2025 are

Readings shared August 13, 2025

The readings shared in Bluesky on 13 August 2025 are

Reseña de «The Infinity Project (How to use AI and mathematics to prove and improve science and security)»

En el artículo «The Infinity Project (How to use AI and mathematics to prove and improve science and security)» se propone invertir 112,5 MUSD en un concurso entre institutos de matemáticas para formalizar el conocimiento matemático en programas verificables. Con IA y lenguajes como Lean, se busca traducir y validar pruebas, democratizando el acceso a las matemáticas.

El objetivo es aplicar esta infraestructura para aumentar el rigor científico y reforzar la ciberseguridad. Formalizar teorías y procesos permitiría optimizar la investigación, prevenir fallos en sistemas críticos y reducir vulnerabilidades, con beneficios económicos y sociales significativos.

El plan incluye crear una amplia biblioteca matemática, entrenar IA para generar nuevo conocimiento útil y mostrar aplicaciones prácticas. Se plantea una colaboración entre academia, industria y gobiernos, con el potencial de abrir nuevas industrias y transformar ciencia, tecnología y seguridad.

Readings shared August 9, 2025

The readings shared in Bluesky on 9 August 2025 are

Readings shared August 10, 2025

The readings shared in Bluesky on 10 August 2025 are

Readings shared August 8, 2025

The readings shared in Bluesky on 8 August 2025 are

Readings shared August 6, 2025

The readings shared in Bluesky on 6 August 2025 are

Readings shared August 5, 2025

The readings shared in Bluesky on 5 August 2025 are

Reseña de «AI at IMO 2025: a round-up»

En el artículo «AI at IMO 2025: a round-up», Kevin Buzzard (medalla de oro en la IMO de 1987), analiza cómo sistemas de IA como Gemini (Google) y modelos de OpenAI lograron puntuaciones de "medalla de oro" en la Olimpiada Internacional de Matemáticas (IMO), resolviendo 5 de 6 problemas. Sin embargo, la falta de reglas claras para evaluar a la IA generó controversia, ya que las empresas marcaron sus propias soluciones sin verificación independiente. Aunque el avance es notable, el autor critica el sensacionalismo y advierte que estos resultados aún distan de la investigación matemática actual.

Readings shared August 2, 2025

The readings shared in Bluesky on 2 August 2025 are

Readings shared August 1, 2025

The readings shared in Bluesky on 1 August 2025 are

Reseña de «The math is haunted»

El artículo «The math is haunted» ofrece una introducción muy accesible a la formalización matemática con Lean, dirigida especialmente a matemáticos. Comienza con un ejemplo sencillo y lo utiliza como punto de partida para explorar conceptos clave como axiomas, tácticas de demostración y la estructura lógica detrás de Lean.

A través de ejemplos didácticos (e incluso jugando con un axioma fantasioso como "2 = 3"), el texto ilustra cómo Lean verifica pruebas de manera rigurosa, destacando su potencial para codificar y validar el conocimiento matemático. Además, menciona proyectos ambiciosos, como la formalización del Último Teorema de Fermat, subrayando el papel de Lean en la matemática moderna.

Una lectura recomendable para quienes busquen una aproximación intuitiva a la formalización sin perder de vista su profundidad teórica.

Readings shared July 31, 2025

The readings shared in Bluesky on 31 July 2025 are

Readings shared July 29, 2025

The readings shared in Bluesky on 29 July 2025 are

Readings shared July 28, 2025

The readings shared in Bluesky on 28 July 2025 are

Readings shared July 27, 2025

The readings shared in Bluesky on 27 July 2025 are

Reseña de «Solving formal math problems by decomposition and iterative reflection»

El artículo «Solving formal math problems by decomposition and iterative reflection» presenta Delta Prover, un nuevo sistema que resuelve problemas matemáticos complejos. Este agente utiliza un LLM que interactúa con el asistente de pruebas Lean 4. Mediante una descomposición de problemas y una reparación iterativa de las pruebas, el sistema aprende de los errores para construir demostraciones verificables. Alcanza un rendimiento del 95.9% de éxito en los problemas de miniF2F, superando a otros métodos sin necesitar un costoso reentrenamiento del modelo.

Readings shared July 26, 2025

The readings shared in Bluesky on 26 July 2025 are

Readings shared July 25, 2025

The readings shared in Bluesky on 25 July 2025 are

Readings shared July 24, 2025

The readings shared in Bluesky on 24 July 2025 are