Ir al contenido principal

Readings shared September 17, 2025

The readings shared in Bluesky on 17 September 2025 are:

Readings shared September 12, 2025

The readings shared in Bluesky on 12 September 2025 are

Readings shared September 11, 2025

The readings shared in Bluesky on 11 September 2025 are

Readings shared September 10, 2025

The readings shared in Bluesky on 10 September 2025 are

Readings shared September 9, 2025

The readings shared in Bluesky on 9 September 2025 are

Readings shared September 5, 2025

The readings shared in Bluesky on 5 September 2025 are

Readings shared September 4, 2025

The readings shared in Bluesky on 4 September 2025 are

Readings shared September 3, 2025

The readings shared in Bluesky on 3 September 2025 are

Readings shared September 1, 2025

The readings shared in Bluesky on 1 September 2025 are

Readings shared August 30, 2025

The readings shared in Bluesky on 30 August 2025 are

Readings shared August 29, 2025

The readings shared in Bluesky on 29 August 2025 are

Readings shared August 28, 2025

The readings shared in Bluesky on 28 August 2025 are

Readings shared August 26, 2025

The readings shared in Bluesky on 26 August 2025 are

Readings shared August 25, 2025

The readings shared in Bluesky on 25 August 2025 are

Readings shared August 24, 2025

The readings shared in Bluesky on 24 August 2025 are

Readings shared August 22, 2025

The readings shared in Bluesky on 22 August 2025 are

Readings shared August 20, 2025

The readings shared in Bluesky on 20 August 2025 are

Readings shared August 18, 2025

The readings shared in Bluesky on 18 August 2025 are

Readings shared August 17, 2025

The readings shared in Bluesky on 17 August 2025 are

Readings shared August 15, 2025

The readings shared in Bluesky on 15 August 2025 are

HaLLMos (IA para aprender a escribir demostraciones matemáticas)

HaLLMos es un sistema de inteligencia artificial gratuito diseñado para ayudar en la redacción de pruebas matemáticas de nivel básico. El sistema revisa borradores, identifica lagunas en el razonamiento y facilita el proceso de iteración sin revelar directamente la respuesta.

Es completamente gratuito, funciona desde el navegador web y no requiere crear una cuenta. Los usuarios pueden elegir entre ejercicios introductorios para aprender técnicas de demostración o utilizar el espacio de pruebas libre para trabajar con sus propios problemas.

Readings shared August 14, 2025

The readings shared in Bluesky on 14 August 2025 are

Readings shared August 13, 2025

The readings shared in Bluesky on 13 August 2025 are

Reseña de «The Infinity Project (How to use AI and mathematics to prove and improve science and security)»

En el artículo «The Infinity Project (How to use AI and mathematics to prove and improve science and security)» se propone invertir 112,5 MUSD en un concurso entre institutos de matemáticas para formalizar el conocimiento matemático en programas verificables. Con IA y lenguajes como Lean, se busca traducir y validar pruebas, democratizando el acceso a las matemáticas.

El objetivo es aplicar esta infraestructura para aumentar el rigor científico y reforzar la ciberseguridad. Formalizar teorías y procesos permitiría optimizar la investigación, prevenir fallos en sistemas críticos y reducir vulnerabilidades, con beneficios económicos y sociales significativos.

El plan incluye crear una amplia biblioteca matemática, entrenar IA para generar nuevo conocimiento útil y mostrar aplicaciones prácticas. Se plantea una colaboración entre academia, industria y gobiernos, con el potencial de abrir nuevas industrias y transformar ciencia, tecnología y seguridad.

Readings shared August 9, 2025

The readings shared in Bluesky on 9 August 2025 are

Readings shared August 10, 2025

The readings shared in Bluesky on 10 August 2025 are

Readings shared August 8, 2025

The readings shared in Bluesky on 8 August 2025 are

Readings shared August 6, 2025

The readings shared in Bluesky on 6 August 2025 are

Readings shared August 5, 2025

The readings shared in Bluesky on 5 August 2025 are

Readings shared August 2, 2025

The readings shared in Bluesky on 2 August 2025 are

Readings shared August 1, 2025

The readings shared in Bluesky on 1 August 2025 are

Readings shared July 31, 2025

The readings shared in Bluesky on 31 July 2025 are

Readings shared July 29, 2025

The readings shared in Bluesky on 29 July 2025 are

Readings shared July 28, 2025

The readings shared in Bluesky on 28 July 2025 are

Readings shared July 27, 2025

The readings shared in Bluesky on 27 July 2025 are

Reseña de «Solving formal math problems by decomposition and iterative reflection»

El artículo «Solving formal math problems by decomposition and iterative reflection» presenta Delta Prover, un nuevo sistema que resuelve problemas matemáticos complejos. Este agente utiliza un LLM que interactúa con el asistente de pruebas Lean 4. Mediante una descomposición de problemas y una reparación iterativa de las pruebas, el sistema aprende de los errores para construir demostraciones verificables. Alcanza un rendimiento del 95.9% de éxito en los problemas de miniF2F, superando a otros métodos sin necesitar un costoso reentrenamiento del modelo.

Readings shared July 26, 2025

The readings shared in Bluesky on 26 July 2025 are

Readings shared July 25, 2025

The readings shared in Bluesky on 25 July 2025 are

Readings shared July 24, 2025

The readings shared in Bluesky on 24 July 2025 are

Readings shared July 22, 2025

The readings shared in Bluesky on 22 July 2025 are

Readings shared July 18, 2025

The readings shared in Bluesky on 18 July 2025 are

Readings shared July 18, 2025

The readings shared in Bluesky on 18 July 2025 are

Readings shared July 17, 2025

The readings shared in Bluesky on 17 July 2025 are

Readings shared July 16, 2025

The readings shared in Bluesky on 16 July 2025 are

Readings shared July 15, 2025

The readings shared in Bluesky on 15 July 2025 are

Readings shared July 14, 2025

The readings shared in Bluesky on 14 July 2025 are

Readings shared July 12, 2025

The readings shared in Bluesky on 12 July 2025 are

Readings shared July 11, 2025

The readings shared in Bluesky on 11 July 2025 are

Readings shared July 9, 2025

The readings shared in Bluesky on 9 July 2025 are

Readings shared July 7, 2025

The readings shared in Bluesky on 7 July 2025 are

Readings shared July 5, 2025

The readings shared in Bluesky on 5 July 2025 are

Readings shared July 4, 2025

The readings shared in Bluesky on 4 July 2025 are

Reseña de «LeanConjecturer: Automatic generation of mathematical conjectures for theorem proving»

El campo de la demostración automática de teoremas se enfrenta a un obstáculo fundamental: a pesar del enorme potencial de los modelos de lenguaje para el razonamiento matemático, su progreso se ve frenado por la drástica escasez de datos de entrenamiento formales y de alta calidad. A diferencia de los vastos corpus de texto general, las bibliotecas matemáticas como Mathlib son relativamente pequeñas, lo que limita la capacidad de estos sistemas para aprender y mejorar.

Para resolver este desafío, en el artículo LeanConjecturer: Automatic generation of mathematical conjectures for theorem proving se presenta una innovadora metodología para generar nuevas conjeturas de manera automática. El sistema adopta un enfoque híbrido: primero, extrae el contexto matemático (definiciones, variables) de un archivo de Lean existente, y luego utiliza un modelo de lenguaje exclusivamente para la tarea creativa de proponer nuevos enunciados de teoremas. Estas propuestas se someten a un proceso de filtrado iterativo para garantizar que sean sintácticamente correctas, novedosas y no triviales, alimentando las conjeturas válidas de nuevo al sistema para inspirar generaciones futuras cada vez más complejas.

El resultado es un éxito rotundo: el sistema no solo logra generar miles de conjeturas válidas y desafiantes, sino que demuestra su utilidad práctica al ser utilizadas para entrenar y mejorar el rendimiento de un demostrador de teoremas de vanguardia. Más allá de simplemente crear datos, LeanConjecturer fue capaz de formular y verificar teoremas genuinamente interesantes en el campo de la topología, estableciendo nuevas conexiones entre conceptos matemáticos. Con ello, el proyecto no solo ofrece una solución escalable al problema de la escasez de datos, sino que también abre una prometedora vía hacia la colaboración entre humanos y máquinas en el descubrimiento de nuevas matemáticas.

Readings shared July 1, 2025

The readings shared in Bluesky on 1 July 2025 are

Reseña de «Diophantine equations over Z: Universal bounds and parallel formalization»

Ayer se publicó un artículo que muestra el uso de la formalización con Isabelle en el desarrollo de la investigación matemática. Su título es Diophantine equations over Z: Universal bounds and parallel formalization y en sus conclusiones dice:

Nuestro proyecto demuestra que formalizar matemáticas altamente técnicas puede brindar beneficios reales, corrigiendo muchos errores mientras mejora la claridad y fiabilidad. El tiempo y esfuerzo adicional requeridos no pueden ignorarse, pero quedan compensados por las ventajas aquí expuestas.

En retrospectiva, identificamos dos factores clave que contribuyeron al éxito de este proyecto. En primer lugar, fue crucial apoyarnos en nuestra experiencia previa formalizando el ya consolidado teorema DPRM para tomar decisiones importantes en este proyecto. A quienes estén interesados en formalizar sus matemáticas, les recomendamos comenzar con un proyecto más pequeño cuyo objetivo sea formalizar un teorema ya establecido. En segundo lugar, fue de gran ayuda contar con un equipo interdisciplinario de personas con distintas habilidades. En nuestro caso, esto incluyó tanto a matemáticos puros como a informáticos, y fue su esfuerzo conjunto lo que permitió tender un puente desde las pruebas en lenguaje natural hasta el metalenguaje en el que está programado el propio Isabelle.

Fomentar que los matemáticos integren asistentes de prueba en su flujo de trabajo ahora ayudará a moldear el desarrollo de herramientas mejores, haciendo que la formalización en sistemas como Isabelle o Lean llegue a ser tan fluida como escribir en LaTeX. Esto se ve reforzado por los recientes avances en IA, que sugieren que pronto podrían surgir potentes herramientas de automatización para la formalización. Al formalizar las matemáticas ahora, aseguramos que nuestros campos se beneficien de la IA y la automatización a medida que estas herramientas evolucionen.

Readings shared June 30, 2025

The readings shared in Bluesky on 30 June 2025 are

Readings shared June 29, 2025

The readings shared in Bluesky on 29 June 2025 are

Readings shared June 28, 2025

The readings shared in Bluesky on 28 June 2025 are

Readings shared June 27, 2025

The readings shared in Bluesky on 27 June 2025 are

Readings shared June 26, 2025

The readings shared in Bluesky on 26 June 2025 are

Readings shared June 23, 2025

The readings shared in Bluesky on 23 June 2025 are

Readings shared June 22, 2025

The readings shared in Bluesky on 22 June 2025 are

Readings shared June 21, 2025

The readings shared in Bluesky on 21 June 2025 are

Lean obtiene el prestigioso «SIGPLAN Programming Languages Software Award 2025»

El demostrador de teoremas Lean ha sido galardonado con el «SIGPLAN Programming Languages Software Award 2025», otorgado por ACM SIGPLAN (Special Interest Group on Programming Languages de la ACM (Association for Computing Machinery).

La cita del premio destaca lo siguiente:

El demostrador de teoremas Lean constituye un sistema informático extraordinario. Fundamentado en sólidas bases teóricas y de ingeniería, Lean ha ejercido y continúa ejerciendo un amplio impacto tanto en la práctica industrial como en la investigación científica.

El proyecto Lean ha generado un impacto particularmente significativo en tres áreas clave: matemáticas, verificación de hardware y software, e inteligencia artificial. En el ámbito matemático, ha logrado una aceptación considerable dentro de la comunidad académica, evidenciada por el desarrollo de Mathlib, una biblioteca creada por usuarios que supera las 1.8 millones de líneas de código.

La credibilidad del sistema se ha consolidado mediante la verificación exitosa de resultados fundamentales, incluyendo Liquid Tensor Experiment (propuesto por el medallista Fields Peter Scholze) y la verificación de la conjetura polinomial de Freiman-Ruzsa dirigida por el medallista Fields Terence Tao. Estos logros han proporcionado al sistema un reconocimiento sin precedentes en la comunidad científica internacional.

Es indiscutible que los métodos formales basados en Lean ocuparán una posición central en el desarrollo de las matemáticas durante los próximos años. Paralelamente, el sistema ha demostrado su valor práctico en proyectos industriales de verificación críticos, tales como la verificación del lenguaje de control de acceso Cedar en Amazon Web Services, la validación del muestreador SampCert para privacidad diferencial (también en AWS), y diversos proyectos de verificación blockchain en empresas líderes como StarkWare y Nethermind.

Finalmente, el éxito de iniciativas como AlphaProof de DeepMind y la adopción estratégica de Lean por parte de empresas emergentes como Harmonic han consolidado su posición como la solución de referencia para sistemas de razonamiento matemático potenciados por inteligencia artificial.

Readings shared June 19, 2025

The readings shared in Bluesky on 19 June 2025 are

Reseña de «Can A.I. quicken the pace of math discovery?»

El artículo «Can A.I. quicken the pace of math discovery?» presenta la iniciativa "Exponentiating Mathematics" de DARPA. Su objetivo es desarrollar una IA como coautor para acelerar la investigación en matemáticas.

El programa confronta limitaciones de los LLMs actuales. Estos fallan en razonamiento lógico-matemático y generan "alucinaciones". La solución propuesta integra IA con asistentes de prueba formales como Lean.

Lean desempeña el papel central como verificador. Los LLMs generan pruebas formales que Lean acepta o rechaza según su corrección. Esta iteración crea un ciclo de refinamiento continuo. Su lenguaje específico resulta arduo, pero su metodología es fundamental. La verificación formal garantiza corrección absoluta y elimina alucinaciones de LLMs generativos.

La meta es crear IA que sugiera ideas y construya pruebas verificadas. Los sistemas formales garantizan fiabilidad absoluta. Esto transforma herramientas actuales en colaboradores matemáticos confiables.

Readings shared June 17, 2025

The readings shared in Bluesky on 17 June 2025 are

Readings shared June 16, 2025

The readings shared in Bluesky on 16 June 2025 are

Readings shared June 15, 2025

The readings shared in Bluesky on 15 June 2025 are

Reseña de «Hablemos de Lisp»

El vídeo «Hablemos de Lisp» presenta un diálogo que explora la historia, conceptos fundamentales y legado duradero del lenguaje de programación Lisp. El análisis comienza con una perspectiva histórica rigurosa, desmitificando la creencia común de que fue el primer lenguaje funcional. En su lugar, identifica al IPL (Information Processing Language) de Herbert Simon y Allen Newell como su precursor fundamental.

Contexto histórico y pioneros

El vídeo establece una distinción crucial entre los diferentes pioneros de la inteligencia artificial: mientras que Simon y Newell sentaron las bases conceptuales del campo, John McCarthy acuñó el término "inteligencia artificial" y creó LISP, inspirado precisamente por las capacidades de procesamiento de listas que había demostrado IPL.

La naturaleza funcional de LISP

Respecto al paradigma funcional, el análisis revela que LISP, en sus primeras etapas, no cumplía estrictamente con los principios de la programación funcional moderna, como la inmutabilidad y la gestión explícita de efectos secundarios. La formalización teórica de este paradigma se atribuye posteriormente a la familia de lenguajes ISWIM, propuesta por Peter Landin.

Evolución técnica y conceptual

La génesis de la implementación de LISP se sigue de FLPL (Fortran Lisp Processing Language), un lenguaje intermedio que resultó fundamental por introducir la expresión condicional, una construcción sintáctica que más tarde sería adoptada ampliamente por lenguajes imperativos.

El momento decisivo: concepto versus implementación

Una de las discusiones más reveladoras del vídeo aborda la distinción entre el concepto original de LISP (1959) y su primera implementación (1960). McCarthy había concebido inicialmente una sintaxis de alto nivel (M-expresión) que se compilaría a una representación simbólica intermedia (S-expresión). Sin embargo, el éxito de la implementación de la función eval puso de manifiesto la profunda simetría entre código y datos —la homoiconicidad— inherente a la S-expresión.

Esta propiedad fundamental resultó tan poderosa que llevó al abandono de la M-expresión, convirtiendo la sintaxis intermedia en el lenguaje de programación definitivo.

Legado e influencia contemporánea

El vídeo concluye evaluando el legado perdurable de LISP en la ciencia de la computación. Se le atribuye la introducción de conceptos fundamentales como la expresión condicional y la recolección automática de basura (garbage collection). Su relevancia actual se manifiesta a través de sus numerosos dialectos modernos, destacando Common Lisp, Scheme, Clojure y Racket, que continúan explorando y expandiendo los principios originales del lenguaje.

Reseña de «Hardest problems in mathematics, physics & the future of AI»

En la entrevista "Hardest problems in mathematics, physics & the future of AI", Terence Tao comparte sus reflexiones sobre diversos problemas fundamentales sin resolver en análisis y teoría de números, examina la metodología de la investigación matemática contemporánea y analiza el papel emergente que desempeñan la verificación formal y la inteligencia artificial en la disciplina.

Problemas fundamentales y sus complejidades intrínsecas

Tao examina varios problemas que se encuentran en la frontera del conocimiento matemático actual. En análisis, dedica especial atención al problema de Kakeya, destacando sus profundas conexiones con el análisis armónico y las ecuaciones en derivadas parciales. Su análisis revela cómo este problema aparentemente geométrico se entrelaza con áreas fundamentales del análisis moderno.

Respecto al problema de la regularidad de Navier-Stokes, Tao identifica la "supercriticalidad" como el obstáculo central que impide su resolución. De manera particularmente innovadora, describe su construcción teórica de un análogo fluídico de una máquina de von Neumann, presentándola como una estrategia prometedora para demostrar la existencia de explosiones en tiempo finito (blowup) en las soluciones de estas ecuaciones.

Desafíos en teoría de números

En el ámbito de la teoría de números, Tao analiza la conjetura de los primos gemelos, atribuyendo su persistente dificultad a la extrema fragilidad del patrón subyacente. Explica cómo este patrón podría ser destruido por "conspiraciones" matemáticas imperceptibles para los métodos estadísticos tradicionales. Esta fragilidad contrasta marcadamente con la robustez inherente de las progresiones aritméticas, como las estudiadas en el teorema de Green-Tao.

Un concepto clave que emerge de su análisis es el problema de la paridad*, que identifica como un obstáculo metodológico fundamental en teoría de números. En cuanto a la hipótesis de Riemann, Tao la considera aún más inaccesible a los métodos actuales, situándola en una categoría propia de dificultad.

Marco filosófico y metodológico

Un hilo conductor de la entrevista es la exploración de la dicotomía entre estructura y aleatoriedad, un tema que permea múltiples áreas de las matemáticas. Esta perspectiva filosófica informa tanto el análisis de problemas específicos como la comprensión general de los fenómenos matemáticos.

Metodológicamente, Tao defiende un enfoque de simplificación estratégica en la resolución de problemas. Su estrategia consiste en descomponer problemas complejos en dificultades individuales, abordar cada una por separado, y posteriormente integrar las soluciones. Este método refleja una filosofía pragmática que prioriza la claridad conceptual y el progreso incremental.

Transformación tecnológica de las matemáticas

Una porción sustancial de la discusión se centra en el impacto transformador de la prueba asistida por ordenador, con particular énfasis en el asistente de pruebas Lean. Tao ilustra su potencial a través de su "Equational theories project" de clasificación de 22 millones de identidades algebraicas, demostrando cómo estas herramientas facilitan la colaboración a gran escala y la gestión de la complejidad en pruebas matemáticas modernas.

Sus predicciones sobre el futuro son especialmente significativas: anticipa que las herramientas de inteligencia artificial revolucionarán la formalización matemática. Más ambiciosamente, prevé que la IA podría generar conjeturas matemáticas genuinamente novedosas al identificar conexiones profundas entre campos aparentemente dispares.

Síntesis y perspectiva

La entrevista proporciona una ventana excepcional al proceso intelectual de uno de los matemáticos más influyentes de nuestra época. Tao logra equilibrar la precisión técnica con la accesibilidad conceptual, ofreciendo tanto análisis detallados de problemas específicos como reflexiones más amplias sobre la naturaleza de la investigación matemática.

Su visión integra consideraciones técnicas, marcos filosóficos y prospectivas tecnológicas, presentando una imagen completa de las matemáticas como disciplina en constante evolución. La entrevista destaca no solo los desafíos actuales, sino también las herramientas emergentes que podrían redefinir fundamentalmente cómo se desarrollarán las matemáticas en el futuro.

Readings shared June 14, 2025

The readings shared in Bluesky on 14 June 2025 are

Readings shared June 13, 2025

The readings shared in Bluesky on 13 June 2025 are

Reseña de «Mathesis: Towards formal theorem proving from natural languages»

En el artículo «Mathesis: Towards formal theorem proving from natural languages», se aborda la limitación clave de los demostradores de teoremas: su dependencia de enunciados ya formalizados. El trabajo se centra en el paso crítico de la 'autoformalización' —la traducción a un lenguaje formal como Lean 4— y presenta Mathesis, un sistema integral diseñado para automatizar todo el proceso.

El sistema introduce un Mathesis-Autoformalizer entrenado mediante aprendizaje por refuerzo para optimizar la traducción a código Lean. Su rendimiento se evalúa con LeanScorer, y se pone a prueba en Gaokao-Formal, un nuevo y exigente banco de pruebas. Finalmente, Mathesis-Prover genera la demostración completa en Lean, asegurando que la prueba final sea verificable.

Los resultados demuestran que Mathesis alcanza un rendimiento de vanguardia en varios bancos de prueba. El análisis revela una conclusión crucial: las mejoras en la autoformalización impactan el éxito final mucho más que las mejoras en el demostrador. Esto se explica porque si el problema se traduce incorrectamente a código Lean, el demostrador recibe una tarea mal planteada y no puede generar una prueba válida, sin importar su potencia. El trabajo confirma así que una traducción inicial de alta calidad es el factor más determinante para el éxito del proceso.

Reseña de «MATP-BENCH: Can MLLM be a good automated theorem prover for multimodal problems?»

En el artículo «MATP-BENCH: Can MLLM be a good automated theorem prover for multimodal problems?», los autores investigan la aplicabilidad de los modelos de lenguaje grandes multimodales (MLLMs) al problema de la demostración automática de teoremas que involucran componentes tanto textuales como visuales. Motivados por las limitaciones de los enfoques puramente textuales en dominios como la geometría, donde los diagramas constituyen información esencial, desarrollan un marco de evaluación sistemático para esta clase de problemas.

La contribución principal consiste en la construcción de MATP-BENCH, un conjunto de datos que contiene más de 1000 problemas matemáticos multimodales formalizados en tres asistentes de demostración: Lean 4, Coq e Isabelle/HOL. El corpus abarca problemas de complejidad variable, desde el nivel de secundaria hasta competiciones matemáticas avanzadas, proporcionando así un banco de pruebas comprehensivo para evaluar capacidades de razonamiento multimodal.

Los experimentos incluyen seis modelos representativos: tres con capacidades especializadas de razonamiento (OpenAI-o1, Claude-3.7-Sonnet-Thinking, Gemini-2.0-Flash-Thinking) y tres sin estas capacidades (GPT-4.1, Qwen2.5-VL-Instruct-70B, Llama3.2-Vision-Instruct-11B). Los resultados revelan que, si bien los modelos demuestran competencia en la comprensión de problemas y formalización de enunciados, exhiben deficiencias significativas en la construcción de cadenas de inferencia válidas.

El análisis establece que la principal limitación no radica en las capacidades de percepción visual sino en la insuficiencia del razonamiento simbólico formal. Los autores concluyen que los MLLMs actuales no constituyen demostradores automáticos efectivos para problemas multimodales, identificando la brecha entre comprensión multimodal y razonamiento lógico como el desafío fundamental a resolver.

MATP-BENCH se posiciona como el primer banco de prueba estándar para este dominio, proporcionando una base metodológica para la evaluación de futuros desarrollos en demostración automática multimodal.

Readings shared June 12, 2025

The readings shared in Bluesky on 12 June 2025 are

Readings shared June 11, 2025

The readings shared in Bluesky on 11 June 2025 are