hatGPT can provide original mathematical proofs, researchers show
by Frans Steenhoudt, Free University of Brussels
edited by Lisa Lock, reviewed by Robert Egan
Editors' notes
The GIST
Add as preferred source
ChatGPT peut fournir des démonstrations mathématiques originales, selon des chercheurs
Par Frans Steenhoudt, Université libre de Bruxelles
Édité par Lisa Lock, relu par Robert Egan
Notes de la rédaction
Le GIST
Ajouter comme source privilégiée
Crédit : Pixabay/CC0 Domaine public
Le laboratoire d'analyse de données de la VUB a publié de nouveaux résultats démontrant qu'il est possible de développer des démonstrations mathématiques originales à l'aide de modèles de langage commerciaux. Dans un article déposé sur le serveur de prépublications arXiv, les chercheurs montrent que ChatGPT-5.2 (Thinking), le modèle de langage commercial de grande taille d'OpenAI, peut résoudre de manière autonome un problème mathématique.
Explication de la conjecture et de la démonstration
Ce cas particulier concerne la démonstration d'une conjecture formulée en 2024 par les mathématiciens Ran et Teng. Une conjecture est une affirmation que l'on croit vraie en raison de nombreux exemples ou indices, mais pour laquelle aucune démonstration formelle n'existe encore. Les mathématiciens formulent souvent une telle conjecture après avoir découvert une régularité ou après de nombreux calculs aboutissant systématiquement au même résultat. Tant qu'aucune preuve concluante n'est fournie, elle demeure une conjecture ; dès qu'elle est démontrée, elle devient un théorème.
L'étude décrit comment sept sessions de chat avec ChatGPT et quatre versions de la démonstration ont permis d'obtenir la démonstration finale. ChatGPT s'est avéré particulièrement utile dans la recherche de cette démonstration, tandis que l'expertise humaine a été essentielle pour la vérification de l'exactitude et l'argumentation conclusive.
Quel a été le rôle réel de l'IA ?
Les auteurs montrent que ChatGPT-5.2 (Thinking) a largement élaboré la structure de la démonstration elle-même, avec une intervention humaine minimale. Comme le résume la brève description : « Avec le Laboratoire d'analyse de données, nous sommes parmi les premiers à démontrer qu'un LLM commercial peut développer de manière autonome des démonstrations mathématiques originales.»
« Je soupçonnais depuis longtemps que ChatGPT pouvait m'aider à résoudre des problèmes mathématiques non résolus », déclare Brecht Verbeken (chercheur postdoctoral au sein du groupe de recherche du Laboratoire d'analyse de données de la VUB). « Et pourtant, j'ai été surpris de l'efficacité avec laquelle cela a fonctionné. »
Validation intuitive et perspectives d'avenir
Les chercheurs situent leurs travaux dans le contexte plus large de ce qu'ils appellent la validation intuitive, une approche qui utilise des modèles de langage pour explorer et structurer le raisonnement théorique de haut niveau. La question centrale de la publication est de savoir si cette technique de validation intuitive connaîtra la même évolution rapide au cours de l'année à venir que celle observée précédemment dans la programmation assistée par l'IA (codage intuitif), où les systèmes sont passés d'outils à des générateurs de code quasi autonomes.
« On entend souvent dire que la créativité des systèmes se limite fondamentalement à la reformulation de leurs données d'entraînement », explique Vincent Ginis, professeur à la VUB (Laboratoire d'analyse de données). « Nous sommes heureux de pouvoir dissiper cette idée reçue grâce à nos travaux. »
Supervision humaine et impact de la recherche
Les auteurs soulignent que, même si le modèle a généré une part importante des données probantes, l'intervention humaine reste essentielle pour la vérification et la correction des lacunes formelles. Le processus offre un éclairage important sur les domaines où l'assistance des modèles de langage est réellement efficace et sur les points de blocage persistants en matière de vérification.
Cette avancée marque une étape importante dans le déploiement de l'IA au sein de la recherche théorique, non seulement comme aide à la programmation et à la production de textes, mais aussi comme outil pouvant contribuer à des découvertes mathématiques originales, à condition d'être associée à une supervision humaine et à un raisonnement critique. « La formulation de preuves candidates est désormais beaucoup plus rapide, mais le goulot d'étranglement devient alors la vérification humaine. Cela prend du temps. Mais les modèles de langage nous seront également utiles à cet égard », conclut Andres Algaba, professeur à la VUB (Laboratoire d'analyse de données V).
XXXXXXXXXXXXXX
RESUME
ChatGPT peut fournir des démonstrations mathématiques originales, selon des chercheurs.
Des modèles de langage commerciaux tels que ChatGPT-5.2 peuvent générer de manière autonome des démonstrations mathématiques originales, comme l'a démontré la résolution d'une conjecture de 2024. L'IA a développé la majeure partie de la structure de la démonstration avec une intervention humaine minimale, bien que la supervision d'experts soit restée essentielle pour la vérification. Cette approche, appelée « démonstration intuitive », met en lumière le potentiel de l'IA dans la recherche théorique, tandis que la validation humaine demeure indispensable
XXXXXXXXXXX
COMMENTAIRES
Bravo!Mais attention .....!
L'IA est en train actuellement d 'envahir tous les aspects de la societé!! Faudra -t- apprendre a s en servir dés l'école primaire !!!!!?????
Je m 'interroge mais je ne suis pas le seul !!
Cf GOOGLE/
1/''
L’IA générative face aux attaques i....''
2/IA : Une menace pour 5 millions d'emplois en France - RMC
RMC
https://rmc.bfmt ETC
XXXXXXXXXXXX
XPublication details
Brecht Verbeken et al, Early Evidence of Vibe-Proving with Consumer LLMs: A Case Study on Spectral Region Characterization with ChatGPT-5.2 (Thinking), arXiv (2026). DOI: 10.48550/arxiv.2602.18918
Journal information: arXiv
Provided by Free University of Brussels
Aucun commentaire:
Enregistrer un commentaire