「我预计,如果使用得当,到 2026 年,AI 将成为数学研究和许多其他领域值得信赖的合著者。」数学家陶哲轩在之前的一篇博客中说道。
陶哲轩这样说了,也这样做了。
他最近一直在用 GPT-4、Copilot、Lean 等工具进行数学研究,并且还在 AI 的帮助下发现了自己论文中的一处隐藏 bug。
最近,陶哲轩表示Lean4项目已经成功完成了对多项式 Freiman-Ruzsa 猜想(PFR)的证明的形式化,仅耗时三周。与此同时,Lean编译器也报告该猜想符合标准公理。这是计算机和AI辅助证明的一项巨大成功,令人振奋
关于上述研究的更多内容,感兴趣的读者可以参考《陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生》。
看到这,细心的读者可能已经发现了端倪,陶大神在进行数学研究时,多次都提到过 Lean。简单来讲,Lean 是一种可帮助数学家验证定理的编程语言,用户可以在其中编写和验证证明。相比初代 Lean,现在最新的 Lean 4 版本进行了多项优化,包括更快的编译器、改进的错误处理和更好的与外部工具集成的能力等。
在数学领域被广泛使用的 Lean,在大模型(LLM)刷屏的今天,两者有没有更好的结合方式呢?
现在已经有人实现了,开放平台 LeanDojo 团队(关于 LeanDojo,可参考「AI 大模型帮陶哲轩解题,还能证明数学定理了?」)和加州理工学院的研究者推出了 Lean Copilot,这是一款专为 LLM 与人类交互而设计的协作工具,旨在通过人机协作给出 100% 准确的形式化数学证明。
值得注意的是,LeanDojo 团队的研究主要集中在使用 LLM 自动化定理证明方面,从这点也不难看出,他们推出的 Lean Copilot 和 LLM 相关也不会令人吃惊。
项目地址:https://github.com/lean-dojo/LeanCopilot
对于这项研究,大家除了说 Cool,就是 very cool,评价还是很高的。
在 Lean 中使用 LLM,加快数学证明速度
一直以来,自动化定理证明面临重重困难,传统上,数学证明依赖于手工推导,需要细致的验证。现在随着 AI 的进步,研究者开始借助人工智能进行深入探索,但又免不了出现这种问题,即 LLM 在数学和推理任务中有时不是很靠谱,容易出现错误和幻觉。
Lean Copilot的功能是让用户可以在Lean中利用大型语言模型自动化证明过程,提高证明合成的速度。当需要时,用户还可以无缝地介入和修改,实现机器智能和人类智慧之间的平衡协作
使用Lean Copilot可以在Lean中使用LLM来实现证明自动化,包括策略建议、前提和搜索证明
用户可以选择使用LeanDojo提供的内置模型,或者导入自己的模型。这些模型可以在本地运行(无论是否有GPU),或者在云端运行
简而言之,Lean Copilot 为用户提供了一个灵活的方式,通过引入 LLM 来增强和优化在 Lean 中进行定理证明的过程。
Lean Copilot 的主要特点可总结为:
- LLM 能够提出证明步骤,搜索证明,并从大型数学库中选择有用的引理。
- Lean Copilot 可作为 Lean 包进行设置,并且能够无缝地在 Lean 的 VS Code 工作流中运行。
- 用户可以使用 LeanDojo 中的内置模型,或者使用自己的模型,这些模型可以在本地(有或没有 GPU)或云端运行。
- 该工具可在各种平台上运行,包括 Linux、macOS 和 Windows WSL。
为了使 LLM 更易于 Lean 用户使用,Lean Copilot 希望能够启动一个正反馈循环:证明自动化将带来更好的数据,并最终提高 LLM 在数学上的性能。
Copilot的效果演示
大家可以根据官方教程来配置 Lean Copilot,配置完成之后就可以开始实验了。项目的作者还提供了一些官方示例供参考
推荐方案。在导入LeanCopilot后,您可以使用suggest_tactics生成推荐方案。在使用过程中,您也可以点击推荐方案,并在证明中使用它(参考下图)
你可以使用一个前缀,比如simp,来限制生成的策略
搜索证明。使用search_proof将LLM生成的策略与aesop(Lean 4的白盒自动化项目)结合起来,以搜索多个策略证明。找到证明后,您可以单击该策略将其插入到编辑器中
重写后的内容:选择前提是一项重要策略。该策略的目的是检索一份潜在有用前提的清单。目前,Lean Copilot会利用LeanDojo中的检索工具,从Lean和mathlib4(即Lean 4数学库)的固定快照中选择前提
您可以运行LLM。无论是定理证明还是其他推理,都可以在Lean中运行LLM。您可以在本地或远程运行任何模型(请参阅自带模型)
项目中还提到了一些高级用法,感兴趣的读者,可以去原项目了解更多内容。
以上是陶哲轩采用大型模型的证明助手Lean,展现其偏爱的详细内容。更多信息请关注PHP中文网其他相关文章!

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。