搜索
首页科技周边人工智能白天打工,晚上科研,谷歌大脑研究科学家解决了困扰数学界几十年的猜想

2022 年 10 月中旬,Justin Gilmer 从加利福尼亚飞往纽约,在东海岸拜访了他以前的导师 Michael Saks,一位罗格斯大学的数学家。

叙旧期间,他们并未谈及数学。事实上,自从 2015 年在罗格斯大学获得博士学位后,Gilmer 就再没认真思考过数学问题。那时候他决定不在学术界发展,同时开始自学编程。当他和 Saks 共同用餐时,Gilmer 向导师讲述了自己在谷歌的工作:机器学习和人工智能。

在校园的小路上,Gilmer 边走边回忆,2013 年,他花了一年多的时间走在这条路上,思考一个叫做「并封闭集猜想(又称Frankl猜想)」的问题。这一直是个没有结果的难题。Gilmer 所做的一切努力,只是成功地教会了自己,为什么这个关于数字集合的看似简单的问题会如此难以解决。

但在七年后的这次访问后,Gilmer 突然有了全新的灵感。他开始思考如何应用信息论来解决并封闭集猜想。经过一个月的研究后,通往证明的路径不断打开。11 月,他在 arXiv 上发布了研究结果,宣布在证明整个猜想方面取得了重大进展。

图片

论文链接:https://arxiv.org/pdf/2211.09055.pdf

这篇论文掀起了后续研究的热潮。牛津大学、麻省理工学院和高等研究院等机构的数学家们迅速在 Gilmer 的新方法基础上开展工作。

什么是并封闭集猜想?

并封闭集猜想与数的集合相关,如 {1,2} 和 {2,3,4}。你可以对集合进行运算,包括取它们的并集,也就是合并它们。例如,{1,2} 和 {2,3,4} 的并集是 {1,2,3,4}。

如果该族中任何两个集合的并集等于族中任何现有的集合,这个集合或族被认为是「并集封闭」的。例如,考虑这个由四个集合组成的族:{1}, {1, 2}, {2, 3, 4}, {1, 2, 3, 4}。

将任何一对组合起来,你就会得到一个已经在族中存在的集合,所以说这个族是并封闭集的。

数学家们早在 20 世纪 60 年代就讨论过并封闭集猜想,但直到 1979 年它才得到了第一次正式陈述,是在 Péter Frankl 的一篇论文中,他是一位匈牙利数学家,80 年代移民到日本,除了数学还热爱街头表演。

Frankl 猜想,如果一个集合的族是并封闭集的,那么它必须至少有一个元素(或数字)出现在至少一半的集合中。这是一个自然存在的阈值,原因有二。

图片

Justin Gilmer

首先,在现成的并封闭集族的例子中,其中所有元素正好出现在 50% 的集合中。比如说,你可以用数字 1 到 10 组成所有不同的集合,总共会有 1024 个这样的集合。它们构成了一个并封闭集族,10 个元素中的每一个都出现在其中的 512 个集合。

在 Frankl 提出这个猜想的时候,还没有人提出过一个猜想不成立的并封闭集族的例子。所以 50% 似乎是正确的预测。

这并不意味着它很容易被证明。在 Gilmer 的工作之前,很多论文只能设法建立了随族中集合数量变化的阈值(而不是对所有大小的集合族都是相同的 50% 阈值)。

哥伦比亚大学的 Will Sawin 说:「感觉它应该很容易,而且它与很多容易的问题相似,但它一直未被攻克。」

缺乏进展既反映了这个问题的棘手性质,也反映了许多数学家宁愿不去想它。他们担心自己会浪费多年的职业生涯,去追逐一个不可能解决的问题。Gilmer 记得 2013 年的一天,他去 Saks 的办公室提到这个并封闭集猜想,这些也曾经与这个问题搏斗过的导师把他赶出了房间。

不确定性的洞察

在访问罗格斯大学之后,Gilmer 的脑海中滚动着这个问题,试图理解为什么它是如此困难。他用一个基本事实提示自己:如果你有一个由 100 个集组合组成的族,有 4950 种不同的方式来选择二者并将他们结合起来。然后他想:如果没有任何元素至少以某种频率出现在这些结合中,那么 4950 种不同的结合又怎么可能映射到 100 个集合呢?

在这一点上,他已经在通往解决的路上了,尽管他还不自知。

信息论在 20 世纪上半叶得到发展,其中最著名的是 Claude Shannon 1948 年的论文《通信的数学理论》。这篇论文提供了一种精确的方法来计算发送信息所需的信息量,基于围绕着信息表达内容的不确定性的大小。这种信息和不确定性之间的关联,正是香农的卓越见解。

信息论经常出现在组合学中,这是一个与计数对象有关的数学领域,这也是 Gilmer 在研究生时期研究的内容。但当他飞回加州的家中时,他还担心将信息论与并封闭集猜想联系起来的方式是一个业余者的天真见解。

「说实话,我有点惊讶之前没有人想到这个,」Gilmer 表示。「但也许我不应该感到惊讶,因为我自己也想了一年,而且我是懂信息论的。」

探索难题

Gilmer 对数学的钻研来源于自己对数学的热爱。他工作日主要忙于谷歌的日常工作,闲暇时间就潜心研究数学问题。上班时他也带着一本数学教科书,以便随时查找忘记的公式。Gilmer 脚踏实地,也仰望星空 —— 他喜欢看著名数学家 Tim Gowers 的博客,这会让他备受鼓舞。

Gilmer 谦虚地说道:「也许你认为解决数学难题的人不应该查阅《Elements of Information Theory(信息论基础)》第 2 章,但我查阅了。」

Gilmer 提出的方法是设想一个并封闭集族,其中任何元素在所有集合中出现的概率都小于 1%。这是一个反例,如果它真的存在,将证伪 Frankl 的猜想。

假设从这个族中随机选择两个集合 A 和 B,问:集合 A 包含数字 1 的概率是多少?集合 B 呢?由于每个元素出现在任何给定集合中的概率略低于 1%,因此不应期望 A 或 B 包含 1。这意味着如果两者实际都不包含 1,我们也不会感到惊讶,当然也不会获得什么信息。

接下来,考虑 A 和 B 的并集包含 1 的概率。这仍然不太可能,但比 1 出现在任何一个单独集合中的概率大一些,是 1 出现在 A 中的概率与 1 出现在 B 中的概率之和减去 1 同时出现在两者中的概率。所以 A 和 B 的并集包含 1 的概率约低于 2%。

这仍然很低,但更接近 50% 的猜想,这意味着需要更多信息才能共享结果。换句话说,如果存在一个并封闭集族,其中任何元素在所有集合中出现的概率都小于 1%,则两个集合的并集比任何一个集合本身包含的信息要多。

「逐个元素证明猜想的思路非常聪明」,普林斯顿大学的 Ryan Alweiss 评价道。

Gilmer 的工作开始接近 Frankl 的猜想。这是因为很容易证明:在并封闭集族中,两个集合的并集包含的信息必然少于两个集合本身 —— 而不是更多。

原因很简单,以包含 1024 个不同集合的并封闭集族为例,每个集合中元素是 1 到 10 的数字。如果随机选择其中两个集合,平均会得到包含五个元素的并集。(在这 1024 个集合中,有 252 个包含五个元素,这是最常见的集合大小。)也有可能我们会得到一个包含大约七个元素的并集。但是只有 120 种不同的组合方法能得到包含七个元素的并集。

关键是,两个随机选择的集合包含的元素比其并集具有更多的不确定性。并集更像是一个具备更多元素、可能性更少的更大集合。当你在一个并封闭集族中对两个集合进行并集操作时,你可能会知道合并结果,就像是抛出一个有偏重的硬币,你很容易猜到硬币落向哪面,并集包含的信息少于两个集合本身的信息。

基于此,Gilmer 认为至少要有一个元素在集合中出现的概率大于等于 1%。

失之东隅,收之桑榆

当 Gilmer 在 11 月 16 日发布他的证明时,他附上了一条说明 —— 他认为使用他的方法可能更接近完整猜想的证明,有可能将阈值提高到 38%。

五天后,三个不同的数学家团体在几个小时内相继发表了论文,他们在 Gilmer 的工作基础上做到了这一点。这场爆发似乎已经将 Gilmer 的方法发挥到了极致,不过要想达到 50%,可能需要更多的新想法。

不过,对于后续论文的一些作者来说,他们想知道为什么 Gilmer 不自己做完相对简单的达到 38% 的研究。事实上,原因并不复杂:在脱离数学超过 5 年之后,Gilmer 只是不知道如何进行技术分析工作来实现这一目标。

「我有点生疏,老实说,我被困住了,」Gilmer 说。「但我很想知道数学社区会把它带到哪里。」

但 Gilmer 也认为,使他失去实践机会的同一原因,在某种程度上也使他的证明首先成为了可能:「这是唯一的解释 —— 为什么我在研究生院想了一年这个问题毫无进展,离开数学六年之后再回到这个问题上却取得了突破。除了机器学习让我的想法产生变化之外,我不知道还有什么解释。」

以上是白天打工,晚上科研,谷歌大脑研究科学家解决了困扰数学界几十年的猜想的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
及时工程中的思想图是什么及时工程中的思想图是什么Apr 13, 2025 am 11:53 AM

介绍 在迅速的工程中,“思想图”是指使用图理论来构建和指导AI的推理过程的新方法。与通常涉及线性S的传统方法不同

优化您的组织与Genai代理商的电子邮件营销优化您的组织与Genai代理商的电子邮件营销Apr 13, 2025 am 11:44 AM

介绍 恭喜!您经营一家成功的业务。通过您的网页,社交媒体活动,网络研讨会,会议,免费资源和其他来源,您每天收集5000个电子邮件ID。下一个明显的步骤是

Apache Pinot实时应用程序性能监视Apache Pinot实时应用程序性能监视Apr 13, 2025 am 11:40 AM

介绍 在当今快节奏的软件开发环境中,确保最佳应用程序性能至关重要。监视实时指标,例如响应时间,错误率和资源利用率可以帮助MAIN

Chatgpt击中了10亿用户? Openai首席执行官说:'短短几周内翻了一番Chatgpt击中了10亿用户? Openai首席执行官说:'短短几周内翻了一番Apr 13, 2025 am 11:23 AM

“您有几个用户?”他扮演。 阿尔特曼回答说:“我认为我们上次说的是每周5亿个活跃者,而且它正在迅速增长。” “你告诉我,就像在短短几周内翻了一番,”安德森继续说道。 “我说那个私人

pixtral -12b:Mistral AI'第一个多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一个多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

生成AI应用的代理框架 - 分析Vidhya生成AI应用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想象一下,拥有一个由AI驱动的助手,不仅可以响应您的查询,还可以自主收集信息,执行任务甚至处理多种类型的数据(TEXT,图像和代码)。听起来有未来派?在这个a

生成AI在金融部门的应用生成AI在金融部门的应用Apr 13, 2025 am 11:12 AM

介绍 金融业是任何国家发展的基石,因为它通过促进有效的交易和信贷可用性来推动经济增长。交易的便利和信贷

在线学习和被动攻击算法指南在线学习和被动攻击算法指南Apr 13, 2025 am 11:09 AM

介绍 数据是从社交媒体,金融交易和电子商务平台等来源的前所未有的速度生成的。处理这种连续的信息流是一个挑战,但它提供了

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用