探索LLM与人脑之间的惊人相似之处>
>本文研究了开创性的研究合并神经科学,心理学和计算机科学,以揭示大型语言模型(LLMS)和人脑之间的惊人相似之处和关键差异,尤其是在文本处理和程序推理中。

介绍:
LLM的兴起引发了关于它们模仿人类认知过程的潜力的激烈争论。 他们在语言,推理和解决问题方面的高级能力提出了有关基本操作原则的引人注目的问题。 以前的文章探讨了这一点,尤其是关于“中国房间的论点”以及LLM文本处理与人类语言获取之间的相似之处:
在图灵测试,中国房间的论点和现代大语言模型
上
- >
如果口头和书面交流使人类发展智能……语言模型是怎么回事?
人类是超级加入的“随机鹦鹉”?
-
微软研究人员说,他们在gpt-4>中发现了“人工智能的火花”,
- >
>>如果智力甚至意识在AI中毫不费力,那么……
- >先前的工作还分析了LLM的“推理”以及及时工程对解决问题准确性的影响:
- 新的DeepMind Works揭开了最高的语言模型种子>
>
>如何在字符串上训练的语言模型?
>最近的研究阐明了惊人的相似之处:
>
- >本文回顾了最近的研究,探讨了LLM和人类大脑之间的相似之处和区别,重点是认知任务绩效,评估方法和智力的本质。 五个关键的研究论文构成了此分析的基础:
-
大语言模型和认知科学:对相似性的全面综述,差异……本综述(目前未经访问)研究了LLMS和认知科学的相互作用,详细介绍了LLM和人类的详细方法信息处理,包括认知心理学实验和神经影像数据的适应。 它突出了语言处理和感官判断的相似之处,同时强调推理的差异,尤其是在新的问题上。
-
上下文特征提取层次结构以大语言模型和大脑融合 - 自然…本文分析了十二个LLM,评估了他们在语音理解过程中预测神经反应(颅内EEG)的能力。 表现较高的LLM显示出更大的大脑相似性,使用较少的层将其分层特征提取与大脑的途径对齐。 上下文信息显着改善了模型性能和类似大脑的处理。
>
-
>刻度很重要:具有数十亿(而不是数百万)参数的大型语言模型更好……>此审查的预印本在 elife中研究了LLM大小与人脑活动的预测之间的相关性在自然语言处理期间(使用电皮质学)。较大的LLMS更准确地预测神经活动,最佳预测层在较大模型中转移到早期层。
在人类和深层语言模型中共享语言处理的共享计算原理 - PubMed >这2022年的文章(使用GPT-2)找到了人类和LLMS共享三个计算原则的经验证据:连续下一字预测,,连续的下一字预测,使用前发作预测来计算发出后的惊喜,并使用上下文嵌入表示单词。-
>在预处理中的程序知识驱动大语模型中的推理>此预印本研究LLM如何学会推理推理,并将推理策略与事实知识检索进行比较。 推理是由程序知识驱动的,从文件中综合解决方案的解决方案。
-
键的相似之处和分歧:
>
相似之处:>
层次语言处理:
>- >上下文依赖性:
两个系统都在很大程度上依赖上下文信息。 LLMS中的较大上下文窗口增强了他们预测人类神经反应的能力,反映了大脑对理解的依赖。
差异:>
功能与形式的语言能力:在正式语言能力(语法)上表现出色时,他们经常在功能能力(语用学,幽默或讽刺等方面)。
内存机制: llm内存与人类记忆有显着不同。人类记忆是动态的,基于经验和关联而适应; LLM内存依赖于固定表示。
>
将LLM评估为认知模型:>
评估LLM认知能力
提出了独特的挑战。 研究人员适应认知心理学实验(例如Cogbench),并使用神经影像学数据将LLM表示与人脑活动进行比较。 但是,解释这些发现需要谨慎,这是由于两个系统之间的根本差异。
融合问题:
LLM是否正在发展真正的情报的问题仍然开放。 尽管他们在认知任务上的表现令人印象深刻,但与人脑的根本差异持续存在。 LLMS与大脑般的处理的融合增加了有趣的可能性,但是它们是否会达到人类水平的智力仍然不确定。
结论:
>此处审查的研究强调了LLMS和人脑之间的引人入胜的相似之处和差异。 这项正在进行的调查不仅可以提高我们对人工智能的理解,而且还加深了我们对人类认知本身的了解。
进一步读取:
>一种新方法,用于检测大语模型幻觉的“ confabulation”
>在现代科学和技术中直接使用大语言模型
通过让LLMS访问…- >
在经过几个月的测试后,在课堂 - 讨论中释放了chatgpt的力量
- (www.lucianoabriata.com-订阅更多文章。网站上可用的服务和联系信息。)
以上是科学家对大型语言模型的认真反映了人类思维的详细内容。更多信息请关注PHP中文网其他相关文章!