光束搜索:深入研究这种强大的解码算法
光束搜索是自然语言处理(NLP)和机器学习的关键解码算法,尤其是对于序列生成任务,例如文本生成,机器翻译和摘要。 它有效地平衡了搜索空间的探索与高质量输出的产生。本文提供了对光束搜索的全面概述,包括其机制,实施,应用和局限性。
密钥学习目标:
- >序列解码的梁搜索算法的核心概念和功能。
- 了解梁宽度在平衡探索和计算效率方面的作用。
- 学习横梁搜索的实用python实现。
- 分析与NLP中的光束搜索相关的现实世界应用和挑战。
- >
- (本文是数据科学博客马拉松的一部分。) 目录的
表:
梁搜索机构
在解码- 中,光束搜索的重要性
- 实用的实施
- >梁搜索的挑战和局限性
- 结论
- 常见问题
- 了解梁搜索
- 梁搜索是一种启发式搜索算法,用于从变压器和LSTM等模型中解码序列。 它在生成过程的每个步骤中都保持了固定数量的最可能的序列(“光束宽度”)。与贪婪的搜索仅考虑最有可能旁边的单个令牌,Beam Search同时探索了多种可能性,从而导致更加流利和全球最佳输出。 例如,在机器翻译中,它允许模型同时探索各种有效的翻译。
梁搜索机构>
光束搜索是通过遍历节点代表令牌和边缘代表过渡概率的图的图来运行的。 在每个步骤中:
它将这些令牌扩展为序列,计算其累积概率。
它仅保留下一步的顶部
序列。
>- >此过程重复直到满足停止标准(例如,达到末端令牌或预定义的序列长度)。
- >光束宽度的概念
- >
梁宽度(k)是关键参数。更宽的光束探索了更多的序列,可能会提高产出质量,但显着提高了计算成本。较窄的光束更快,但风险会缺少上级序列。
梁搜索在解码
中的重要性光束搜索对于解码至关重要,因为:
- 增强的序列质量:探索多个假设可防止卡在本地Optima中,从而产生了全球更好的序列。 通过评估多种解释,它有效地解决了许多NLP任务中固有的歧义。
- 计算效率:它比详尽的搜索效率要高得多,同时仍在探索搜索空间的很大一部分。
> 灵活性: - 实用的实现
-
>以下提供了简化的实现,证明了核心原则。 更强大的实现将需要进行错误处理和可能更复杂的概率计算。
> > (注意:下面的代码部分和输出从原始文章中复制,并假设已安装了必要的库。请参阅原始文章以获取完整的安装说明和详细说明。)
可以适应各种任务和采样策略。 (步骤1:安装和导入依赖项)>
(步骤2:模型和令牌设置)(步骤3-8:用于编码输入,辅助功能,递归光束搜索,最佳序列检索和图形绘图的剩余代码部分是从原始文章中复制的。
(也从原始文章中复制了输出示例。 梁搜索的挑战和局限
尽管有优势,但梁搜索仍有局限性:<code># Install transformers and graphviz !sudo apt-get install graphviz graphviz-dev !pip install transformers pygraphviz from transformers import GPT2LMHeadModel, GPT2Tokenizer import torch import matplotlib.pyplot as plt import networkx as nx import numpy as np from matplotlib.colors import LinearSegmentedColormap from tqdm import tqdm import matplotlib.colors as mcolors</code>
光束宽度选择:
找到最佳光束宽度需要仔细的实验。<code># Load model and tokenizer device = 'cuda' if torch.cuda.is_available() else 'cpu' model = GPT2LMHeadModel.from_pretrained('gpt2').to(device) tokenizer = GPT2Tokenizer.from_pretrained('gpt2') model.eval()</code>
>重复序列:它可以生成无需其他约束的重复或毫无意义的输出。
对较短序列的偏置:概率累积方法可以偏爱较短的序列。
>结论
- >常见问题
- Q1。梁搜索与贪婪搜索:梁搜索探索多个序列,而贪婪的搜索仅考虑每个步骤中最有可能的令牌。 梁搜索通常更准确。
- Q2。选择光束宽度:最佳宽度取决于任务和计算资源。实验是关键。
- Q3。处理歧义:光束搜索通过探索多种可能性在处理模棱两可的任务方面出色。
- Q4。主要挑战:重复序列,对较短序列的偏见和参数调整是关键挑战。
(本文所示的媒体不归Analytics Vidhya拥有,并由作者酌情使用。)
以上是NLP解码中的光束搜索是什么?的详细内容。更多信息请关注PHP中文网其他相关文章!

聊天机器人诸如Chatgpt之类的聊天机器人举例说明了生成的AI,为项目经理提供了功能强大的工具来简化工作流程并确保项目按计划和预算范围内保持。 但是,在制作正确的提示时有效使用铰链。 精确,细节

定义人工智能(AGI)的挑战是重大的。 AGI进步的主张通常缺乏明确的基准,其定义是针对预定的研究方向而定制的。本文探讨了一种新颖的定义方法

IBM WATSONX.DATA:简化企业AI数据堆栈 IBM将watsonx.data定位为企业的关键平台,旨在加速精确且可扩展的生成AI解决方案。 这是通过简化投诉来实现的

在AI和材料科学领域的突破所推动的机器人技术的快速进步已准备好迎来人类机器人的新时代。 多年来,工业自动化一直是主要重点,但是机器人的功能迅速exp

Netflix 界面十年来最大更新:更智能、更个性化,拥抱多元内容 Netflix 周三宣布对其用户界面进行十年来最大规模的改版,不仅外观焕然一新,还增加了更多关于每个节目的信息,并引入了更智能的 AI 搜索工具,能够理解模糊的概念(例如“氛围”),以及更灵活的结构,以便更好地展示公司在新兴的视频游戏、直播活动、体育赛事和其他新型内容方面的兴趣。 为了紧跟潮流,新的移动端竖屏视频组件将使粉丝更容易滚动浏览预告片和片段,观看完整节目或与他人分享内容。这让人联想起无限滚动且非常成功的短视频网站 Ti

人工智能通用智能(AGI)的讨论日益增多,促使许多人思考当人工智能超越人类智能时会发生什么。这个时刻是近在咫尺还是遥遥无期,取决于你问谁,但我认为这并非我们应该关注的最重要的里程碑。哪些更早的人工智能里程碑会影响到每个人?哪些里程碑已经实现?以下是我认为已经发生的三件事。 人工智能超越人类弱点 在2022年的电影《社交困境》中,人文科技中心(Center for Humane Technology)的崔斯坦·哈里斯指出,人工智能已经超越了人类的弱点。这是什么意思?这意味着人工智能已经能够运用人类

Transunion的首席技术官Ranganath Achanta在2021年末加入公司后加入公司以来,率先进行了重大的技术转变。

建立信任至关重要,对于成功采用业务的AI是至关重要的。 考虑到业务流程中的人类因素,这尤其如此。 像其他任何人一样,员工对AI及其实施引起了人们的关注。 德勤研究人员是SC


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Dreamweaver Mac版
视觉化网页开发工具

Dreamweaver CS6
视觉化网页开发工具

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。