首页 >科技周边 >人工智能 >码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB转载: 2023-10-04 20:29:06932浏览

对于大模型来说，擅长的是本地化编码任务。

如果任务涉及多个相互依赖的文件，LLM无法解决这个问题

微软研究人员为此设计了一个名为CodePlan的任务无关的神经网络框架

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

论文地址：https://arxiv.org/pdf/2309.12499.pdf

论文中，CodePlan综合了多步骤编辑链（chain-of-edits），是一种将程序分析、规划和LLM结合在一起的新方法。

一起来具体看看，CodePlan是如何设计的？

CodePlan：大模型+规划

软件工程活动中，例如软件包迁移、修复静态分析或测试的错误报告，以及向代码库添加类型提示或其他规范，涉及到对整个代码存储库的普遍编辑。

研究人员计划这些活动，以实现"存储库级别的编码任务"

编码工具如GitHub Copilot、Code Whisperer已经获得了大模型能力的支持，为码农在本地化编码问题上提供了解决方案

然而，事实是，「存储库级别的编码任务」更加复杂，无法直接通过LLM解决，因为存储库中的代码是相互依赖的，整个存储库可能太大而无法纳入提示

这项研究中，微软团队将库级编码框架作为一个规划问题，并提出了一个任务不可知的框架，称为CodePlan。

CodePlan综合了一个多步骤的编辑链（计划），其中每一步都会调用代码位置上的LLM。该代码位置上的上下文来自整个存储库、以前的代码更改和特定于任务的指令。

CodePlan是一种新型组合，它基于增量依赖分析、变更可能影响分析和自适应规划算法

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

如下图，展示了复数库API的变化，微软研究人员的任务是根据这一变化迁移代码库。

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

在图3的左侧展示了代码库中与使用复数库相关的部分

具体来说，Create.cs文件中的方法func，调用了库中的create_complex方法，Process.cs文件中的方法Process.cs调用了func。

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

研究人员将任务描述和func主体从图1传递给LLM，以生成修改后的func代码，如图3右侧所示

可以看到，LLM已经正确地编辑了对create_complex API的调用，以便它返回一个Complex类型的对象，而不是两个浮点值的元组。

注意，这个编辑导致了方法func的签名发生了变化——它现在返回了一个Complex类型的对象。

需要进行修改的是：需要修改方法func的调用者，例如在Process.cs文件中的process方法，如图3左下角所示。如果不对process方法的主体进行适当的修改，代码将无法构建！

图3右下方显示了对process方法的适当修改，它能使版本库达到一致的状态，从而在编译时不会出错。

研究人员的主要任务是建立一个「存储库级别的编码系统」，该系统能够自动生成编辑所需的派生规范

LLM驱动的库级编码任务定义如下:

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

在CodePlan的整体框架中，输入包括一个存储库、一个通过自然语言指令或一组初始代码编辑表达种子规范的任务、一个正确性oracle和一个LLM

CodePlan创建了一个计划图，其中每个节点都代表LLM需要执行的代码编辑任务，而边表示目标节点需要在源节点之后执行

CodePlan监控代码编辑，并自适应地扩展计划图。

一旦计划中的所有步骤都已完成，存储库将由oracle进行分析。如果oracle验证了资源库，则任务完成。如果发现错误，错误报告将作为下一轮计划生成和执行的种子规范。

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

此外，CodePlan算法还维护了一个依赖关系图，图4说明了依赖关系图的结构。

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

刷新SOTA

研究人员对CodePlan在两个存储库级任务上的有效性进行了评估：包迁移（C#）和时态代码编辑（Python）

每个任务在多个代码库上进行评估，每个代码库都需要对多个文件（2-97个文件）进行相互依赖的更改。

码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成图片

以前从未有过使用LLM自动完成这种复杂程度的编码任务

研究结果显示，与基准相比，CodePlan更符合基本事实，能够使5/6个存储库通过有效性检查，例如无错误构建和正确的代码编辑

总的来说，CodePlan为自动化复杂的库级编码任务提供了一种有前途的方法，既提高了生产效率，又提高了准确性

它成功地应对了许多挑战，为高效可靠的软件工程实践开辟了新的可能性

参考资料：https://www.php.cn/link/23b1f559d8bd157d0d741c83957ed4f2

以上是码农狂喜！微软提出CodePlan，跨168个代码库编码任务，LLM自动化完成的详细内容。更多信息请关注PHP中文网其他相关文章！

Python 对象 github 算法 oracle https 软件工程自动化 copilot

声明：

本文转载于：51cto.com。如有侵权，请联系admin@php.cn删除

上一篇：DeepMind联合创始人：只有交互式AI才能真正改变人类，生成式AI只是过渡阶段下一篇：ICCV'23论文颁奖“神仙打架”！Meta分割一切和ControlNet共同入选，还有一篇让评委们很惊讶

查看更多