Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!
整理 | 华卫、核子可乐
由 Founders Fund 支持的旧金山初创公司 Cognition AI 于 2024 年初发布 Devin。这款由 AI 驱动的软件工程产品可与人类开发者协同工作,并通过提示窗口乃至单独的第三方通信应用 Slack 向开发者获取自然语言指令、甚至自主执行任务,因此一战成名。
但从那时起,AI 开发领域发展迅速,许多其他厂商都开始提供类似的功能及自主 / 半自主编码智能体,包括 GitHub Copilot、AWS Developer Q、Codeium 的 Windsurf 以及 Cursor 等等。
Cognition 自成立以来一直在使用其他厂商的模型(即 OpenAI 的 GPT-4 和 GPT-4o 系列)为 Devin 提供支持。
如今,Cognition 正式发布 Devin 2.0,也就是其智能体原生软件开发平台的更新版本。新版本现已正式上线,并引入一系列功能,旨在帮助开发者与 Devin 的自主智能体间实现更加顺畅、高效的协作。目前尚不清楚新版本使用的是哪款基座模型。
此外,在经济不确定性加剧、特朗普新关税政策引发成本暴增的新时期,Cognition 还通过大幅降价为企业客户带来了一丝宽慰:Devin 2.0 的基础起价为每月 20 美元(每个「智能体计算单元」2.25 美元),远低于此前该软件的每月 500 美元起价。
Cognition AI 公布的 Devin 产品定价表格
Devin 2.0 的新亮点
并行 Devins 与新的云 IDE
Devin 2.0 以 Cognition AI 的早期成果为基础,允许用户与自主智能体协同工作以简化软件开发流程。
最新版本引入了基于云端的交互式 IDE 环境,允许用户并行启动多个 Devins,借此有效同时处理多项任务。每个 Devin 都可以自主运作,用户能够选择随时介入以审查、编辑或干预执行进度。
展开全文
交互式规划与任务范围
Devin 2.0 中的一项关键新增功能,就是引入了交互式规划。此功能允许开发者从宽泛或者尚不完整的灵感起步,并与 Devin 合作制定出详尽的任务规划。
之后,用户可以审查并调整整个规划方案,在保障一改后再允许 Devin 继续执行。
探索企业代码库
Devin 2.0 还引入了 Devin Search,一款帮助用户高效理解并浏览其代码库的工具。搜索功能允许开发者提出关于代码的具体问题,并获取关于特定代码片段的详尽答复。对于需要更深入探索的复杂查询,用户则可以激活 Deep Mode 深度模式。
此外,新版本还提供 Devin Wiki,此功能会每隔几个小时自动索引代码仓库。Devin Wiki 能够生成全面的文档,包括架构图、源链接及其他相关细节信息,为开发者提供组织清晰且持续更新的参考资料。
效率提升与开发者控制
除了新功能之外,Cognition AI 报告称 Devin 2.0 的执行效率也有提升。根据内部基准,最新版本与前代相比,每个智能体计算单元(ACU)能够完成的初级开发任务增加了 83% 以上。据报道,beta 版用户在测试期间也观察到了类似的性能提升。
用户可以通过类似 VSCode 的界面与 Devin 2.0 进行交互。该界面允许查看并编辑 Devin 工作成果,并直接在平台环境内运行测试。这样的灵活性设计可支持半自动及全自动工作流程,具体视用户的偏好和需求而定。
与其他 AI 编码智能体
及平台的优劣对比
Devin 1.2 还引入了面向企业环境的多项功能,例如用于简化登录工作流程的机器快照及用于管理多个 Devin 工作区的集中管理控制机制。
虽然 Devin 的早期版本只是将该平台定位为加快开发工作流程的创新型解决方案,但用户反馈已经凸显出其设计中仍存在巨大的成长空间。研究人员和测试人员指出,智能体有时无法处理过于复杂的代码、生成不必要的抽象且在特定任务中表现出性能不一致问题。
评论