2025年06月16日
Devin和Claude在Multi-Agent问题上撕逼,到底在撕什么?
个体天才 vs. 集体智慧:深度解析Devin与Claude在多智能体架构上的终极对决
第一章:竞技场:解构智能体AI未来的“路线之争”
在人工智能(AI)的演进浪潮中,一场关于如何构建更高级自主系统的核心争论正悄然展开。这场争论的核心,并非单纯的技术选型,而是关乎AI未来发展方向的哲学与战略之战。争论的双方,分别是凭借其“AI软件工程师”Devin声名鹊起的Cognition AI,以及由大型语言模型巨头Anthropic推出的Claude。它们分别代表了两种截然不同的架构范式:单一强大智能体(Single-Agent)与多智能体协作系统(Multi-Agent System, MAS)。这场公开的“撕逼”,远不止是工程层面的分歧,它深刻反映了两家公司在产品设计、市场营销 ¹ 乃至未来愿景上的根本性差异,标志着AI行业正从关注基础模型能力转向如何有效编排模型智能以完成复杂工作的应用架构时代 ²。
这场争论的激烈程度,部分源于两家公司自身的战略定位。Cognition发表题为《不要构建多智能体》(Don’t Build Multi-Agents)的博文,旗帜鲜明地拥护单体智能的完整性与效率 ⁴。几乎同时,Anthropic则推出了《我们如何构建多智能体研究系统》(How we built our multi-agent research system)的详细解读,颂扬集体智慧的力量 ⁵。这种鲜明的对立迅速在技术社区(如Reddit)引发热议,将一个复杂的架构选择谱系简化为一个易于理解的叙事:孤独的天才与协作的团队 ⁶。这种叙事本身就是一种高明的市场策略,它帮助两家公司围绕各自的优势构建话语权,吸引与其理念相符的客户与人才。
1.1 术语界定:究竟何为“智能体”?
在深入探讨这场争论之前,有必要明确核心术语的定义。AI智能体(Agent)已超越传统聊天机器人的范畴,它是一个能够在特定环境中进行感知、规划并自主行动的系统,通常在一个循环中利用工具来完成任务 ¹。
单智能体系统(Single-Agent System):由一个AI模型驱动,配备一套工具和指令,在一个统一的上下文中循环执行工作流。这种架构强调决策的集中与信息流的完整性 ¹¹。
多智能体系统(Multi-Agent System, MAS):由多个相互作用的智能体组成,它们可以协作或竞争以实现共同或各自的目标。这些系统利用不同智能体的能力和角色来处理复杂任务,每个智能体可能基于不同的基础模型 ¹²。
1.2 赌注为何:这场争论的重要性
架构的选择对AI系统的可扩展性、成本、可靠性以及能够解决问题的类型具有决定性影响 ¹⁶。Devin与Claude的路线之争,不仅预示着企业级AI应用的未来形态 ¹⁸,也可能重塑软件开发的行业格局 ¹,甚至影响着通往更通用人工智能的探索路径 ⁶。这场争论的最终走向,将决定业界在构建下一代自主系统时,是更信赖一个无所不包的“超级大脑”,还是一个分工明确的“专家团队”。
第二章:个体天才的拥护者:Cognition与Devin的单智能体哲学
Cognition AI的立场鲜明而坚定:在当前技术水平下,构建一个高度可靠、可预测的系统,其重要性远超于追求理论上强大但实践中脆弱的集体智能。其核心论点是,上下文的完整性是智能决策的基石。
2.1 核心论点:上下文为王
在《不要构建多智能体》一文中,Cognition明确指出,将决策权分散到多个拥有独立上下文的智能体中,极易导致信息碎片化、假设冲突和最终结果的不可靠 ⁴。当子任务之间存在依赖关系时,缺乏有效沟通的多个智能体往往会做出相互矛盾的决策,这好比一个团队中,成员之间不进行充分沟通,仅凭各自对任务的片面理解分头行动,最终产出的成果必然充满矛盾 ⁶。因此,Cognition认为,一个统一、连贯的上下文所带来的决策完整性与执行效率,是构建强大智能体的首要原则。他们并非反对并行处理,而是反对去中心化的决策过程。
这种理念是一种务实的工程选择,旨在规避当前大型语言模型在“长上下文主动对话”(long-context proactive discourse)方面的能力短板 ⁴。人类工程师通过高效沟通解决分歧,但AI尚不具备这种智能。Cognition选择不直接挑战这个难题,而是通过架构设计来绕开它,优先保证系统的稳健性。
2.2 Devin的架构:“AI软件工程师”的单体实现
Devin的系统架构是其单智能体哲学的完美体现。
大脑与工作区:Devin的核心是一个位于Cognition云端的中央“大脑”,它完全控制一个专用的、沙箱化的计算环境。该环境内含Shell、浏览器和代码编辑器等开发工具,确保所有规划、推理和决策都源自一个单一、连贯的智能核心 ¹⁹。
任务执行模型:Devin利用其先进的长期推理和规划能力,将复杂的工程任务分解为数千个决策步骤 ¹⁹。在代码修改方面,它采用了一种被称为“编辑-应用模型”(edit apply model)的策略:由一个大型模型生成对代码修改的Markdown格式解释,再由一个小型模型根据这些解释重写整个文件。实践证明,这种方法比直接让大型模型生成格式化的diff补丁更为可靠 ⁴。
人机协作模式:Devin被设计为与人类协作的“队友”。它会主动分享计划、实时报告进展,并接受用户的反馈和指导。然而,在整个执行过程中,Devin始终是唯一的行动者,保持着决策的独立性和执行的统一性 ¹⁹。
2.3 “Devin团队”的悖论:哲学与营销的调和
尽管Cognition的理念是反多智能体的,但其市场宣传中却频繁出现“Devin大军”(an army of Devins)或“Devin团队并行工作”(Teams of Devins working in parallel)等字眼 ²²。这看似矛盾,实则不然。这里的“团队”并非指多个具有不同专长的智能体在一个共享问题上协作,而是指
多个独立的Devin单智能体实例在并行处理多个互不相关的任务 ²⁴。这更像是一个由中央调度系统管理的任务队列,每个“工人”都是全能且同质的。这种模式扩展了系统的吞吐量,但并未改变其单智能体决策的核心本质。
2.4 Devin 2.0及未来:强化单体智能
Devin 2.0的发布进一步巩固了其单智能体哲学。新功能如交互式规划(Interactive Planning)、Devin搜索(Devin Search)和Devin维基(Devin Wiki)²⁴,其核心目标都是增强
单个智能体在执行前理解代码库和制定详尽计划的能力。这进一步强化了中央化的上下文和控制,旨在让这位“AI软件工程师”变得更加深思熟虑和见多识广。
Devin将自身定位为“AI软件工程师”¹,并专注于处理初级工程师水平的、定义明确的任务 ²⁵,例如代码迁移、bug修复、CI/CD维护等 ²²。这使其具备了颠覆全球软件开发外包市场的潜力,尤其是在那些重复性高、创造性要求相对较低的工作领域。这不仅是技术层面的影响,更可能引发深远的经济和劳动力市场变革。
第三章:集体力量的信奉者:Anthropic与Claude的多智能体战略
与Cognition的审慎务实形成鲜明对比,Anthropic对多智能体系统抱持着更为激进和乐观的态度。他们认为,要解决真正复杂、开放式的问题,任何单个智能体的能力终将遭遇瓶颈,而集体智慧是突破这一瓶颈的关键。
3.1 核心论点:突破单智能体局限
Anthropic的哲学根植于一个深刻的洞察:对于海量信息的研究和推理,本质上是一种压缩行为 ⁶。单个智能体有限的上下文窗口,在面对近乎无穷的信息时,过度压缩必然导致信息失真和视野局限 ⁵。他们的解决方案是,通过将认知负荷分散到多个智能体上,来有效扩展整个系统的推理能力和信息处理带宽。这好比一个公司的CEO无法独自处理所有业务,必须招聘不同领域的专家来分担工作一样 ⁶。
3.2 Claude的架构:编排者-工作者模式
Anthropic的“研究模式”(Research Mode,前身为Compass)是其多智能体理念的集中体现,其架构采用了经典的“编排者-工作者”(Orchestrator-Worker)模式。
领导智能体与子智能体:系统由一个领导智能体(通常是能力最强的模型,如Claude 4 Opus)担任“编排者”,负责规划和委派任务。然后,它会生成多个专门的子智能体(通常是速度更快的模型,如Claude 4 Sonnet)作为“工作者”,并行执行不同的子任务 ⁵。这是一种等级森严的层级式结构,而非扁平化的自由协作 ¹²。
任务分解与沟通:领导智能体接收用户查询后,会进行深入的“扩展思考”,制定研究计划,并将任务分解成具体的子目标。它为每个子智能体提供详细的指令,包括任务目标、期望的输出格式以及建议使用的工具和信息源 ⁵。子智能体独立完成研究后,将结果返回给领导智能体进行整合与综合分析 ⁵。
并行化为核心:该架构专为“广度优先”的查询而设计,即那些需要同时探索多个独立方向的问题。系统强制要求并行调用工具,尤其是在研究初期,通常会同时启动3-5个子智能体,从而将复杂查询的研究时间缩短高达90% ⁵。
3.3 90%的性能飞跃:代价与回报
Anthropic的内部评估显示,其多智能体系统在研究评估中的表现比单兵作战的Claude Opus 4高出90.2% ⁵。这一惊人提升的背后,是“花费足够多的token来解决问题”的简单逻辑。分析表明,仅token使用量这一项,就解释了80%的性能差异 ⁵。这意味着,多智能体架构的成功,很大程度上是通过消耗大量计算资源换来的。
3.4 Claude 3/4模型家族:坚实的基础
多智能体架构的有效性,离不开其背后强大的基础模型。Claude 3及后续的Claude 4模型家族(包括Opus、Sonnet和Haiku)在推理、编码、多语言理解和视觉分析方面表现出色 ³¹,并且能够可靠地遵循复杂指令和使用工具 ³²,这为领导智能体的精确编排和子智能体的有效执行提供了坚实的基础。
然而,巨大的性能提升伴随着高昂的成本。多智能体系统的token消耗量约为普通聊天交互的15倍 ²⁸,这使其经济上不适用于大多数日常任务。因此,Anthropic的多智能体系统并非一个通用产品,而是一个高成本、高价值的“研究引擎”。它的目标客户不是普通的开发者,而是那些需要解决高价值、复杂问题的资深研究员、战略分析师和研发部门,这些场景下,人类专家的机会成本远高于AI的计算成本 ⁵。
更深层次地看,Anthropic正在利用其多智能体研究来构建一个强大的研发飞轮。他们开发了能够自动优化工具描述的“工具测试智能体”³⁰,并让智能体自我诊断失败原因 ³⁵。这表明,多智能体战略不仅是为了打造一款产品,更是为了加速其核心模型的迭代和工具使用能力的提升,从而构筑起一道难以逾越的技术护城河。
第四章:架构权衡:一场全面的技术对比分析
Devin和Claude所代表的两种架构路线,并非简单的优劣之分,而是在一系列关键技术维度上的深刻权衡。企业在选择时,必须理解这些权衡背后所蕴含的战略取舍。这本质上是在可预测性与处理能力之间做出选择。Devin的单智能体路径优先考虑了在明确范围内任务的可预测和可靠执行,而Anthropic的多智能体系统则追求在复杂、开放式任务上的极致处理能力和广度,并为此接受了更低的预测性和更高的复杂性作为代价。
4.1 上下文管理与信息流
**Devin (单智能体)**:采用统一、连贯的上下文管理模式。所有信息和决策都集中在一个“大脑”中,这有效避免了因信息不对称导致的假设冲突,保证了信息流的完整性 ⁴。其缺点在于,这个单一的上下文可能成为处理极其复杂或广泛问题时的瓶颈。
**Claude (多智能体)**:采用分布式、委托式的上下文。领导智能体将任务和相关上下文分发给子智能体,从而突破了单个模型20万token的上下文窗口限制,实现了更大规模的并行推理 ⁵。然而,这种模式的风险在于信息碎片化,对领导智能体的综合、提炼和状态管理能力提出了极高的要求 ⁵。
4.2 任务分解与规划
Devin:规划过程是中心化的。单一“大脑”生成一个详尽的、通常是序列化(或由中央统一管理的并行化)的计划。用户可以在执行前审查并修改这个计划,增加了透明度和可控性 ¹⁹。
Claude:规划过程是层级化和动态的。领导智能体制定一个高层级的战略规划,然后将具体的执行计划委托给子智能体。这种模式的优势在于灵活性,系统可以根据子智能体返回的新信息动态调整后续计划 ⁵。
4.3 可扩展性与并行性
Devin:其扩展模式是通过增加更多独立的智能体实例来处理更多不同的任务,形成一个“蜂群”。对于单个复杂任务内部的真正并行处理能力,受限于其单一的推理引擎 ²²。
Claude:其扩展模式是通过向单个任务中增加更多协作的子智能体。这种架构专为大规模并行化而生,尤其擅长处理需要同时探索多个分支的广度优先问题 ⁵。
4.4 沟通与协调开销
Devin:由于不存在多个决策实体,其智能体间的沟通与协调开销几乎为零。这是其设计的核心优势之一,极大地简化了系统行为 ⁴。
Claude:存在巨大的协调开销。领导智能体必须精确地管理子智能体,否则极易出现工作重复、信息遗漏等协调失败问题。不相关的“闲聊”甚至会降低团队效率 ²⁹。
4.5 稳健性、调试与开发复杂性
Devin:由于是单一的推理链,调试相对直接,系统故障虽然是整体性的,但行为更具可预测性。开发也更为简单 ¹¹。
Claude:由于非确定性的涌现行为和潜在的级联故障,调试极其困难。Anthropic自己也承认这是一个重大挑战 ²⁹。开发多智能体系统需要精心设计角色、通信协议和协调机制,复杂度远高于单智能体 ³⁷。
4.6 资源消耗与经济可行性
Devin:针对单个任务的资源消耗进行了优化,使其在经济上更适合广泛的日常工程工作 ²⁵。
Claude:token消耗量巨大,这将其应用场景限制在那些价值极高、能够承受高昂计算成本的专业研究任务上,成本是次要考虑因素 ²⁹。
下表总结了这两种架构范式在关键维度上的核心权衡:
表1:单智能体与多智能体架构的比较分析
特征维度 | 单智能体方法 (Cognition/Devin) | 多智能体方法 (Anthropic/Claude) |
---|---|---|
核心哲学 | 个体智能:强调决策的统一性与上下文的完整性。 | 集体智能:强调通过分工协作突破个体能力的上限。 |
主要用例 | 定义明确、序列化的任务(如bug修复、小型功能开发)。 | 广泛、开放式的研究型任务(如市场分析、科学探索)。 |
上下文管理 | 集中式与统一化。 | 分布式与委托式。 |
任务规划 | 单体计划:由中央大脑一次性生成详细计划。 | 层级式与动态计划:由领导智能体规划,子智能体执行并反馈。 |
扩展模型 | 通过增加独立的实例来扩展吞吐量。 | 通过增加协作的组件来扩展单任务处理能力。 |
沟通开销 | 极低。 | 极高。 |
核心优势 | 可靠性与可预测性。 | 强大的处理能力与并行性。 |
核心弱点 | 单点故障,上下文瓶颈。 | 协调复杂性,级联故障。 |
经济模型 | 单任务成本较低,适合高频次使用。 | 单任务成本极高,适合高价值场景。 |
调试难度 | 相对直接(单一执行轨迹)。 | 极其复杂(涌现行为)。 |
第五章:现实检验:市场认知与实际应用
理论上的架构之争,最终必须接受市场的检验。从最初的发布热潮到开发者社区的实际体验,一幅更为复杂和现实的图景逐渐浮现。
5.1 最初的热潮与质疑
Devin的发布引发了空前的关注,Cognition声称其在SWE-bench基准测试中取得了突破性成果 ¹⁹,并能完成Upwork上的真实工作 ²⁰。然而,随之而来的是来自技术博主和YouTube创作者的详细审查,他们对Devin的宣传视频进行了逐帧分析,认为其表现存在夸大,并未能真正如宣传片所示完美解决问题,甚至其解决问题的方式也比人类程序员更为繁琐 ²⁰。这场风波凸显了受控基准测试与复杂多变的真实世界应用之间的巨大鸿沟。
5.2 来自一线的用户体验
在Hacker News和Reddit等开发者社区中,用户分享的实际体验为这场辩论提供了宝贵的现实注脚。
“神奇但脆弱”的通病:一个普遍的共识是,当前无论是哪种架构的AI智能体,都表现出一种“神奇但脆弱”的特性。它们有时能在几分钟内解决连资深工程师都需数小时才能完成的任务,展现出惊人的能力;但在另一些时候,它们又会陷入简单的错误中反复循环,缺乏“可教导性”(coachability),无论用户如何提示都无法摆脱困境 ³⁹。
用例的实际分化:用户的实践也印证了两种架构的理论适用场景。类似Devin的单体智能体,被认为最适合处理大规模、重复性的重构任务,这类任务对于脚本来说过于复杂,但对于人类工程师又过于枯燥乏味 ⁴⁰。而Claude则因其强大的概念理解和规划能力备受赞誉,用户发现它更善于帮助自己
梳理思路和规划解决方案,而非直接产出完美代码 ²。成本与“监工”的权衡:阻碍Devin等工具广泛应用的一个重要因素是成本效益问题。许多用户认为,目前投入的费用以及花费在“监工”(babysitting)上的时间,尚未能带来足够清晰的投资回报 ²。
5.3 实践中的分野
市场的选择正在不自觉地验证这两种架构的哲学。Devin正在像Nubank这样的公司中被试用于特定的、高容量的工程任务,旨在替代或辅助人类完成明确的工作 ²²。而Anthropic的多智能体方法,则更多地被应用于构建需要内部制衡和多源信息核查的复杂查询系统或内容生成工作流 ⁵。
综合来看,当前一代的AI智能体,无论采用何种架构,都尚未跨过实现大规模、无监督部署所需的高可靠性门槛。尽管“全自主”的营销口号不绝于耳 ¹⁹,但现实中的最佳实践仍然是“人在环路”(human-in-the-loop)的工作模式。无论是Devin需要用户在执行前确认计划 ²⁴,还是Anthropic推荐用户在Claude Code执行前审查方案 ⁴¹,都表明了人类监督的必要性。智能体目前的核心价值,并非作为完全自主的队友,而是作为一名能力强大但仍需指导的“超级助理”。其根本原因在于系统鲁棒性的不足,以及在没有人类干预的情况下,从错误中恢复或适应细微变化的能力仍然欠缺 ³⁹。
第六章:战略终局:超越技术之争
Devin与Claude的架构之争,其意义已远超技术层面,它深刻地反映了两家公司截然不同的商业战略和市场定位。这实际上是AI经济中两种基本商业模式的对决:销售AI驱动的“劳动力”(SaaS应用) vs. 销售AI驱动的“生产资料”(PaaS平台)。
6.1 市场进入策略
Cognition/Devin:采用的是典型的**产品驱动增长(Product-Led Growth)**策略,其目标客户是广大的工程团队。Devin本身就是产品,一个可以被“雇佣”的“AI软件工程师”⁴。其核心价值主张是直接的劳动力成本削减和开发积压任务的清理 ¹⁹。
Anthropic/Claude:采用的是平台驱动增长(Platform-Led Growth)策略,目标客户是企业和开发者。多智能体系统是其Claude平台的一项高级能力,通过API调用和token消耗来销售 ⁵。其核心价值主张是赋能客户,让他们能够利用Anthropic的强大基础设施构建自己专有的、强大的解决方案 ¹⁸。
6.2 构筑竞争护城河
Devin的护城河:其潜在的护城河在于,通过处理海量的软件开发任务,积累起一个独一无二的、关于智能体如何规划、执行和修复代码的专有数据集。这个强大的数据飞轮可以持续改进其核心的规划与执行引擎,使其在软件工程这一垂直领域的能力越来越强 ⁴⁶。
Claude的护城河:Anthropic的护城河在于其基础模型的底层实力(如Opus和Sonnet的强大推理能力)以及在智能体系统领域的深度研究。他们可以将这些研究成果打包成一个高利润的、高级的平台功能,从而在与OpenAI和Google的平台竞争中形成差异化优势 ⁵。
6.3 经济模型
Devin:其定价模式很可能与SaaS产品类似,采用基于席位或基于智能体“雇员”的消耗量计费。Devin 2.0推出的每月20美元起步的计划便是一个例证 ²⁴。这与其“AI队友”的隐喻完全一致。
Claude:采用纯粹的按使用量(token)付费模式。这与“AI基础设施”的定位相符,成本与使用强度直接挂钩,类似于AWS或GCP的云服务计费 ²⁹。
6.4 在AI技术栈中的定位
这场争论清晰地将Cognition定位为一家AI应用公司,而Anthropic则进一步巩固了其作为基础平台公司的地位,与OpenAI、Google等巨头在同一层面竞争 ¹⁸。Devin的成功,取决于其能否证明其产生的价值能超过一名人类工程师的薪资成本。而Anthropic的成功,则取决于其平台是否足够强大和灵活,以吸引企业在其之上进行构建和创新。因此,他们的技术架构选择,与其商业模式和市场策略是紧密相连、互为表里的。
第七章:前路展望:混合化与智能体AI的未来
单智能体与多智能体的二元对立,为行业提供了一个极具价值的思辨起点,但它并非终点。这场争论最重要的意义在于,它迫使行业从抽象的讨论走向现实世界的工程权衡。未来并非非黑即白,一个融合了两种范式优点的、更为复杂的混合架构时代正在到来 ¹⁰。
7.1 混合架构的兴起
AI智能体架构的演进,将深刻地映射人类组织结构的发展历程。我们将从“个体户”(单智能体)和简单的“小作坊”(初级多智能体系统),走向结构复杂、动态变化的“现代化企业”(混合架构)。
分层系统:未来的智能体系统很可能会采用分层设计。顶层可能是一个强大的“决策者”(一个类似Devin的强大单智能体,或一个类似Claude Opus的领导智能体),负责进行深度的审议和战略规划。它将任务编排并分发给底层的多个“执行者”(反应式的、专注于特定任务的轻量级智能体)⁴⁷。在这种模式下,一个Devin式的智能体可以扮演“项目经理”的角色,根据需要生成临时的、专用的子智能体来处理具体任务,并在任务完成后整合它们的工作成果。
层级化与模块化设计:正如优秀的软件工程所倡导的,未来的系统将采用模块化设计,将不同的功能(如推理、规划、工具使用、安全审查)封装在专门的模块或智能体中 ¹⁰。这种设计不仅提升了系统的灵活性和可维护性,也使得系统可以像乐高积木一样,根据不同任务的需求动态组合。
智能体编排平台:管理这些复杂混合系统的难度,将催生对先进“智能体编排平台”的需求。这些平台将提供类似Google的ADK ⁵¹ 或开放协议MCP ⁵² 的功能,负责处理智能体的发现、通信、任务分配、状态管理和工作流控制,成为未来智能体生态系统的“操作系统”。
7.2 结论:争论的真正意义
Devin与Claude的“路线之争”,是智能体AI发展史上的一个关键 formative moment。它标志着行业关注点从模型本身的能力,转向了如何构建可靠、高效、经济可行的自主系统。
最终的胜利者,不会是单一架构的绝对统治,而是一种能够智能地融合个体天才的深度与集体智慧的广度的灵活、混合的范式。这场争论的真正价值,不在于决出谁对谁错,而在于它所激发的创新、暴露的挑战,以及为通往更强大、更可靠的AI智能体未来所照亮的前行之路。AI领域的终极挑战,或许不仅仅在于提升“智力”,更在于解决“组织”与“协调”的难题——这恰恰也是定义了人类社会与商业文明发展的永恒主题。
引用的著作
Your AI Agent isn’t an Engineer - DEV Community, 访问时间为 六月 16, 2025, https://dev.to/blackgirlbytes/your-ai-agent-isnt-an-engineer-5egf
Comparing my experience with AI agents like Claude Code, Devin, Manus, Operator, Codex, and more : r/ClaudeAI - Reddit, 访问时间为 六月 16, 2025, https://www.reddit.com/r/ClaudeAI/comments/1l8vw3l/comparing_my_experience_with_ai_agents_like/
Building Effective AI Agents - Anthropic, 访问时间为 六月 16, 2025, https://www.anthropic.com/research/building-effective-agents
Don’t Build Multi-Agents - Cognition, 访问时间为 六月 16, 2025, https://cognition.ai/blog/dont-build-multi-agents
How we built our multi-agent research system \ Anthropic, 访问时间为 六月 16, 2025, https://www.anthropic.com/engineering/built-multi-agent-research-system
Multi-Agent or Single Agent? : r/AI_Agents - Reddit, 访问时间为 六月 16, 2025, https://www.reddit.com/r/AI_Agents/comments/1lb0zb3/multiagent_or_single_agent/
AI Agent Architecture: Core Principles & Tools in 2025 | Generative AI Collaboration Platform, 访问时间为 六月 16, 2025, https://orq.ai/blog/ai-agent-architecture
What Is an AI Agent? | Andreessen Horowitz, 访问时间为 六月 16, 2025, https://a16z.com/podcast/what-is-an-ai-agent/
AI agents: Capabilities, working, use cases, architecture, benefits and development, 访问时间为 六月 16, 2025, https://www.leewayhertz.com/ai-agents/
The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey : r/singularity - Reddit, 访问时间为 六月 16, 2025, https://www.reddit.com/r/singularity/comments/1f7a03v/the_landscape_of_emerging_ai_agent_architectures/
Single-Agent vs. Multi-Agent - Alliance | Crypto Accelerator, 访问时间为 六月 16, 2025, https://alliance.xyz/essays/single-agent-vs.-multi-agent
What is a Multiagent System? - IBM, 访问时间为 六月 16, 2025, https://www.ibm.com/think/topics/multiagent-system
Multi-agent system - Wikipedia, 访问时间为 六月 16, 2025, https://en.wikipedia.org/wiki/Multi-agent_system
What is a Multi Agent System - Relevance AI, 访问时间为 六月 16, 2025, https://relevanceai.com/learn/what-is-a-multi-agent-system
什么是AI 智能体?定义、示例和类型 - Google Cloud, 访问时间为 六月 16, 2025, https://cloud.google.com/discover/what-are-ai-agents?hl=zh-CN
Single Agent vs Multi-Agent AI: Which One to Choose in 2025? - Experro, 访问时间为 六月 16, 2025, https://www.experro.com/blog/single-agent-vs-multi-agent-ai/
Single Agent vs Multi-Agent: How to Choose the Right Strategy, 访问时间为 六月 16, 2025, https://saxon.ai/blogs/single-agent-vs-multi-agent/
16 Changes to AI in the Enterprise: 2025 Edition - Andreessen Horowitz, 访问时间为 六月 16, 2025, https://a16z.com/ai-enterprise-2025/
Introducing Devin, the first AI software engineer - Cognition AI, 访问时间为 六月 16, 2025, https://cognition.ai/blog/introducing-devin
博主打假全球第一位AI程序员Devin!却可能再次反转!, 访问时间为 六月 16, 2025, https://www.yicai.com/news/102074107.html
Enterprise Deployment - Devin Docs, 访问时间为 六月 16, 2025, https://docs.devin.ai/enterprise/deployment/overview
Devin | The AI Software Engineer, 访问时间为 六月 16, 2025, https://devin.ai/
en.wikipedia.org, 访问时间为 六月 16, 2025, https://en.wikipedia.org/wiki/Devin_AI#:~:text=Compared%20to%20the%20GitHub%20Copilot,plan%20while%20implementing%20the%20code.
Devin 2.0 - Cognition AI, 访问时间为 六月 16, 2025, https://cognition.ai/blog/devin-2
Devin Docs: Introducing Devin - Devin AI, 访问时间为 六月 16, 2025, https://docs.devin.ai/get-started/devin-intro
Devin AI - Wikipedia, 访问时间为 六月 16, 2025, https://en.wikipedia.org/wiki/Devin_AI
Anthropic’s Claude Revolutionizes AI with Multi-Agent ‘Research Mode’ - OpenTools, 访问时间为 六月 16, 2025, https://opentools.ai/news/anthropics-claude-revolutionizes-ai-with-multi-agent-research-mode
Anthropic shares blueprint for Claude Research agent using multiple AI agents in parallel, 访问时间为 六月 16, 2025, https://the-decoder.com/anthropic-shares-blueprint-for-claude-research-agent-using-multiple-ai-agents-in-parallel/
Anthropic’s multi-agent system overview a must read for CIOs …, 访问时间为 六月 16, 2025, https://www.constellationr.com/blog-news/insights/anthropics-multi-agent-system-overview-must-read-cios
Anthropic: How we built our multi-agent research system, 访问时间为 六月 16, 2025, https://simonwillison.net/2025/Jun/14/multi-agent-research-system/
Claude 3 Review (Opus, Haiku, Sonnet) - TextCortex, 访问时间为 六月 16, 2025, https://textcortex.com/post/claude-3-review
The Claude 3 Model Family: Opus, Sonnet, Haiku - Anthropic, 访问时间为 六月 16, 2025, https://www.anthropic.com/claude-3-model-card
Introducing the next generation of Claude - Anthropic, 访问时间为 六月 16, 2025, https://www.anthropic.com/news/claude-3-family
An Overview of Anthropic’s Claude 3 - Shiro, 访问时间为 六月 16, 2025, https://openshiro.com/articles/an-overview-of-anthropic-s-claude-3
Research Crux Shots : How Anthropic actually built their Multi-Agent Research System!, 访问时间为 六月 16, 2025, https://www.kaggle.com/discussions/general/584753
The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - arXiv, 访问时间为 六月 16, 2025, https://arxiv.org/html/2404.11584v1
When to Use Multi-Agent Systems: Choosing Between Solo and Multi-Agent AI - Netguru, 访问时间为 六月 16, 2025, https://www.netguru.com/blog/multi-agent-systems-vs-solo-agents
Single-Agent vs Multi-Agent AI Comparison - saasguru, 访问时间为 六月 16, 2025, https://www.saasguru.co/single-agent-vs-multi-agent-ai-comparison/
Thoughts on a month with Devin - Hacker News, 访问时间为 六月 16, 2025, https://news.ycombinator.com/item?id=42734681
Is there any evidence this works better than Claude 3.5? - Hacker News, 访问时间为 六月 16, 2025, https://news.ycombinator.com/item?id=42379264
Why agents are bad pair programmers - Hacker News, 访问时间为 六月 16, 2025, https://news.ycombinator.com/item?id=44230838
The Future of AI: Exploring Multi-Agent AI Systems - Microsoft Community Hub, 访问时间为 六月 16, 2025, https://techcommunity.microsoft.com/blog/aiplatformblog/the-future-of-ai-exploring-multi-agent-ai-systems/4226593
AI Angst | Hacker News, 访问时间为 六月 16, 2025, https://news.ycombinator.com/item?id=44222885
Say Hello to My New AI Marketer: How Gen AI-Based Software Is Advancing Marketing and Sales | Andreessen Horowitz, 访问时间为 六月 16, 2025, https://a16z.com/ai-marketer-how-gen-ai-based-software-is-advancing-marketing-and-sales/
Anthropic Unveils Claude 3 Models, Highlighting Opus and Its Near-Human Capabilities, 访问时间为 六月 16, 2025, https://www.infoq.com/news/2024/03/anthropic-claude-ai/
Devin by Cognition: When AI Becomes Your Best Developer | LangChain Interrupt, 访问时间为 六月 16, 2025, https://www.youtube.com/watch?v=KfXq9s96tPU
What is Hybrid flow AI Architecture? - Lyzr AI, 访问时间为 六月 16, 2025, https://www.lyzr.ai/glossaries/hybrid-flow-ai-architecture/
Types of Agent Architectures: A Guide to Reactive, Deliberative, and Hybrid Models in AI, 访问时间为 六月 16, 2025, https://smythos.com/developers/agent-development/types-of-agent-architectures/
Understanding Hybrid Agent Architectures - SmythOS, 访问时间为 六月 16, 2025, https://smythos.com/developers/agent-development/hybrid-agent-architectures/
AI Agent Architecture: Best Practices for Designers - Rapid Innovation, 访问时间为 六月 16, 2025, https://www.rapidinnovation.io/post/for-developers-best-practices-in-designing-scalable-ai-agent-architecture
智能体开发套件:让构建多智能体应用变得轻松容易, 访问时间为 六月 16, 2025, https://developers.googleblog.com/zh-hans/agent-development-kit-easy-to-build-multi-agent-applications/
A Deep Dive Into MCP and the Future of AI Tooling | Andreessen Horowitz, 访问时间为 六月 16, 2025, https://a16z.com/a-deep-dive-into-mcp-and-the-future-of-ai-tooling/