编者按:随着大模型能力持续突破,AI Agent 正从「对话工具」逐渐演变为能够独立执行任务的数字劳动力。从编写代码、处理合同,到审计财务、分析科研数据,Agent 开始进入几乎所有知识工作的环节。
当企业内部同时运行的 Agent 数量远超员工规模时,软件的主要使用者也可能从「人」转向「机器」。在这一趋势下,软件设计、基础设施乃至商业模式都在发生变化。本文以「为 Agent 构建软件」为线索,讨论 Agent 时代的软件形态与基础设施将如何演进。
注:本文作者 Aaron Levie 是企业云存储公司 Box 的联合创始人兼 CEO,也是长期关注 AI 与企业软件趋势的科技行业意见领袖。
以下为原文:
过去几个月里,Agent 领域正在发生一件重要的变化。去年年底前后,我们开始进入这样一个阶段:编程型 Agent 已经能够独立完成持续时间更长的任务,在整个开发过程中也不再需要人类频繁手把手地指导。
这些 Agent 早已不只是配备简单工具的聊天机器人。如今,它们往往拥有独立的沙盒计算环境,可以针对遇到的问题自行编写并运行代码,能够直接调用 API 和 CLI,与各种系统交互,还拥有自己的文件系统与长期记忆能力等等。这些基础能力,加上围绕 Agent 运行框架(agentic harness)的最佳实践逐渐成熟,以及模型在工具调用和软件开发方面的巨大进步,让我们开始看到一种可能:Agent 将能够处理几乎任何被交给它们的任务。
最初,这种架构主要由一批编程型 Agent 推动,例如 Claude Code、Devin、Codex、Factory、Cursor、Replit 等。但最近,这一模式已经跨越了早期技术圈层,开始进入更广泛的个人体验和知识工作领域,比如 Claude Cowork、Perplexity Computer、Manus,以及当然还有 OpenClaw。后者更是把这一方向推向更远——它可以在一个持续存在的环境中 24 小时运行。
随着能力快速提升,Agent 将被引入几乎所有工作领域。它们会被用来审阅每一份合同、处理大量客户支持的一线问题、审计企业财务、梳理海量医学研究以推动药物发现、生成绝大部分软件代码、制作销售和咨询演示文稿,甚至代表消费者在互联网上完成交易。总体而言,它们将参与社会中几乎所有具有经济价值的工作。
而且,这不仅仅是替我们完成今天已经在做的事情。Agent 还会让我们做得更多,例如运行过去成本过高的复杂模拟、为每一个想法快速生成多种原型方案,因为启动项目的成本大幅降低、停止项目也变得容易;我们会同时推进更多项目;我们也可以分析几乎所有数据,而不再只是依赖抽样。
把这些趋势放在一起看,可以预见:在未来的组织中,几乎每一位员工都会拥有多个为其工作的 Agent。一个企业拥有的 Agent 数量达到员工数量的 100 倍甚至 1000 倍,并不难想象。当数万亿个 Agent 在同时运转时,它们将成为未来软件最主要的使用者。
然而,大多数软件原本都是为人类设计的。这意味着,软件形态很可能会迎来一次重大的变化。那么接下来会发生什么?
做出「Agent 愿意用」的软件Paul Graham 曾用一句极其简单的话总结软件创业的原则:做出人们想要的产品(Make something people want)。
这一理念催生了 21 世纪最成功的一批软件公司,也推动了一种新的产品方法论——工具要简单易用、容易上手、解决明确的问题、避免晦涩术语、定价清晰。
而现在,这句话可能要被改写为:做出 Agent 愿意用的软件。
目前,使用 Agent 最多的人往往是开发者或技术能力很强的用户,他们对工具通常有自己的偏好。但当 Agent 开始为知识工作者处理各种任务时,这种人为偏好会逐渐弱化。除非企业内部已经规定了统一的工具,否则在很多工作流程中,真正做出选择的将是 Agent。
这意味着:它们会决定使用哪些工具、编写什么代码、调用哪些库、运用哪些技能。那些更容易被 Agent 接入、并能更好解决问题的平台,会比其他产品更快获得优势。Agent 不会参加你的线上发布会,也不会看到你的广告;它们只会选择完成任务最有效的工具,而你当然希望那是你的产品。
这条建议带来的最大启示是:一切都必须以 API 为中心(API-first)。
如果某个功能没有 API,几乎等同于不存在。
如果功能无法通过 CLI 或 MCP server 调用,你就已经落后一步。
如果 API 设计复杂混乱、路径冲突,让 Agent 难以使用,那基本上就是在主动放弃成为 Agent 工具的机会。
在 Box,我们正致力于构建面向 Agent 的文件系统,因此正在逐一检查 API 的每一个细节,思考在 Agent 环境中哪些地方会出现问题。这种细致程度,过去往往只出现在用户体验(UX)设计里。
正如为用户设计软件需要站在用户角度思考一样,为 Agent 设计软件也需要同样的思路。例如 Y Combinator 的 Jared Friedman 就提醒开发者:「即使是最好的开发者工具,大多数仍然无法通过 API 注册账户。这在 Claude Code 时代是一个巨大的问题,因为这意味着 Claude 无法自己注册账号。现在,把所有账户管理功能放进 API 应该成为基本要求。」
如果 Agent 无法轻松注册并开始使用你的服务,那么在它们眼里,你几乎等同于不存在。
商业模式也会随之改变当 Agent 成为软件的主要用户时,商业模式也会发生变化。
在某些情况下,由用户席位(seat)触发 Agent 运行的模式仍然适用。但也会出现大量不再与具体用户绑定的 Agent,或者它们的工作量远远超出传统软件的使用方式。例如,用户只需输入几句话,一个 Agent 就可能在软件中完成相当于数小时的人类工作,然后只把最终结果呈现给用户。
因此,一部分软件产品的商业模式将发生演化。任何希望在「Agent 时代」存活的工具,都需要引入某种按使用量或计算量计费的模式,甚至支持 Agent 自行完成支付。
面向 Agent 的下一代基础设施Perplexity 创始人 Aravind Srinivas 曾说过一句话:「把电脑交给人类是个好主意,但把电脑交给电脑,让它们替我们完成工作,是更好的主意。」
随着 Agent 拥有自己的计算环境、能够编写并执行代码、调用技能完成重复任务,并接入各种外部工具和服务,一整套新的技术体系也将随之出现。就像人类在电脑上需要的,Agent 也同样需要一套类似但专门为它们设计的基础设施。
其中一部分服务会来自现有公司,因为 Agent 仍然需要访问现有数据,或者需要在人类用户与 Agent 之间协作。
但与此同时,也会诞生大量新的产品类别,因为 Agent 面对的问题与人类完全不同,从零设计新的服务往往更合理。
例如,Agent 显然需要自己的基础设施,而且规模可能前所未有。下一代超大规模云平台(或现有巨头的升级版)很可能围绕这样一个理念建立:未来的数据中心不再主要运行我们的应用,而是运行我们的 Agent。E2B、Daytona、Modal、Cloudflare 等公司已经在朝这个方向推进,而这些沙盒计算环境的规模可能达到前所未见的水平。
Agent 还需要访问企业核心文件,并管理自己的数据与记忆,以支持长期运行的任务。同样地,企业级系统也需要转向 API-first,以便 Agent 能够访问 HR 系统、CRM、工作流系统、数据湖等关键数据与服务。那些能让 Agent 随时随地无缝操作这些数据的平台,将最有可能承接未来的工作负载。
Agent 也可能需要自己的身份体系,并能够彼此通信。例如 Agent mail 正在为 Agent 提供邮箱,使其拥有持续存在的邮件地址。同时,Exa、Parallel 等公司也在重构搜索引擎,以适应「Agent 才是主要搜索用户」的世界。许多 Agent 还需要管理自己的预算,例如通过 Stripe 或 Coinbase 提供的钱包完成支付,这甚至可能推动微支付真正落地,让 Agent 可以访问付费工具和数据资源。
当然,安全、合规与治理也会成为重大挑战。在一个 Agent 处理敏感信息、甚至执行受监管流程(例如制药或银行业务)的世界里,公司必须能够审计和记录 Agent 完成的每一项工作。长期运行的 Agent 可能需要独立身份,以便登录各种系统,并严格限制它们能够执行的操作以及可访问的数据。我们将需要一整套新的软件与平台来解决这些问题,就像过去我们为人类用户和应用程序建立安全体系一样。
总体来看,我们正在进入一个新的软件时代。在这个时代,软件必须从一开始就为 Agent 的大规模使用而设计。当数万亿个 Agent 在为人类工作时,我们与软件的关系也将被彻底重塑。

















