微软在Ignite大会上展示了其Microsoft 365 Copilot平台的多项改进,并重点说明了其在人工智能领域的客户增长。微软首席通讯官弗兰克·肖指出,财富500强中近70%的公司现在都在使用Microsoft 365 Copilot。微软与其大型科技竞争对手一样,正在投入数十亿美元来扩展其人工智能能力,华尔街渴望看到这些投资获得回报。
在本次会议上,微软悄悄建立起一个超级AI智能体生态,规模之大让人难以忽视。微软公司负责智能体发展愿景的高管Charles Lamanna表示,智能体生态的发展速度比预期要快得多,也比以往发布过的任何其他前沿技术都要更快。这项业务每个季度几乎都在实现倍增。
随着微软大幅扩展其智能体业务,企业客户的快速采用也随之而来。微软宣布将允许企业通过这些智能体随意挑选Azure目录所提供的1800种大语言模型(LLM)——这无疑也是微软摆脱对于OpenAI模型全面依赖的一项重要举措。软件巨头还推出了能够独立运作的自主智能体,它们可以检测事件并在最低程度的人为干预之下协调复杂的工作流程。
从严格定义上讲,所谓AI智能体就是能够依托生成式AI推理并执行特定业务任务的软件。这些智能体如今正成为企业自动化和生产力提升领域的强大工具。微软的平台使得组织能够针对客户服务、复杂业务流程自动化等各类用例场景构建智能体,同时保持企业级安全性和治理水平不受影响。
微软在AI智能体领域的早期领先地位,源自其对于常在AI炒作周期中被忽视的企业切实需求的高度关注。尽管新型自主智能体和大语言模型灵活性等话题长期占据Ignite关注热榜,但微软公司真正的优势更多体现在其坚实的企业基础设施当中。该平台集成了1400多种企业系统和数据源,范围从SAP到ServiceNow、再到SQL数据库。这种广泛的连接性使得组织能够轻松建立起可直接访问并处理其现有IT环境内数据的智能体。企业除了选择从头开始构建自定义智能体之外,微软还提供十种专门面向销售、服务、财务、供应链等核心业务职能的预构建自主智能体,借此加快常见企业用例的推进速度。
微软方面并没有公布哪种智能体类型在客户群体当中最受欢迎,但Lamanna表示,除了针对IT部门特定核心任务构建的应用程序之外,还有第二类更强调自下而上的应用形式。员工可以创建Copilot智能体来与团队或其他合作伙伴共享文档或者演示文稿,而其他人则可据此参与内容交互并提出相关问题。
以往,安全和治理功能大多会在AI部署完成之后才被纳入考量,但如今这两大要素已被内置在微软的核心架构当中。该平台的控制系统将确保智能体始终运行在企业权限与数据治理框架之内。
L amanna具体解释道,“我们认为智能体将无处不在。因为每当出现一种能够将以往不可能的事情变为可能时,人们必然会惊讶于它的效果并最终加以广泛运用。”他还将AI智能体与互联网进行了比较,表示当初互联网的覆盖面就从浏览器一路扩展至操作系统,最终在根本上改变了客户端 - 服务器架构。
在Lamanna看来,大语言模型取得的重大突破让软件具备了理解非结构化内容(包括语言、视频或者音频)以及初步进行逻辑推理的能力,可以根据这些数据得出结论或者判断。“在这种能力的基础之上,浏览器、文字处理器、核心操作系统体验乃至销售流程与客户支持的实施方式,都必将迎来一波大洗牌……在我看来,随着各类智能体和AI功能的全面普及,计算堆栈中的每个部分都将有一些组件迎来重新设计。”
早期采用者们也普遍看到了成果。麦肯锡使用自动路由智能体成功将其项目接收工作流程从原本的20天缩短到仅需2天。Pets at Home在不到两周时间之内部署了防欺诈智能体,每年节约下数百万美元。微软方面还透露,目前采用Copilot Studio的组织包括Nsure、麦肯锡、标准银行、汤森路透、维珍金融、高伟绅律师事务所以及瑞士苏黎世。
Agent网格:让AI智能体间的协作更简单
微软战略的核心,正是Lamanna所说的“智能体网格”——这是一套互联系统,各AI智能体间通过相互协作来解决复杂问题。各智能体并非孤立运作,而可以在整个企业之内无缝传递任务、消息和知识。
到目前为止,Copilot Studio所关联的还仍然是通过聊天触发的AI智能体,但微软正努力把操作类型扩大到更广泛的区间。设想一下企业在实现智能体间无缝协作后会如何:销售智能体可要求库存智能体检查库存情况,而后通知客户服务智能体为客户提供更新信息。这套架构的特点包括:
- 自主智能体,无需人工监督即可检测事件并触发操作;
- 建立起能够协调多个专业智能体的业务流程层;
- 提供实时监控工具,为智能体工作流程提供良好透明度。
微软研究部门最近发布了基于该公司Autogen框架的Magnetic-One系统。这套系统建立起一套复杂的智能体层次结构:由管理智能体在“外循环”中维护任务清单,而专业智能体在“内循环”中负责工作执行。这套架构有望很快采用微软的OmniParser等工具,由智能体解释各类UI元素,由此展现微软在通过智能体操作计算机方面掌握的领先技术储备——同时也是在与Anthropic和谷歌正在开发的功能正面竞争。微软公司表示正努力将这项研究成果投入生产,但没有具体说明相关产品将以何种形式或者何时投放市场。
微软研究院的Magentic-One多智能体系统强调通过内、外两套循环来解决开放Web和基于文件的操作任务。
微软的方案帮助企业客户解决了一项关键挑战:如何在保持控制的同时,将智能体规模从数百个扩展至数百万个。该平台使得企业能够借助其编排功能协调多个专业智能体,这种方法明显也更符合各行业对于多智能体系统的依赖和广泛应用趋势。
该平台的计费模式也反映出这种以企业为先的定位理念。与大多数AI提供商按token计费的思路不同,微软Copilot Studio的定价基于实际交换的消息数量——即强调业务成果,而非原始计算量。Lamanna解释称,如今的企业客户不再纠结于哪种模型最好,更多要求提供具备现实商业价值的用例,“这代表着市场正在发生显著转变。”
企业AI智能体竞争加剧
虽然其他科技巨头也都在大力投资AI智能体,但微软将传统企业功能与广泛集成相结合使其获得了早期优势。Salesforce和服务现在(ServiceNow)等竞争对手已经发布了自己的AI智能体平台,例如Agentforce(号称已经建立起上万种智能体)和服务现在(ServiceNow)Agents。但这些产品相对较新,缺乏微软广阔且稳固的企业覆盖范围:长久以来,全球数亿企业员工都在使用微软打造的生产力套件。
此外,各竞争对手的战略思路也各有不同。OpenAI专注于开放API直接访问,但尚未建立起企业AI智能体部署框架。但其最近发布的o1预览模型展现出了卓越的推理能力,有望在未来支持智能程度更高的AI智能体。而Crew等新晋厂商则提供实验性智能体框架,但缺乏企业级应用规模。LangChain的模块化框架在开发者群体中仍然广受欢迎,但其更注重实验而非企业级部署。亚马逊云科技通过SageMaker等平台保持以开发人员为中心的方法;谷歌的AI平台在特定垂直领域则表现出色,只是缺乏一套适合企业广泛采用的统一智能体框架。
相比之下,微软将企业安全、低代码工具、预构建模板以及面向开发人员的专业代码SDK结合起来,使其成为面向不同团队的更具包容性的选项。软件巨头还花费大量时间努力整合旗下各种应用程序和分析数据库,以确保AI智能体可以本地调用任何企业数据,消除出于检索增强生成(RAG)需求而单独调用数据库的繁琐流程。
当然,AI智能体技术目前仍处于起步阶段。大语言模型仍会产生幻觉,必须对基于这些模型的AI智能体保持谨慎的部署和管理态度,以避免陷入无限循环或者造成不必要的成本。部分客户也对Copilot在定价和实践应用层面的挑战表达了担忧。
这部分市场也有可能长期各自为战。财富五百强企业中有很大一部分往往更倾向于选择多供应商方法,例如采用微软的Copilot智能体来提高员工工作效率,同时针对敏感应用场景选择其他框架。
得AI Agent者,得天下?
虽然微软目前在企业AI智能体部署方面处于领先地位,但这项技术仍处于早期发展阶段。微软方面的优势并不在于任何单一功能,而在于其全面的效能实现方法:高度关注企业级基础设施、广泛集成以及业务成果本身——而非原始AI功能。