人工智能的第三階段已經到來。以下是“特工”如何影響我們的生活。
我們正在進入生成式人工智能的第三階段。首先是聊天機器人,其次是助手。現在我們開始看到代理:渴望更大自主權的系統,可以在“團隊”中工作或使用工具來完成復雜的任務。
最新熱銷產品是OpenAI的ChatGPT 代理.這將兩個預先存在的產品(Operator 和 Deep Research)組合成一個更強大的系統,根據開發人員的說法,該系統“思考和行動”。
這些新系統代表了早期人工智能工具的進步。了解它們的工作原理、它們能做什么——以及它們的缺點和風險——正迅速變得至關重要。
從聊天機器人到代理
ChatGPT 于 2022 年 11 月啟動了聊天機器人時代,但盡管其人氣爆棚對話界面限制了該技術可以做的事情。
相關:ChatGPT:關于人工智能聊天機器人實際工作原理的 5 個令人驚訝的真相
輸入 AI 助手,或副駕駛員.這些系統建立在為生成式人工智能聊天機器人提供支持的相同大型語言模型之上,只是現在才設計用于在人類指令和監督下執行任務。
代理商是另一個進步。它們旨在追求具有不同程度自主權的目標(而不僅僅是完成任務),并得到更高級的功能的支持,例如推理和記憶.
多個 AI 代理系統可能能夠共事,相互交流計劃、安排、決定和協調以解決復雜問題。
代理也是“工具用戶”,因為他們也可以調用軟件工具用于特殊任務——例如 Web 瀏覽器、電子表格、支付系統等。
快速發展的一年
Agentic AI 有感覺迫在眉睫自去年年底以來。去年 10 月,一個重要時刻到來,當時 Anthropic 賦予其 Claude 聊天機器人與計算機交互就像人類一樣。該系統可以搜索多個數據源,查找相關信息并提交在線表格。
其他人工智能開發人員也很快效仿。OpenAI 發布名為算子,Microsoft宣布Copilot 代理,我們看到了谷歌的頂點 AI和 Meta 的駱駝特工.
今年早些時候,中國初創公司 Monica 展示了其 Manus AI 代理購買房地產和將講座錄音轉換為摘要筆記.另一家中國初創公司 Genspark 發布了搜索引擎代理返回單頁概述(類似于谷歌現在這樣做了)嵌入指向在線任務的鏈接,例如查找最佳購物優惠。
另一家初創公司,聰明,提供了一個有點精神錯亂的“無所不用其極”的代理,該代理已經引起了關注,但尚未提供有意義的結果。
這是人類思想的終結。https://t.co/7DLscYZu3W
— Cluely (@cluely)6月 27, 2025
并非所有代理都是為通用活動而設計的。有些是專門針對特定領域的。
編碼和軟件工程在這里處于領先地位,Microsoft 的副駕駛員編碼代理和 OpenAI 的食品在領跑者中。這些代理可以獨立編寫、評估和提交代碼,同時還可以評估人工編寫的代碼是否存在錯誤和性能滯后。
搜索、摘要等
生成式人工智能模型的核心優勢之一是搜索和摘要。代理可以使用它來執行可能需要人類專家數天才能完成的研究任務。
OpenAI 的深入研究使用多步驟在線研究處理復雜的任務。谷歌的AI“聯合科學家”是一個更復雜的多智能體系統,旨在幫助科學家產生新的想法和研究提案。
代理可以做更多的事情,但也會犯更多錯誤
盡管大肆宣傳,人工智能代理還是充滿了警告。雙人為的和開放人工智能,例如,規定主動的人工監督以盡量減少錯誤和風險。
OpenAI 還表示,其 ChatGPT 代理具有“高風險”,因為它有可能協助制造生物和化學武器。不過,該公司尚未公布這一說法背后的數據,因此很難判斷。
但是,代理在現實世界中可能帶來的風險類型如下所示Anthropic 的 Project Vend.Vend 指派了一名人工智能代理作為一家小型企業來運營一臺員工自動售貨機——該項目瓦解為搞笑但令人震驚的幻覺和裝滿鎢塊而不是食物的冰箱。
在另一個警示故事中,編碼代理刪除一個開發商的整個數據庫,后來說它“恐慌了”。
辦公室的代理
盡管如此,代理已經在尋找實際應用。
2024 年,Telstra 大量部署Microsoft Copilot 訂閱.該公司表示,人工智能生成的會議摘要和內容草稿每周平均為員工節省 1-2 小時。
許多大型企業都在推行類似的戰略。較小的公司也在嘗試代理,例如總部位于堪培拉的建筑公司 Geocon 使用交互式人工智能代理來管理其公寓開發項目中的缺陷.
人力和其他成本
目前,來自代理商的主要風險是技術置換。隨著代理的改進,他們可能會取代許多部門和工作類型的人類工人。同時,代理商的使用也可能加速下降入門級白領工作.
使用人工智能代理的人也面臨風險。他們可能過于依賴人工智能,卸載重要的認知任務。如果沒有適當的監督和護欄,幻覺、網絡攻擊和復合錯誤會很快使特工偏離其任務和目標,從而造成傷害、損失和傷害。
真正的成本也不清楚。所有生成式 AI 系統消耗大量能量,這反過來又會影響使用代理的價格——尤其是對于更復雜的任務。
了解代理 - 并構建您自己的代理
盡管存在這些持續的擔憂,但我們可以預期人工智能代理將變得更加強大,更多地出現在我們的工作場所和日常生活中。開始自己使用(也許還可以構建)代理并了解他們的優勢、風險和局限性并不是一個壞主意。
對于普通用戶來說,代理最容易通過以下方式訪問Microsoft 副駕駛工作室.這伴隨著內置的保障措施、治理和代理商店用于常見任務。
對于更雄心勃勃的人,您可以使用朗鏈框架。