7月18日消息,OpenAI今日凌晨宣布將在ChatGPT中推出一款通用型AI智能體,該公司表示該智能體可以幫助用戶完成各種基于計算機的任務(wù)。
OpenAI介紹稱,該智能體可以自動生成可編輯的演示文稿和幻燈片、查看用戶的日歷來簡要介紹即將到來的客戶會議、計劃并購買制作家庭早餐的食材,以及運行代碼等。
該工具名為ChatGPT agent,結(jié)合了OpenAI之前多種智能體工具的功能,包括Operator點擊網(wǎng)站的能力,以及Deep Research從數(shù)十個網(wǎng)站中綜合信息生成簡潔研究報告的能力。OpenAI表示用戶只需通過自然語言提示ChatGPT即可與該智能體進行交互。
為了開發(fā)這個新工具,OpenAI將其背后的Operator和Deep Research團隊合并為一個統(tǒng)一的團隊。外媒The Verge報道稱,這個新團隊由產(chǎn)品和研究部門共20~35人組成。
OpenAI今日起將向Pro、Plus和Team計劃的訂閱用戶推出ChatGPT智能體,今年夏末向ChatGPT企業(yè)和教育用戶開放。要激活該工具,用戶可以在ChatGPT的工具下拉菜單中選擇“智能體模式(agent mode)”。
OpenAI表示ChatGPT智能體比其之前的任何產(chǎn)品都要強大得多,可以訪問ChatGPT連接器,允許用戶連接像Gmail和GitHub這樣的應(yīng)用,智能體可以根據(jù)用戶的提示找到相關(guān)信息。此外,OpenAI表示ChatGPT智能體可以訪問終端,并可以使用API來訪問某些應(yīng)用。
根據(jù)OpenAI的說法,ChatGPT智能體的底層模型在多個基準測試中提供了最先進的性能。ChatGPT智能體模型在Humanity's Last Exam(pass@1)中得分率為41.6%,這是一項由數(shù)千個問題組成的、涵蓋超過一百個學(xué)科的困難測試。這個分數(shù)大約是OpenAI o3和o4-mini得分的兩倍。
在已知最難的數(shù)學(xué)基準測試之一FrontierMath中,OpenAI表示,當ChatGPT智能體可以訪問工具(IT之家注:如用于代碼執(zhí)行的終端)時,其得分為27.4%,之前的最佳分數(shù)來自o4-mini(得分僅為 6.3%)。