OpenAI丨全新AI Agent「Operator」於美面世測試 可訂票、叫Uber

OpenAI 日前正式推出一項名為「Operator」的全新AI助理服務,讓用戶可以透過遠端瀏覽器自動完成多種日常網絡操作,例如填寫表格、訂購雜貨,召Uber等。這項新技術目前以公開測試的形式向美國的 Pro 用戶開放,未來有望陸續擴展至 Plus、Team 和 Enterprise 等更多客戶群,並與 ChatGPT 整合,進一步擴大應用範疇。

Operator與人類界面互動的新模式

Operator 採用一種名為「Computer-Using Agent(CUA)」的新型模型技術,結合視覺理解和高階推理能力。它能透過「看到」瀏覽器的截圖及模擬鍵盤、滑鼠輸入,直接與現有的網站和網頁應用程式互動,而毋須另行開發額外的 API。
這意味著當使用者需要在網上填寫多個表格、下單或進行重複性操作時,只需向 Operator 發出簡單指令,即可自動完成所需步驟。

Operator 安全與私隱並重

為了確保在不同網站上的操作安全,Operator 設有多層防護。當涉及登入或輸入個人支付資訊時,系統會提示用戶改為手動介入,以避免敏感資料被截取;若要完成一些重大操作(例如最終下單),系統同樣會在最後一步再度確認。此外,用戶可透過設定,關閉將其操作數據用於模型訓練的功能,並可一鍵清除瀏覽紀錄和登出所有網站,最大程度保障個人私隱。
若系統偵測到一些可疑頁面(可能包含暗藏的攻擊或錯誤指令),便會主動暫停行動並提醒用戶,務求在多個環節上把風險降至最低。

Operator與多家企業合作落地

目前,Operator 與美國多家知名企業如 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 以及 Uber 等建立合作關係,旨在測試並優化這套代理服務在真實商業場景中的效果。
同時,Operator 亦與加州斯托克頓市(City of Stockton)攜手,嘗試將這套系統應用在城市公共服務領域,希望為市民減省繁瑣的線上流程,並進一步提升行政效率和普及率。據了解,在公共服務層面上,Operator 有助簡化城市程序和表格填寫,讓更多市民在網上也能享受到更便捷的服務。

Operator使用方法與未來展望

要使用這項新服務,現時只需登入其專屬網站並輸入待辦的任務便可。過程中,使用者亦可隨時終止 AI 的自動化步驟,並自行手動輸入更多個人資訊或完成需要人手驗證的任務。
OpenAI 計劃在未來釋出更多功能,包括支援更複雜、耗時更長的操作流程,並推出 CUA 的 API 給開發者自行整合。長遠來看,當 Operator 與 ChatGPT 完整整合後,或能進一步升級多工處理能力,從日常購物到專業辦公都可望大幅提升效率。

OpenAI 表示,現階段仍在積極收集用戶反饋,以便持續完善這套瀏覽器代理服務。在這個自動化技術備受關注的時代,Operator 的出現無疑為網上應用帶來了一種更直觀、便捷的新體驗。對香港乃至全球的用戶而言,這或許是進一步拓闊 AI 工具使用場景的一大里程碑,也將為未來的網上互動與商業生態帶來更多可能性。