文/林妍溱 | 2025-02-03發表
根據OpenAI提供的數據,在程式競賽測試(Codeforces)測試中,o3-mini-high表現高過前代模型。(圖片來源/OpenAI)
繼兩周前執行長Sam Altman預告,OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini,已部署到ChatGPT及API供付費方案用戶及開發人員使用。
OpenAI是於去年12月新消息12連發中,公布最新一代具推理能力的旗艦模型o3,並預告o3-mini將是最先推出的同系列模型。
OpenAI指出,o3-mini保有OpenAI o1-mini的低成本及低延遲性,但進一步拓展小模型的效能及速度,具備優異的STEM(科學、數學和程式撰寫)能力。o1仍是OpenAI最主要的通用知識推理模型,但是在需要精準和速度的STEM領域o3-mini提供另類選擇。在ChatGPT中,o3-mini使用中等推理能力,兼顧速度和答案的精準性。
對開發人員而言,o3 mini也是OpenAI第一個提供高呼聲開發功能的小型模型,像是函式呼叫、結構式輸入及開發人員訊息等。和o1-mini相同,o3-mini也支援串流。開發人員有低、中、高三種推理能力,可以選擇用於不同使用場景。這種彈性讓o3-mini可以在解決複雜任務時更積極思考,或是在考量延遲性時優化速度。
根據OpenAI提供的數據,在AIME 2024數學標竿測試中,o3-mini-high推理能力等級模型得分在87.3,優於o1-preview的56.7及o1-mini的63.6。科學解題的GPQA Diamond測試中,o3-mini-high(79.7)也高於o1-preview(78.3)及o1-mini(60.0)。程式競賽測試(Codeforces)及軟體工程(SWE-bench Verified)測試中,o3-mini-high也都高過另二個前代模型。
圖片來源/OpenAI
o3-mini現在也能整合搜尋功能,可提供即時網頁答案及連結。OpenAI說致力於將搜尋整合至所有推理模型,o3-mini是早期原型。
不過目前o3並不支援視覺功能,需要的用戶還是得繼續使用o1-mini。
o3-mini現在已部署到ChatGPT及API。API部分,即日起o3-mini已經部署到API使用層級3到5特定開發人員的Chat Completions API、Assistants API及Batch API。
在ChatGPT部分,Plus、Team和Pro用戶現在就可以存取o3-mini,企業方案用戶2月可以開始使用。在模型選擇器中的o1-mini將由o3-mini取代,提供更高速限和更低延遲性。Plus和Team用戶每天互動訊息,由o1-mini的50則提高為o3-mini的150則。所有付費用戶都可以在模型選擇器,選擇回應時間耗時較久的o3-mini-high,Pro用戶則可以無上限選擇o3-mini及o3-mini-high。
免費方案用戶也可以試用o3-mini,方法是選擇訊息輸入列的「Reason」圖示。o3也是第一個提供給免費ChatGPT用戶的推理模型。
OpenAI指出,由於持續提升模型數理推理能力,和GPT-4相比,現在OpenAI的模型每字詞使用價格已降低95%,未來該公司會持續朝此發展。
OpenAI此舉顯然部分是回應橫空出世的中國新興開源模型DeepSeek。DeepSeek V3模型多項效能測試超越Meta Llama,令美國AI科技公司繃緊神經,加快研發及推出作業。
精選專案.網頁設計.RWD響應式網站.企業形象網站 / 服務類
網站技術:PHP . Javascript/MySql
協助民眾了解與申請商標的相關流程與資訊,讓客戶加深專利商標這方面的訊息,以過往的案件來加深大眾對於商標的重要性。甚至可以為不同類型客戶量身打造品牌策略服務、分析對手情況...等等服務。
精選專案.Line OA / 休閒餐飲類
網站技術:PHP/MySql
勝博殿終於推出LINE OA 官方帳號,LINE 聊天室裡包含最新消息、訂位/餐與票劵/點數。不但可以累積點數甚至還可以兌換商品。此功能推出無疑就是增加用博殿的用餐次數。
精選專案.APP / 休閒餐飲類
網站技術:PHP . iOS . Android/MySql
勝博殿兌換推出APP版,讓使用者隨時使用APP確認點數、查詢門市...等等。可以隨時隨地的查詢目前使用多少點數。也可以在下次用餐時可以兌換餐點。
電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map
© 2019 傑立資訊 All rights reserved.| 網站隱私政策