- +1
OpenAI發(fā)布GPT-5.4大語言模型,增強計算機視覺和工具使用能力
OpenAI集團今日發(fā)布了一款新的大語言模型,該公司表示這款模型在自動化工作任務方面比早期算法更加熟練。
GPT-5.4現(xiàn)已在ChatGPT、Codex編程工具和OpenAI的應用程序編程接口中提供。
該公司根據(jù)其大語言模型在生成提示響應時處理的Token數(shù)量向API用戶收費。Token是由幾個字母或字符組成的數(shù)據(jù)單位。OpenAI表示,GPT-5.4使用的Token比12月發(fā)布的GPT-5.2"顯著"減少。減少模型的Token使用量可以降低推理計算成本。
OpenAI表示,其新模型還可以通過其他方式降低客戶的推理費用。
基于OpenAI API構(gòu)建的應用程序通常依賴外部程序或工具來完成任務。在此之前,開發(fā)者必須準備其應用程序使用的工具的詳細列表,并將其包含在API請求中。工具列表可能會使API請求的大小增加數(shù)千個Token,從而推高推理成本。
GPT-5.4使這一工作流程更加高效。據(jù)OpenAI稱,一個新的搜索引擎使模型能夠自動找到應用程序執(zhí)行給定任務所需的工具。這避免了上傳詳細工具列表的需要,從而減少了提示大小和推理成本。
新模型可以處理多達100萬個Token的請求。與前代產(chǎn)品相比,該模型在處理包含圖像的提示方面表現(xiàn)顯著更好。開發(fā)者可以上傳包含超過1000萬像素的圖像而無需壓縮,這防止了潛在重要細節(jié)的丟失。
升級的視覺能力使GPT-5.4在計算機使用方面更加熟練,即通過用戶界面與應用程序交互的任務。OpenAI使用名為OSWorld-Verified的流行計算機使用基準測試對該模型進行了評估。它以75%的分數(shù)創(chuàng)下行業(yè)記錄,高于GPT-5.2的結(jié)果和人類測試者通常達到的72.4%。
該模型在其他領域也超越了前代產(chǎn)品。GPT-5.4在OpenAI創(chuàng)建的電子表格分析基準測試中獲得了87.3%的平均分數(shù),比GPT-5.2提高了8%以上。新模型在準備演示文稿、使用瀏覽器進行在線研究和回答科學問題方面也表現(xiàn)更佳。
GPT-5.4通過OpenAI的API提供,價格為每百萬輸入Token 2.5美元,每百萬輸出Token 12美元。有高級需求的用戶可以訪問模型的增強版本GPT-5.4 Pro,OpenAI表示該版本旨在為"復雜任務提供最大性能"。增強版本也與標準版本一起在ChatGPT中提供。
Q&A
Q1:GPT-5.4相比GPT-5.2有哪些主要改進?
A:GPT-5.4在多個方面都有顯著改進:首先是Token使用量大幅減少,降低了推理計算成本;其次是視覺處理能力大幅提升,可以處理超過1000萬像素的圖像而無需壓縮;第三是新增自動工具搜索功能,避免了手動上傳詳細工具列表的需要;最后在各項基準測試中表現(xiàn)更優(yōu),包括計算機使用、電子表格分析等任務。
Q2:GPT-5.4的定價策略是怎樣的?
A:GPT-5.4通過OpenAI的API提供服務,標準版本的價格為每百萬輸入Token 2.5美元,每百萬輸出Token 12美元。對于有高級需求的用戶,OpenAI還提供增強版本GPT-5.4 Pro,專為復雜任務設計以提供最大性能。該增強版本同時在ChatGPT和API中提供。
Q3:GPT-5.4在計算機使用能力方面表現(xiàn)如何?
A:GPT-5.4在計算機使用能力方面表現(xiàn)卓越,在OSWorld-Verified基準測試中獲得75%的分數(shù),創(chuàng)下行業(yè)新紀錄。這一成績不僅超越了前代GPT-5.2,還高于人類測試者通常達到的72.4%。這意味著GPT-5.4在通過用戶界面與應用程序交互方面已經(jīng)達到甚至超越了人類水平。
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




