OpenAI發(fā)布GPT-5.4大語言模型，增強計算機視覺和工具使用能力

2026-03-07 14:04

來源：澎湃新聞·澎湃號·湃客

OpenAI集團今日發(fā)布了一款新的大語言模型，該公司表示這款模型在自動化工作任務方面比早期算法更加熟練。

GPT-5.4現(xiàn)已在ChatGPT、Codex編程工具和OpenAI的應用程序編程接口中提供。

該公司根據(jù)其大語言模型在生成提示響應時處理的Token數(shù)量向API用戶收費。Token是由幾個字母或字符組成的數(shù)據(jù)單位。OpenAI表示，GPT-5.4使用的Token比12月發(fā)布的GPT-5.2"顯著"減少。減少模型的Token使用量可以降低推理計算成本。

OpenAI表示，其新模型還可以通過其他方式降低客戶的推理費用。

基于OpenAI API構(gòu)建的應用程序通常依賴外部程序或工具來完成任務。在此之前，開發(fā)者必須準備其應用程序使用的工具的詳細列表，并將其包含在API請求中。工具列表可能會使API請求的大小增加數(shù)千個Token，從而推高推理成本。

GPT-5.4使這一工作流程更加高效。據(jù)OpenAI稱，一個新的搜索引擎使模型能夠自動找到應用程序執(zhí)行給定任務所需的工具。這避免了上傳詳細工具列表的需要，從而減少了提示大小和推理成本。

新模型可以處理多達100萬個Token的請求。與前代產(chǎn)品相比，該模型在處理包含圖像的提示方面表現(xiàn)顯著更好。開發(fā)者可以上傳包含超過1000萬像素的圖像而無需壓縮，這防止了潛在重要細節(jié)的丟失。

升級的視覺能力使GPT-5.4在計算機使用方面更加熟練，即通過用戶界面與應用程序交互的任務。OpenAI使用名為OSWorld-Verified的流行計算機使用基準測試對該模型進行了評估。它以75%的分數(shù)創(chuàng)下行業(yè)記錄，高于GPT-5.2的結(jié)果和人類測試者通常達到的72.4%。

該模型在其他領域也超越了前代產(chǎn)品。GPT-5.4在OpenAI創(chuàng)建的電子表格分析基準測試中獲得了87.3%的平均分數(shù)，比GPT-5.2提高了8%以上。新模型在準備演示文稿、使用瀏覽器進行在線研究和回答科學問題方面也表現(xiàn)更佳。

GPT-5.4通過OpenAI的API提供，價格為每百萬輸入Token 2.5美元，每百萬輸出Token 12美元。有高級需求的用戶可以訪問模型的增強版本GPT-5.4 Pro，OpenAI表示該版本旨在為"復雜任務提供最大性能"。增強版本也與標準版本一起在ChatGPT中提供。

Q&A

Q1：GPT-5.4相比GPT-5.2有哪些主要改進？

A：GPT-5.4在多個方面都有顯著改進：首先是Token使用量大幅減少，降低了推理計算成本；其次是視覺處理能力大幅提升，可以處理超過1000萬像素的圖像而無需壓縮；第三是新增自動工具搜索功能，避免了手動上傳詳細工具列表的需要；最后在各項基準測試中表現(xiàn)更優(yōu)，包括計算機使用、電子表格分析等任務。

Q2：GPT-5.4的定價策略是怎樣的？

A：GPT-5.4通過OpenAI的API提供服務，標準版本的價格為每百萬輸入Token 2.5美元，每百萬輸出Token 12美元。對于有高級需求的用戶，OpenAI還提供增強版本GPT-5.4 Pro，專為復雜任務設計以提供最大性能。該增強版本同時在ChatGPT和API中提供。

Q3：GPT-5.4在計算機使用能力方面表現(xiàn)如何？

A：GPT-5.4在計算機使用能力方面表現(xiàn)卓越，在OSWorld-Verified基準測試中獲得75%的分數(shù)，創(chuàng)下行業(yè)新紀錄。這一成績不僅超越了前代GPT-5.2，還高于人類測試者通常達到的72.4%。這意味著GPT-5.4在通過用戶界面與應用程序交互方面已經(jīng)達到甚至超越了人類水平。

特別聲明

本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#OpenAI