亚洲成片在线观看12345ba-亚洲成人午夜影院-亚洲成网站www久久九-亚洲大黑香蕉在线观看75-3p性小说-4338×亚洲全国最大色成网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 頭條資訊 >> 正文

比GPT-3.5 Turbo便宜超60% OpenAI推出小模型卷性價比

2024年7月23日 07:46  每日經濟新聞  

7月18日,OpenAI正式推出新一代入門級別人工智能模型“GPT-4o mini”,稱這款新模型是“功能最強、性價比最高的小參數模型”。

從OpenAI官網的介紹來看,GPT-4o mini在文本智能和多模態推理方面的基準性能超越了GPT-3.5 Turbo,在LMSYS(指聊天機器人(9.770, 0.07, 0.72%)對戰)排行榜上還超過GPT-4。而價格層面,GPT-4o mini相比GPT-3.5 Turbo便宜了超過60%。

在“大力出奇跡”的Scaling Law(尺度定律)之外,如何做好小模型正在成為大模型廠家的新考題。

OpenAI入局小模型賽場

OpenAI表示,預計GPT-4o mini將通過大幅降低智能的成本,顯著擴展AI應用的范圍。據官網介紹,GPT-4o mini的優勢在于低成本和低延遲,支持廣泛的任務,例如串聯或并行多個模型調用的應用程序(例如調用多個API);向模型傳遞大量上下文(例如完整代碼庫或對話歷史);或通過快速、實時的文本響應與客戶互動(例如聊天機器人)。

目前,GPT-4o mini在API中支持文本和視覺功能,未來將支持文本、圖像、視頻和音頻的輸入和輸出。該模型具有128K Token的上下文窗口,數據更新至2023年10月。

性能方面,OpenAI稱,GPT-4o mini在涉及文本和視覺的推理任務中優于其他小模型,在MMLU(文本智能和推理基準測試)中得分為82.0%,相比之下,Gemini Flash為77.9%,Claude Haiku為73.8%。

在數學推理和編碼任務方面,GPT-4o mini超過了市場大部分小模型。在MGSM(數學推理評估)中,GPT-4o mini得分為87.0%,而谷歌發布的Gemini Flash為75.5%;在HumanEval(編碼性能評估)中,GPT-4o mini得分為87.2%,而Gemini Flash為71.5%。

價格方面,GPT-4o mini每百萬個輸入Token為15美分(約合人民幣1.09元),每百萬個輸出Token為60美分(約合人民幣4.36元)。OpenAI表示,這一價格相較GPT-3.5 Turbo便宜超60%。

OpenAI表示,在過去幾年中,人們見證了AI的顯著進步和成本的大幅降低。例如,自2022年推出文本模型Text-Davinci-003以來,GPT-4o mini的每個Token成本已經下降了99%。

按照設想,OpenAI希望未來能夠將一個模型無縫集成到每個應用程序和每個網站中,而GPT-4o mini正在為開發者更高效和更經濟地構建和擴展強大的AI應用程序鋪平道路。

不過,在小模型賽場中,OpenAI的各家競爭對手已經早早就位。例如谷歌推出的Gemini Flash,Anthropic旗下的Claude Haike等。近日,Mitral AI與英偉達推出的小模型Mistral Nemo上線,聲稱性能趕超Meta推出的Llama-3 8B。

大模型越卷越“小”

這一年來,“降本增效”已經成為大部分大模型公司的共識。

平安證券研報認為,OpenAI新模型GPT-4o mini兼具性能與性價比,有望加速大模型應用落地。當前全球范圍內的大模型逐漸呈現由單方面的性能角逐,轉向性能與實用性并重的發展趨勢。大模型能力達到一定水平時必然會走向應用,大模型廠商通過提升其產品性價比,助推下游應用端的推廣部署,有望加速大模型產業鏈商業閉環的形成。

一方面,上半年開打的大模型價格戰不斷蔓延,從兩家海外AI巨頭OpenAI和谷歌開始,到國內字節跳動、阿里、百度、智譜AI、科大訊飛(39.640, 0.34, 0.87%)等企業,入局者不斷增加。從OpenAI此舉來看,這場價格戰還將持續。

IDC中國研究經理程蔭此前在接受《每日經濟新聞》記者采訪時就談到,從短期的發展來看,大模型能力更新迭代后將會走向趨同,無論是國內還是國外的技術供應商都不能建立起長久的護城河。一些技術供應商選擇直接砍掉大模型成本上的門檻,除了出于促進大模型落地應用,也有增加曝光度,爭搶用戶、防止用戶流失的動因。

另一方面,通過“小模型”,以更低的成本,垂直覆蓋更多的應用場景,以推動端側應用的落地同樣成為行業趨勢。同時,隨著以蘋果為代表的各大手機廠商加速發力AI手機,端側大模型正在成為新的競爭焦點。

專注端側模型的面壁智能CEO李大海此前在接受包括《每日經濟新聞》在內的記者采訪時就談到,相同智能水平的模型,每8個月其參數規模將減少一半,這與摩爾定律具有一定的相似性。在同等性能下,參數規模減小,說明大模型的知識密度在不斷提高。李大海表示,隨著大模型知識密度的提升和端側算力的增強,兩個因素疊加,有信心在2026年年底前研發出達到GPT-4水平的端側模型,當端側模型能夠實現GPT-4水平時,很多端側的產品會更快落地。

李大海認為,當端側模型可以應用,其成本會更低,且可靠性更高,不需要依賴網絡。例如,在用戶需求交流時,基于端側模型的陪伴機器人能夠迅速作出反應。這種比較優勢使得在適用端側模型的場景中,大家會更傾向于選擇端側解決方案。

今年3月,百度也發布ERNIESpeed、ERNIE Lite、ERNIE Tiny三個輕量模型。百度集團董事長李彥宏在今年4月的一場公開演講中也談到,MoE、小模型和智能體是值得關注的三個方向。“通過大模型,壓縮蒸餾出來一個基礎模型,然后再用數據去訓練,這比從頭開始訓小模型效果要好很多,比基于開源模型訓出來的模型效果更好、速度更快、成本更低。”李彥宏表示。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
尚冰:中國互聯網應用蓬勃發展,多項關鍵指標位居全球第一
精彩專題
CES 2024國際消費電子展
2023年信息通信產業盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 农村寡妇女人一级毛片 | 中文字幕有码在线 | 欧美性高清视频免费看www | 日本一区二区三区视频在线观看 | 国产乱码精品一区二区三区网页版 | 天天看片夜夜爽 | 成人久久久观看免费毛片 | 女人牲交视频一级毛片 | 国产精品视频网 | 国产手机精品视频 | 18成人免费观看视频 | 精品国产一区二区三区不卡 | 日本免费不卡视频一区二区三区 | 国产黄视频在线观看 | 欧美一级α片 | 黄色免费网站在线观看 | 欧美性受一区二区三区 | www黄色网址 | 91夜夜 | 国产热热| 免费国产成人综合 | a毛片a毛片a视频 | 亚洲综合久久伊人热 | 很黄很色很爽无病毒网站 | 怡春院日本一区二区久久 | 欧美成人在线视频 | 久久996re热这里有精品 | 欧美日本在线一区二区三区 | 国产日韩欧美不卡www | 色综合第一页 | 欧美色图导航 | 老头边吃奶边做边爱 | 三级网址在线 | 亚洲欧洲日产v特级毛片 | 欧美日韩一区二区在线 | 美女大黄网站 | 国产国语videosex| 欧美性天堂| 精品国产综合成人亚洲区 | 久久精品国产大片免费观看 | 国产亚洲欧美日韩综合综合二区 |