飛象網訊 (計育青/文)如今各行各業都對AI大模型非常關注,期待著越來越多好用易用、低成本的AI應用能夠改變我們的工作和生活。近日,零一萬物公司發布了多款AI模型,以其突出的表現吸引了業界的廣泛關注。
零一萬物此次發布了具有千億參數規模的閉源模型Yi-Large,在斯坦福最新的AlpacaEval 2.0全球大模型排行榜上贏率名列第一。零一萬物還推出了多款參數規模較小的開源模型,這些模型在多種第三方測試中都做到了同等級別模型SOTA性能最佳。零一萬物CEO李開復表示,零一萬物的目標是打造普惠型、全球化的AI大模型,讓人人都能從中受益。

Yi-Large躋身全球SOTA頂級大模型行列
2023年11月,零一萬物曾發布了Yi-34B大模型,雖然參數規模并不大,但評測結果卻超越了Llama2-70B、Falcon-180B等大規模模型,成為當時全球最強的開源基礎模型之一。時隔半年,零一萬物又推出了千億參數規模的Yi-Large,性能表現更是經驗。
據李開復介紹,第三方權威評測結果表明,零一萬物Yi-Large的中英文雙語表現都非常出色。在最新的斯坦福AlpacaEval 2.0榜單上,Yi-Large模型的英語能力主要指標“控制回復的長度”名列世界第二,僅次于GPT-4 Turbo。在此之前,國內大模型僅有零一萬物和Qwen曾經登上此榜單的前20名。在中文能力方面,SuperCLUE發布的四月評測報告中,Yi-Large位列國產大模型之首,而且綜合中英雙語能力都表現優異。在更全面的綜合評測中,Yi-Large有多數指標超越了GPT4、Claude3、Google Gemini 1.5等同級模型,在通用能力、代碼生成、數學推理、指令遵循等方面都位居領先,穩列全球第一梯隊。
李開復表示,一系列權威測評表明,Yi-Large是當前可用的最好的AI大模型,不過零一萬物仍在繼續創新,正在訓練規模更大的新模型Yi-XLarge。Yi-XLarge將是一種混合專家大模型(MoE),雖然尚未完成最終訓練,但是在一些權威評測中仍然做到了與Claude-3-Opus、GPT4-0409最新旗艦級模型互有勝負,非常值得期待。
Yi-1.5開源大模型實現普惠式服務
Yi-Large是面向商用市場的閉源大模型,不過零一萬物此次也帶來了新升級的開源系列模型Yi-1.5,包括34B、9B、6B 三個不同規模的版本和Yi-1.5-Chat微調模型。測評結果表明,Yi-1.5系列模型在數學推理、代碼能力、指令遵循等方面表現很突出,遠勝同參數規模的其它模型,也優于近期發布的Llama-3-8B-Instruct模型。
李開復表示,很多學生、創業者、老師、科研人員、公益組織都需要學習、探索和使用大模型,但是可能無法承擔GPT-4、Yi-Large等商業閉源大模型的成本,因此推出開源的AI大模型非常重要。零一萬物的策略是以開源模型構建生態、提供普惠式服務,吸引科研院校、學生、開發者、創業者在此基礎上開展教學和創新,豐富生態、拓展應用;同時,以閉源模型展開前沿探索,服務對先進AI大模型有迫切需求的前沿企業。開源閉源雙軌體系構成了良好的生態環境,加快AI技術和應用的迭代進步。
為幫助業界快速接入全球領先的AI大模型,零一萬物此次不僅發布了閉源、開源的系列模型,還推出了面向個人用戶的“萬知”服務、賦能行業伙伴的“API 開放平臺”。李開復表示,使用“萬知”服務很方便,一是在微信上搜索“萬知”小程序,二是登錄wanzhi.com。“萬知”的作用不僅僅是一個對話工具,它也可以分析海量數據,處理文字、圖表等信息,自動生成PPT等文檔,成為一種高效的工作助手、生產力工具。零一萬物的“API 開放平臺”面向商用市場,不過設計非常周到,既有調用大規模AI模型的Yi-Large-RAG API和Yi-Large-Turbo API,也有調用中小規模AI模型的Yi-Medium API、Yi-Vision API,以及調用超小規模模型的Yi-Spark API,成本從高到低,客戶可以各取所需。
“零一萬物API的特色是既追求最高的性能,又追求很好的性價比。”李開復說。
發展AI大模型也要講求成本收益
人們通常認為,AI大模型就是要靠越來越復雜的算法、越來越強的算力基礎設施來支撐,這導致每一家AI模型開發企業都在持續投入巨資建設算力,而收益卻遠遠跟不上。李開復認為,AI大模型的競爭不是一場短程賽跑,更像是一場比拼耐力的長跑,每一個身處其間的選手都應該關注投資和收益,設法降低訓練成本、用戶調用API的價格,并且根據實際應用需求,務實地壓縮模型規模。
零一萬物有自己的獨特優勢,比如全球化布局,模型與算力架構綜合研發能力等。零一萬物是一家面對全世界開展服務的AI企業,在美歐等市場都開展業務,因此可以發展更快的國外經驗引入國內市場,包括成本優化、模型規模調整、市場策略等,從而使得在國內開發的產品從一開始就能很好地適應市場需求,并且能很快獲得收益。李開復告訴記者,零一萬物已經有產品在海外市場上線了九個月,贏得了千萬級用戶規模,在行業市場上也與部分世界500強企業達成了深度合作關系。另一方面,零一萬物不僅僅從事大模型開發,同時也有自己的專業算力架構團隊,能夠從底層算力的層面對模型進行優化,因此整體訓練成本比只做大模型開發的企業低一半左右,而且可以用有限的算力資源來打造性能極致的大模型產品。
李開復表示,美國一些先進的企業可以大量堆砌先進GPU算力,中國企業則沒有這個條件,必須采取更加務實的策略,加強對AI+算力架構的綜合開發,這其實也是美國AI研發企業的共識。總的來說,就是做AI模型研究必須要“向下走”,具備一定的計算效率優化能力。經過優化,零一萬物千億參數模型的訓練成本同比降幅達一倍之多。以“萬知”服務為例,零一萬物利用自研的基于全導航圖的新型向量數據庫笛卡爾訓練,大大縮減了“萬知”的訓練速度和成本,與采用第三方的向量數據庫相比,節約成本超過80%。
從2023年9月開始,零一萬物先后在海外推出了4款產品,面向個人用戶的大模型產品也成功打通了用戶訂閱制的商業模式。李開復最后強調,AI大模型的推廣應用將是一個長期的過程,不能依靠免費推廣、持續大投入研發升級的模式來爭奪市場。一個更合理的模式是發展性能優異、規模合理、高性價比的AI大模型產品體系,以不同層次的閉源大模型賦能產業伙伴、服務商業客戶,以適當性能的開源模型促進生態建設、激活應用需求。“接下來,零一萬物將立足全球市場,亦不斷升級的大模型應用助力中國建設普惠型AI時代。”李開復說。