DeepSeek繼2025年1月20日發布DeepSeek-R1引發業內對開源AI的廣泛關注和熱烈討論后,又將2月最后一周作為開源周“連放大招”,公開V3/R1的核心代碼和系統架構等重磅內容。在全球開發者驚嘆并對DeepSeek下一代模型充滿期待的同時,業界也出現了對開源AI如何保持競爭力、如何推進商業化等的擔憂或質疑。本文嘗試通過理清與分析開源AI的定義、意義和商業模式等,解答上述問題。
開源AI定義與DeepSeek開放程度
AI模型有別于傳統軟件,其不僅包括代碼,還涉及數據、參數和權重等,因此開源AI的定義并不像開源軟件般清晰,目前尚未形成統一認知。不過,LF AI&DATA 基金會1和開源倡議組織(OSI)2024年陸續提出了模型開放性框架(MOF)和開源AI定義(OSAID)1.0,為DeepSeek等是否屬于開源AI提供參考。
1.依據MOF,DeepSeek-V3/R1尚未達到最開放層級
模型開放性框架(MOF)由LF AI&DATA 基金會于2024年4月發布,用于客觀評估和分類機器學習模型的完整性和開放性。
MOF定義了Ⅲ、Ⅱ、Ⅰ等三個開放范圍逐步擴展的層級。Ⅲ級-開放模型要求開放模型架構、參數、技術報告等組件,幫助用戶使用、分析和構建模型,但限制了用戶對開發過程的深入了解。Ⅱ級-開放工具要求在Ⅲ級的基礎上,開放訓練和推理代碼等,幫助開發者更深入地理解模型工作原理,以及將模型部署至不同的環境和應用。Ⅰ級-開放科學要求在Ⅱ級的基礎上,開放數據集和研究論文等,確保研究者能夠完全訪問和復現AI模型的各個方面。目前,智源Aquila-VL-2B模型已通過MOF評估I級。
DeepSeek-V3/R1開放了模型參數、技術報告、部分訓練和推理代碼等,大致處于MOF的Ⅱ級,能夠良好地滿足使用者和開發者的需求,但距離“最開放”仍有空間。
表1 MOF分級與DeepSeek-V3/R1開放情況

注:根據公開信息整理,供參考。
2. 依據OSAID 1.0,DeepSeek-V3/R1尚不屬于開源AI
開源AI定義(OSAID)1.0是由OSI于2024年10月提出的全球首個開源AI標準,要求開源AI 必須提供完整的源代碼、模型參數信息和訓練數據信息等三個關鍵組成部分。其中,對于訓練數據信息,不要求提供數據集本身,但要求提供數據來源和出處、數據處理方法、如何獲取或許可這些數據以及確保具備相關技能的人能夠使用相同或類似的數據重建出實質等效的系統。
同時,OSAID 1.0要求開源 AI 必須保證用戶擁有“可以出于任何目的使用該 AI 模型、無需征得許可即可修改模型、可以自由地研究系統的工作原理、可以自由分享和傳播”等四項權利。
根據上述定義,對于三個關鍵組成部分,DeepSeek-V3/R1已開放模型參數信息和核心代碼,基本未開放訓練數據信息,因此尚不能稱為開源AI。對于用戶權利,DeepSeek-R1代碼和模型開源采用“非常寬松”的MIT協議,允許用戶自由使用、修改、復制、分發和進行商業活動,滿足OSAID 1.0要求;DeepSeek-V3代碼開源采用MIT協議,模型開源采用基于OpenRAIL2自建的DeepSeek許可證,從負責任的角度會對用戶行為進行一定約束,或與“出于任何目的使用該 AI 模型”相悖。
此外,Llama、Stable Diffusion、Mistral等以開源宣傳自己的模型亦因未公開訓練數據信息、限制商業用途等被OSAID 1.0排除在開源AI之外。
開源AI意義與DeepSeek競爭力
盡管依據開源AI定義,DeepSeek不能算做完全意義上的開源,但從開發者與企業的實際反應來看,其已充分詮釋“以共享促創新”的開源精神,仍可視為現階段開源AI的代表。
1.開源是“做大蛋糕”的重要手段
高透明度且易于獲取的開源軟件有助于降低企業認知、采購、使用和管理IT技術的成本。根據交易成本理論,企業更傾向于選擇交易成本低的技術,為通過開源推進技術普及奠定了經濟學基礎。DeepSeek迅速滲入金融、醫療、能源等各個行業的盛況,則充分證實了這項理論。因此,開源可帶動市場整體規模擴張,并讓貢獻者有機會分得更大蛋糕。
2.生態和信任是DeepSeek等開源AI的競爭力
DeepSeek開放模型參數與技術報告等后掀起全球復現熱潮,如伯克利團隊30美元成本復刻R1-Zero、港科大團隊使用8K樣本在7B模型上復刻R1/R1-Zero等,并均取得不俗效果,說明AI模型即使僅開放模型,已存在被迅速追平的可能,進一步開放代碼和數據等將削弱更多先發優勢。
不過,開源從生態和信任等方面為貢獻者帶來新的競爭優勢。一是可借助外部力量加速迭代與創新;二是有助于品牌傳播和形象提升,進而吸引更多用戶和人才,如微軟2014年起開源開發環境.NET“籠絡”開發者,為其云業務推廣創造有利條件;三是高透明度更易贏得市場信任,特別是AI大模型作為以數據驅動的復雜黑盒模型,安全問題是客戶主要顧慮之一,通過開源幫助客戶理解模型內部機制可在一定程度上緩解擔憂。
開源AI商業模式
開源AI的商業模式與同樣推崇共享的互聯網類似,即流量變現。
1.產品層面的“流量變現”:以廣告和增值服務為主
廣告是開源項目獲取收入最直接的方式。知名開源前端框架Vue在官網、說明文檔和社交媒體賬號中為各級贊助商提供廣告位,贊助商級別越高,廣告位越醒目。如鉑金贊助商(2000美元/月)可獲Vue官網首頁和側邊欄、以及發布于GitHub的說明文檔中的明顯logo展示位;金牌贊助商(500美元/月)可獲Vue官網首頁和GitHub說明文檔中的大號logo展示位。
增值服務為開源項目提供更為豐富的變現方法。一是“+技術服務”。例如,紅帽贊助Linux操作系統開源項目fedora,并在fedora經廣泛驗證后選取適合企業與商業用戶的部分附加技術支持形成商業版RHEL;谷歌開源容器管理工具Kubernetes后推出Kubernetes托管服務GKE;HuggingFace作為開源AI平臺,在免費提供模型和數據等的同時,也提供數據托管、API調用和模型定制等收費服務。二是“+付費組件”。例如,谷歌開源Android,但將Android與收取授權費用的谷歌移動服務(GMS)綁定。
目前,DeepSeek除了開源V3/R1等一系列模型,對V3/R1也按token消耗量收取API調用費,即已通過“+技術服務”變現,未來可能拓展出廣告、會員、高級功能等更多收費方式。
2. 公司層面的“流量變現”:提高估值
隨AI模型逐漸成為新一代基礎軟件,其公司的估值方式可借鑒互聯網平臺公司,將用戶規模、用戶增速和獲客成本等作為核心依據。開源可有效促進用戶規模增長及獲客成本降低,進而提振估值。Databricks通過開源大數據處理引擎Spark迅速打響品牌,之后又陸續貢獻Delta Lake和MLflow等著名開源項目,2024年以620億美元的估值成為全球估值最高的非上市大數據公司;DeepSeek-R1開源并出圈后,DeepSeek公司估值中位數已達數百億美元,最高估值甚至達到1500億美元。
對運營商的建議
面向開源AI新趨勢,建議運營商主動擁抱,加強企業戰新規劃與開源的銜接,以重點專項為牽引,深化對開源AI的持續跟蹤,強化工具集研發、軟硬協同優化等自主創新,細化標桿企業案例研究,如谷歌生來具備開源基因并持續貢獻、紅帽依托開源構筑商業閉環成長壯大、微軟及時調整“與開源為敵”的態度成功轉型等,探索與推進適合自身業務與能力的開源AI商業模式。