中國互聯網大廠在為DeepSeek作出巨大改變。
2月14日,百度宣布將于6月30開源文心大模型。2月15日,部分微信用戶發現已經可以在搜索功能中調用DeepSeek模型了。百度和騰訊有自己的大模型產品,而且旗下的搜索和微信都是匯聚數億用戶的超級流量入口。它們的轉變,凸顯了中國大廠在大模型技術上還沒有構建起足夠安全的護城河。
互聯網大廠如此,初創公司更不例外。早在DeepSeek-R1發布之前,大模型六小虎里的數家企業已經放棄了開發基礎大模型的道路。DeepSeek令部分大模型初創企業再度經受拷問:成本還有優勢嗎,技術更先進嗎,能實現商業化閉環嗎?
創新和繁榮的另一面,是殘酷的優勝劣汰和巨大的沉沒成本。DeepSeek沖擊,初創企業面臨估值調整和融資壓力。一家投資機構的合伙人表示:“就算我投不到DeepSeek,我也不想投你了。我個人認為DeepSeek對他們的融資影響很大,不好融錢了。”
大轉向
在公布開源文心大模型政策的前一天,百度已經宣布其文心一言將于4月1日起全面免費。
此前用戶使用文心一言基礎功能時免費,而自定義模型訓練和API接口調用等功能則需要付費。
百度此前是大模型閉源的堅定支持者。它的美國競爭者OpenAI、谷歌以及Anthropic同樣執行閉源策略。
閉源的優勢在于,技術留存于自身,并在此基礎上打造商業模式。開源則意味著技術外流,盈利模式更難以構建。考慮到大模型動輒幾億美金的投入,閉源策略對于企業和投資人似乎都不難理解。
DeepSeek的出現,打破了這種敘事邏輯。它成本低,性能好,而且還開源。
“DeepSeek難得之處在于,論文做到了非常開放,它的參數、它的權重以及一步一步的訓練過程,手把手告訴了大家。”開源中國董事長馬越對第一財經表示:“這樣我們非常容易在它的基礎上,用他的方法論,以極低的成本做出自己的小模型,這個非常了不起。”
這是DeepSeek的殺傷力所在。投資更小就可以實現更好的模型,且更容易在端側部署。所以,除非愿意耗資巨大成為被DeepSeek等站在肩膀上的巨人,否則從頭做閉源大模型意義何在?
“除非閉源模型是斷代式的領先,大家不得不用。如果有同樣能力的開源大模型,那從邏輯上來講,人家會有更多的機會去試錯,去Debug自己的產品,更新速度會比閉源更快。”一位騰訊云工程師對第一財經表示。
國內國外的閉源企業都在重新思考原有策略能走多遠。OpenAI的CEO奧爾特曼也表示,選擇閉源可能是站在了歷史的錯誤一面,但他也沒考慮好OpenAI以何種方式開源。
百度的動作顯得果斷一些。
“如果技術足夠強,選擇閉源無可厚非,因為閉源的商業變現的反射弧更短。問題是你真有那么強嗎?”馬越對第一財經表示。
對于百度來說,開源之后還可能靠云計算資源來賺錢。
一些大參數的模型如DeepSeek-R1如果下載到本地,滿血版跑起來需要投資的金額不菲。所以開源大模型,往往搭載在云端,大廠們的閉源大模型也不例外。
“它們是云計算模式,開源就更沒問題了。(用戶)在運行環境買云計算資源,不然誰給你保駕護航。”馬越表示。
百度的一百八十度轉彎,是中國大模型產業重要轉變的一部分。
投資金額巨大、商業化難題,已經使得許多大模型企業改弦更張。
幾年前風風火火的大模型六小虎也走上了不同的道路。百川、零一萬物等現在基本放棄了耗資巨大的通用大模型路線。
2025年的1月初,零一萬物宣布與阿里巴巴成立聯合實驗室,零一萬物的部分團隊成員并入阿里巴巴。零一萬物轉而在中小模型以及商業應用上探索出路。
“大家魚有魚路,蝦有蝦路。”馬越說,一些大模型公司走資本化路徑,變成投資公司了,“還有一些堅定做垂直行業的模型不挺好嗎?”
馬越將開源稱為勇敢者的游戲。
“選擇開源,是不怕你們來免費獲取我的智慧。怕的是你們免費獲取之后,甚至連更具挑戰性的需求都不能反饋給我。”
DeepSeek擠壓誰的空間
英諾天使沒有投資任何一家大模型六小虎。從當下來看,這未嘗不是一件幸事。
六小虎是指月之暗面、MiniMax、智譜、百川智能、階躍星辰以及零一萬物六家企業,它們的技術和融資一度跑在市場前列。
“太貴了,不太適合我們做天使投資的標的畫像。”英諾天使合伙人王晟說。英諾天使的典型投資額約1000萬人民幣,而早期六小虎估值上漲非常快,“上來都估值3億美金、5億美金、10億美金,透支了未來的估值。”
六小虎看到ChatGPT帶來的技術革新機會,國內的科技大廠同樣看到了。初創企業在開始的時候,就與大廠站在了同一條起跑線上。
“上來就和大廠直接高烈度競爭,這是我們避免的一個投資誤區。”王晟表示,目前也沒看到大模型企業賺大錢的可能性。“錢肯定都能賺的,比如做個政企項目。只不過這個錢跟大家對AI巨大的期待,或者跟估值對比,落差有點大。”
人工智能的商業化,要么是對既有業務的改造,要么是開拓新的使用場景。
阿里巴巴、百度以及字節跳動等科技大廠,比初創的AI企業,在賦能既有業務上更有優勢。電商可以用AI賦能,工業也可以引入AI,娛樂也可以接入AI。但這些產業里都有巨頭把守了,阿里巴巴在投資AI,字節的豆包發展也很快。
“你不能說初創公司用AI就能打敗產業巨頭,那不可能。產業巨頭有錢、有客戶、有收入、有場景、有數據,他也不傻。”王晟認為,舊場景的漸進式AI創新,就算有龐大市場,大概率不是初創企業能吃到的紅利。
而新的使用場景,大家都還沒有看到。
今天人們的購物使用APP,辦公使用Word和Excel,娛樂看電影等活動,都是在已經成熟的硬件設備如手機和電腦上。這些需求在已有的設備上都能解決掉了。
“只有新設備能創造新場景。比如說智能眼鏡出現就能創造新場景。”王晟說。但現在智能眼鏡設備還遠不成熟。
DeepSeek加劇了大模型初創企業的商業化困境。
DeepSeek比任何一家大模型企業的產品都更快來到普通消費者的手機端。截至目前,它的日活躍用戶數量已經超過了字節跳動旗下的豆包,更超過了月之暗面旗下的Kimi智能助手。
DeepSeek也可望比其他大模型,通過各家平臺型企業更快地落地到開發者或者企業端。
春節前后,國內的云計算平臺如阿里云、騰訊云、優刻得,以及百度智能云等都爭先恐后上線了DeepSeek模型。開源的DeepSeek提供了接口,這些云計算平臺都不需要與DeepSeek公司協作就可直接部署。免費開源的模型,便宜的算力,吸引開發者和使用者切換到DeepSeek模型。
“如果說我是一個APP的應用,接的就是大模型的API(接口),那這個切換起來挺快的。”上述騰訊云工程師對記者說。
最新的消息是,騰訊的微信也已經接入了DeepSeek-R1模型,部分用戶在使用微信搜索功能時可以調用這一模型。
微信是一款用戶超過10億的超級應用。而且,騰訊元寶也已經接入了DeepSeek。這兩款產品此前都已經接入了騰訊自己研發的混元大模型,增加DeepSeek之后,用戶選擇的空間大了。
“不好融錢了”
大模型公司融資受到DeepSeek壓制。
兩家知名投資機構的工作人員均告訴第一財經,DeepSeek發布之后,關于它對國內AI產業和投資的影響,內部進行了非常多的研討。
這些投資機構可能在考慮改變策略。
大模型是人才密集、算力密集和數據密集的游戲。之前,一家新啟動的大模型企業如果拿不到1億美金的融資,那意味著難以成事。
OpenAI和Anthropic等都希望給產業客戶、投資人、政府傳遞同一個邏輯:大模型只能走一條巨大的資金投入的道路,比如每增加10倍算力才能誕生下一個階段的智能水平。而且,在此之前,人工智能的發展確實是大致按照縮放定律的曲線爬升。
中國和美國的大模型企業、投資人都曾對此堅信不疑。但是DeepSeek動搖了這套投融資邏輯。
“我認為DeepSeek的創新能力在國內初創公司里是最強的,甚至跟阿里、字節這樣的大廠比,它的創新能力也是強的。但不代表它技術實力就是無敵的,大家追不上的。”王晟說,它產生的震動不是因為技術大幅度領先,而是讓大家回歸現實。“過去大家不計代價,現在要考慮投入產出比了。”
由此帶來國內大模型初創公司估值和融資的壓力。
“你估值還支撐得住嗎?過去的估值都建立在做這件事必須投大錢的基礎上,因為起手的目標融資10億美金,你不給我100億美金估值都不行。”王晟認為,“現在大家覺得你不需要幾十億美金,10億美金是不是就行了,幾億美金是不是也能干得不錯。”
DeepSeek也許是現在唯一一個沒有融資壓力的大模型初創企業。現在各家機構手捧現金想投資DeepSeek不得其門而入。其他大模型初創公司,此時既需要考慮技術和商業化路徑是否轉變,也不能停止融資的努力。
但投資人的心態可能已經變了。
“就算我投不到DeepSeek,我也不想投你了。我個人認為DeepSeek對他們的融資影響很大,不好融錢了。”王晟表示:“你立刻降估值顯然是不理性的,之前的投資人也沒法接受。現在這種情況投資人也退不出來。這是初創企業和市場之間的博弈,但最終什么結果這很難說。”
巨大的浪費似乎是不可避免的。
當成本低廉、性能優異的模型開源,其他大模型企業如果不能推出更優秀的產品,開發者和用戶會迅速投入開源模型的懷抱。一些企業此前為研發、預訓練以及算力基礎設施而做的巨大投資,可能會變得毫無價值。
“中國本身這種沉沒成本就是巨高。”馬越說,一家公司燒了幾百億,可能最終成就的是DeepSeek這樣的公司。何況,“現在最大的問題是,整個國家跟美國相比,在AI上的投入差著好幾個數量級。”
投資和創新還將延續下去。
2025年,投資人可能將目光轉向大模型之上的應用創新。免費的大模型,搭配便宜的云計算,為應用開發企業提供新的可能。