當地時間4月5日,Meta公司發布了最新的開源人工智能軟件Llama 4的首批大模型版本Llama 4 Scout和Llama 4 Maverick。這也是該公司迄今為止最強大的兩款AI大型語言模型(LLM)。
不過Meta表示,更強大的一款被命名為Llama 4 Behemoth的大模型仍在訓練中,該模型將在Meta的混合專家模型(MoE)架構中充當“新模型的老師”。
這也是Meta基于Llama軟件首次采用的MoE模型架構。在MoE模型中,單個token僅激活總參數的一部分。Meta表示,MoE架構在訓練和推理時計算效率更高,在固定訓練FLOPs預算下,相比密集模型提供更高的質量。
以Llama 4 Maverick模型為例,該模型擁有170億激活參數和4000億總參數。Meta采用交替的密集層和混合專家(MoE)層來提高推理效率。在這種方式下,盡管所有參數都存儲在內存中,但在服務這些模型時,只有總參數的一部分被激活。
Meta最新大模型的發布也意味著科技巨頭在生成式人工智能大潮中的投資競賽進一步升級。此前有報道稱,Meta推遲了大模型最新版本的發布,因為在開發過程中,Llama 4 在技術基準方面沒有達到Meta的期望,特別是在推理和數學任務方面。
“我們的目標是打造世界領先的人工智能,將其開源,并使其普遍可用,讓世界上的每個人都能從中受益。”Meta公司創始人CEO馬克·扎克伯格在Instagtam上的一段視頻中說道,“我認為開源人工智能軟件將構建出領先的模型,而隨著Llama 4的出現,這種情況開始發生了。”
谷歌CEO桑達爾·皮查伊(Sundar Pichai)也在社交媒體上就Llama最新模型的發布表示祝賀。他說道:“人工智能的世界永遠不會無聊!祝賀Llama團隊,繼續前進!”
此外,Meta將于4月29日舉辦首屆LlamaCon AI大會。該公司預計還將在今年第二季度推出Meta AI聊天機器人的獨立應用程序。
Meta公司首席產品官Chris Cox上個月表示,Llama 4將推動AI智能體(AI Agent)的發展,使其具備更高水平的推理和行動能力。這些AI智能體將能上網并處理大量對消費者和企業有用的任務。
與此同時,Meta正在對AI基礎設施進行大量投入。該公司計劃今年斥資650億美元擴建AI基礎設施,其中可能包括一個耗資近10億美元在美國威斯康星州中部建立的數據中心項目。
不過,就在Meta新模型發布之前,該公司人工智能研究主管喬爾·皮諾(Joelle Pineau)上周宣布離職。皮諾是Meta公司的頂尖人工智能研究人員之一,自2023年以來一直領導該公司的基礎人工智能研究部門(FAIR),負責公司的前沿計算機科學相關研究,包括Meta的開源Llama系列AI模型和其他技術。