人工智能大模型的應用方興未艾,但支撐大模型發展的數據仍存在瓶頸。今年全國兩會,全國人大代表、海爾集團董事局主席兼首席執行官周云杰,全國人大代表、長虹控股集團董事長柳江就如何打破數據瓶頸和促進數據產業化,都提出了建議。
智能制造、智能家居急需數據支撐
周云杰認為,人工智能在工業大模型的深度應用中面臨幾大挑戰,包括數據質量與語料庫的瓶頸、場景適配與模型可靠性的挑戰,以及轉型切入點和話語體系的錯位。因此,他在《以工業大模型為關鍵變量賦能新型工業化》的建議中提出,首先要發布國家級工業場景圖譜、語料庫和數據集,為人工智能在工業領域應用提供堅實基礎。
其次是支持龍頭企業,為工業大模型應用價值做示范。建議以財政補貼,支持家電、汽車、醫療等龍頭企業,開展基于工業大模型的人工智能深度應用,提煉并共享其在研發設計、生產制造、經營管理等關鍵環節深度應用人工智能的典型案例。
此外是扶持平臺企業,促進工業大模型服務于中小企業。建議對國家級雙跨平臺企業出臺專項財政扶持政策,培育一批工業大模型與場景圖譜精準匹配的標準化、可復用、低成本解決方案,為中小企業提供用得上、用得起、用得好的人工智能服務。
人工智能在智慧家庭的應用,也需要打破數據瓶頸。周云杰在另一份《以高質數據構建智慧家庭大模型 助力家電家居產業升級》的建議中提到,智慧家庭大模型需要算力、算法、數據支撐。DeepSeek等已大幅降低算力需求,然而大規模高質量數據的支撐仍無法替代,行業數據建設仍面臨采集成本高、跨域融合難、訓練數據少等堵點。
對此,周云杰提議,一是培育數據采集產業,構建智慧家庭大模型的數據源。建議制定統一數據標準體系,規劃并發展智慧家庭數據合成、數據標注產業;實施數據貢獻參與工程,通過全民共享、群企共創的形式,構建行業全覆蓋的垂域數據基礎。
二是建議通過政策、資金,支持行業龍頭企業牽頭建設智慧家庭全場景覆蓋的數據仿真平臺和訓練場,訓練高質量垂域大模型,向產業鏈上下游提供服務,推動具身智能技術在智慧家庭場景中的深度應用,賦能家庭服務型機器人等新質生產力發展。
一位業內資深人士向第一財經記者分析認為,數據產業化有兩個層面,一是政府層面,目前政府內部的數據瓶頸沒有打破,數據在不同部門之間、在同一部門的不同處室之間,壁壘依然存在;二是市場層面,大數據已經提出了十多年,大模型最近也蓬勃發展,然而目前國內數據市場上能夠提供專業的數據分析服務、滿足各界數據需求的專業企業較少。“數據產業化雖已提出多年,但還有較長的路要走。”
呼喚加快可信數據空間的建設
2023年中國數據空間市場規模為40.2億元,同比增長24.4%,產業具備一定市場基礎,規模有望持續增長。北京、上海、深圳、廣州、重慶、海南、濟南、佛山等地均已開展數據空間建設,行業整體呈現集中化及規模化趨勢,其中,政務、金融、工業三大數據空間建設的重點領域占比超過52.5%。
所謂可信數據空間,是基于共識規則,聯接多方主體,實現數據資源共享共用的一種數據流通利用基礎設施,是數據要素價值共創的應用生態,是支撐構建全國一體化數據市場的重要載體。
“數據跨界融合的需求已經明確,但大規模數據流通利用的場景仍在探索。”柳江認為,目前,數據流通利用以公共數據和社會數據的開發利用為主,企業數據、個人數據的規模化利用尚未形成,對AI技術應用的支撐效果尚不明顯。實體企業數字化轉型經歷了業務貫通、數智決策階段,現正進入數據流通賦能階段。
國家鼓勵建設可信數據空間,但是仍面臨一些問題。柳江說,一是可信數據空間技術路線和標準不統一,平臺間難以互聯互通互認,而且在國際標準制定中話語權仍有待提高。二是數據要素的市場機制不健全,法律法規滯后,數據安全與隱私保護技術檢測認證不足,各環節監管不力,影響社會信任。三是跨領域協同難度大、人才短缺問題突出。數據產業政策和資金支持不足,企業技術創新和融合應用動力欠缺。
對此,柳江在今年全國兩會期間遞交了《關于加快可信數據空間應用落地的建議》。他建議,構建企業、行業、城市、個人和跨境等類型可信數據空間,為數實融合創新提供數據基礎設施,加快應用落地。
首先是引導權威機構牽頭,聯合行業協會、科研機構和企業,共同制定可信數據空間相關技術標準,降低數據流通利用技術壁壘。同時,鼓勵相關機構、組織和企業參與國際標準制定,提升國際話語權,探索建立與國際數據空間的互認機制。
其次是建立健全法律法規,鼓勵數據流通利用和數據價值挖掘。加強數據安全與隱私保護相關技術檢測與認證,建立數據流通利用信任體系。建立數據流通的合規審查機制,加強對數據流通各環節的監管,確保數據流通合法合規,提升社會信任度。
此外是通過政策和資金支持,鼓勵企業加大研發投入,推動數據采集、匯聚、加工、流通、應用和安全保障。支持企業運用可信數據空間,進行數據加工、數據開發和應用部署。建立數據專業職稱體系、產學研用一體化機制,提供充足人才儲備。
廣州數據交易所相關人士向第一財經記者說,可信數據空間是暢通數據資源循環、釋放數據要素價值的重要載體。目前全國多地都在積極探索可信數據空間建設,但仍存在技術路線和標準不統一、主體參與意愿不足、跨空間數據交互難等問題。建議一方面加快制定相關標準,鼓勵各類主體使用可信數據空間;另一方面發揮數據交易所的樞紐作用,推動可信數據空間建設和跨空間互聯互通,培育可信數據空間生態體系,實現更大范圍數據價值共創,為全國一體化數據市場建設提供有力支撐。