1月9日在京舉行的中國石油和化工行業數字化轉型發展大會上,中國工程院院士劉合深刻剖析了油氣行業AI大模型應用的現狀與挑戰,并指出數據治理是油氣行業AI大模型應用發展的核心要素。
當前行業已發布昆侖大模型、光明電力大模型等多個AI大模型,標志著油氣行業智能化轉型的堅定步伐,然而,AI大模型的實際應用仍面臨可用性與易用性的雙重考驗。究其根本在于油氣行業數據涵蓋了地質勘探、鉆井、生產等多個環節,存在多解性、不確定性等特點,且數據治理難度大,緊迫性強。同時行業對數據的安全性和保密性有著極高的要求,普遍存在數據“孤島”問題。在保障數據安全和保密的前提下,整合分散數據并訓練行業基礎模型已成為行業大模型必須直面的問題。
劉合院士形象的把數據比作AI的“原油”,數據質量直接決定了AI系統的成敗。構建大規模、高質量、多模態數據集是行業大模型提升的關鍵。
面對這一挑戰,劉合院士為油氣行業AI大模型的應用提出了以下建議:
一、精準定位,研發定制化模型:以解決具體業務問題為導向,開發適用于油氣領域特定分析場景的應用模型。通過優化下游任務適應性,打造面向特定需求的定制化模型,可優先推進數據質量較高的L2級別行業基礎模型。
二、強化數據治理,全生命周期管理:以AI大模型應用為契機,全面加強數據全生命周期管理,提升數據治理能力。劉合強調,行業核心競爭力是“行業數據”,要做好“訓練樣本庫”的基本功。穩步提升數據質量,構建大模型應用所需的“樣本庫”。
三、數據安全與隱私保護:制定詳盡的數據保密策略,確保在保障數據隱私安全的前提下,完成AI大模型的訓練。全面提升數據安全防護能力,實施數據全生命周期的安全保密建設,探索區塊鏈等前沿技術在數據治理中的應用。
四、構建專業數據生產線:建立從專業數據資源到AI語料庫的敏捷轉化機制,解決大模型難以理解油氣領域專業知識的難題。通過油氣行業專家的深度參與,進行數據清洗和提取,將專業知識轉化為原子化的數據集,并將經驗沉淀于專家系統中,優化模型訓練效果。
展望未來,劉合院士對數據治理在油氣行業AI大模型應用中的作用寄予厚望。他認為,未來的趨勢將是模型設計的簡化與數據質量的高標準化,并且基于數據智能體的智能化數據服務平臺將實現數據全生命周期的智能管理。
他強調,在數據質量不高、可靠性缺失的情況下,盲目追求大模型參數量的增加,只會加劇偏差與謬誤,導致資源浪費、成本激增及用戶信任度下降,影響決策等提升模型性能。因此,協調好數據的“質”與“量”,加強數據治理,構建大模型應用的高質量樣本集,才是提升油氣行業AI大模型性能的關鍵所在。
1月10日至11日,2025全國石油化工罐區安全技術交流會在深圳成功召開,大會以“融合創新思路,強化更新改造,提升罐區安全運行水平”為主題,旨在為進一步強化全國石油化工罐區安全管理,積極融匯前沿性...
1月17日,記者從中國石化新聞辦獲悉,我國首套采用聚酯中黏工藝技術建設的50萬噸/年瓶級切片裝置在中國石化儀征化纖公司成功投產,該項目采用中國石化自主研發的國內最先進短流程生產工藝,標志著我國在聚...
《牙膏監督管理辦法》(以下簡稱《管理辦法》)自2023年12月1日正式實施已一年有余。在這一年期間,取得了哪些成效?1月15日,中國口腔清潔護理用品工業協會召開牙膏產品質量安全與口腔健康新聞發布會進行...
1月15日,在上海期貨交易所與大阪交易所聯合舉辦的天然橡膠期貨交割結算價授權簽約發布暨服務全球天然橡膠產業高質量發展研討會傳出消息,OSE將以上期所天然橡膠期貨交割結算價為基準,開發以日元結算、現...