17部門:建設高質量語料庫和基礎科學數據集,支持開展人工智能大模型開發和訓練

國家數據局等17部門聯合印發《“數據要素×”三年行動計劃(2024—2026年)》。其中提出,推動科學數據有序開放共享,促進重大科技基礎設施、科技重大項目等產生的各類科學數據互聯互通,支持和培育具有國際影響力的科學數據庫建設,依託國家科學數據中心等平臺強化高質量科學數據資源建設和場景應用。以科學數據助力前沿研究,面向基礎學科,提供高質量科學數據資源與知識服務,驅動科學創新發現。以科學數據支撐技術創新,聚焦生物育種、新材料創制、藥物研發等領域,以數智融合加速技術創新和產業升級。以科學數據支持大模型開發,深入挖掘各類科學數據和科技文獻,通過細粒度知識抽取和多來源知識融合,構建科學知識資源底座,建設高質量語料庫和基礎科學數據集,支持開展人工智能大模型開發和訓練。探索科研新範式,充分依託各類數據庫與知識庫,推進跨學科、跨領域協同創新,以數據驅動發現新規律,創造新知識,加速科學研究範式變革。