記者19日從國家區塊鏈技術創新中心獲悉,由國家區塊鏈技術創新中心、北京能源集團牽頭,聯合新華社國家重點實驗室、人民網、高等教育出版社、中國通用技術集團等10余家國內語料數據重點單位共同打造的高價值語料可信流通基礎設施正式啟動建設。
高價值語料數據是訓練人工智能大模型的關鍵因素。長期以來,高價值語料數據存在跨單位、跨行業、跨地區分布的特點,部分領域還暴露出濫用語料數據、泄露語料隱私等問題。以區塊鏈、隱私計算為代表的新一代信息技術,憑借可信存證、不可篡改、易確權等性能,可以保障語料數據可信安全地流通、使用和管理,有效破解上述難題。
國家區塊鏈技術創新中心相關負責為人介紹,高價值語料可信流通基礎設施將運用我國自主可控、性能領先的區塊鏈軟硬件技術,搭建起覆蓋全國的分布式語料數據互聯互通橋梁,鏈接語料供給方、加工方、需求方,實現全國分布式語料數據可信接入,跨地域可發現、可訪問,形成高質量語料數據集;同時,運用創新隱私計算技術,通過“數據不出域、可用不可見”的方式,保障大模型高價值語料數據在處理加工和模型訓練過程中無法二次非授權傳播。
在高價值語料可信流通基礎設施的支撐下,國家語料數據的重點單位還將開展基于區塊鏈與隱私計算的語料數據可信安全流通規范制定,形成高價值語料數據流通與增值的可持續生態。
- 上一篇:北京發布“人工智能+”行動計劃
- 下一篇:人工智能使納米材料應用趨利避害