2024年7月6日上午,2024世界人工智能大會語料主題論壇在上海市世博中心成功召開。上海市各相關部門代表、上海人工智能實驗室、人民網、上海報業、上海圖書館、上海信投、上海算法創新研究院、中國信通院、復旦大學、華東師范大學,以及廣州視睿電子科技有限公司(希沃)等近1000家大模型語料生態企業參會。
高質量語料庫是人工智能賦能新質生產力的關鍵。大模型賦能千行百業,需要構建與場景適配的語料體系,需要規則與實踐的“并跑”。會上,《教育人工智能大模型數據治理與共享技術標準白皮書》正式發布,旨在推動加強教育人工智能大模型數據治理與共享,通過科學的策略,最大化挖掘教育數據價值,助力教育的創新。
《教育人工智能大模型數據治理與共享技術標準白皮書》由教育部教育信息化技術標準委員會暨全國信息技術標準化技術委員會教育技術分技術委員會指導,由華東師范大學牽頭,聯合上海交通大學、北京郵電大學、國家開放大學以及庫帕思,以及廣州視睿(希沃)等頭部企業共同編制。
本白皮書重點分析了教育AI大模型數據治理與共享技術的重要性及當前面臨的挑戰。同時,白皮書梳理了國內外教育AI大模型發展情況及教育數據治理與共享的政策、標準和相關機構,并詳細介紹了教育AI大模型的系列標準,包括已發布標準和在研標準。
本白皮書提出,“建設一套合規有效、高質量的數據治理與共享技術標準,供教育機構和技術開發者參考借鑒?!?/p>
白皮書內容建議,“構建教育AI大模型數據治理與共享體系的整體架構、建設數據治理與共享聯盟、完善標準體系,同時需要考慮應對數據安全與倫理問題等。”
白皮書還展開介紹了相關的案例應用,涵蓋區域、學校、企業層面。以上海市寶山區為例,寶山區通過搭建開放共享、技術集成、交互可視的技術架構,統籌建設區域教育管理及教學基礎應用服務平臺,打造一個惠及區域內所有學校的數字基座。
白皮書倡導,“應促進可控、可信、安全、綠色、好用、高效的教育通用人工智能大模型構建,實現有教育溫度、育人為本的人工智能及智能教育環境建設,探索數字教育新范式,實現教育的高質量發展。 ”
此外,論壇還宣布“語料運營平臺1.0”上線,同時集中發布首批十大高質量語料產品。此外,會上50余家單位共同發起“語料生態服務大模型可持續發展倡議”,共同倡導攜手為我國大模型產業發展持續提供高質量語料。