半月談記者 朱涵
“編造”法律條文、權威觀點、數據成果,提供虛假理論依據,誤導處理……當人們查核文獻、搜尋資料、處理數據越來越習慣于“遇事不決問AI”的時候,卻發現人工智能嫻于一本正經地“說謊”,在我們眼前騰起以假亂真的幻覺。
今天,AI正迅速成為你我生活“日用品”。我們可以像治病一樣除去它帶來的“知識幻覺”嗎?幻覺生成的風險,又當如何規避?當如何與之一同生活,而且生活得更好?
什么是AI“知識幻覺”
隨著大模型加速走進百行千業,人們開始發現,大模型有時“不太靠譜”。“我試著讓DeepSeek回答工程方面的問題,其引用的工程規范中的條款和實際規范壓根對不上”“大模型往往‘張冠李戴’,如果質疑它,有時候還會狡辯”“讓它推薦書,告訴我的卻是一堆壓根不存在的書名,居然還都有作者和內容簡介”……這樣的大模型“用后感”,是不是也道出了你我身邊人的心聲?
“一本正經地‘說謊’,就是AI生成的‘幻覺’。”浙江大學人工智能研究所所長吳飛一語道破。
清華大學沈陽團隊在2025年2月發布的《DeepSeek與AI幻覺》報告中介紹,他們測試了眼下風行的一系列大模型,題目是隨機抽取300道事實性幻覺測試題,涵蓋健康、科學、歷史、文化、音樂等多個領域,獲取大模型給出的答案與正確答案比對發現,多個熱門大模型的幻覺率超過20%。
例如,面對“水滸傳中李逵為什么要大鬧五臺山”的提問,3款熱門大模型無一指出此提問本身的錯誤,反而“順坡下驢”,給出了諸如“喝醉酒”“誤闖寺廟”“出手相助魯智深”等答案。
事實上,對于人工智能的“知識幻覺”問題,國際科學界早有體會。今年《自然》一篇報道指出,目前AI輔助科研在參考文獻方面出現錯誤的情況相當普遍,AI檢索工具往往會“找出”與研究主題并無關系的論文。至于論文標題、第一作者或發表年份等細節的偏差,AI的差錯率少則30%,多則90%。
看來,不只是你的父母長輩搞不清楚AI的“錦囊妙計”靠不靠譜,科學家也一樣頭疼呀!
“知識幻覺”難以避免
好吧,也許你會說,現在的AI還比較幼稚,有“幻覺”也難免,咱們認了。那大模型到底有沒有可能徹底根除“知識幻覺”?
對不起,就目前的大模型技術路線而言,說“難免”不如說“難以避免”。對,“幻覺”是大模型數據驅動的內在機制帶來的,因此“難以避免”。
香港科技大學團隊一項研究,總結了導致AI幻覺的多種原因。以數據源為例,由于AI大模型的訓練使用了大量互聯網數據,數據集本身可能存在錯誤、過時或缺漏,導致幻覺的出現。再加上不同數據集之間存在相互矛盾的地方,“這可能會鼓勵模型生成不一定有依據,也不忠實于(固定)來源的文本”。
北京通用人工智能研究院院長、北京大學智能學院院長朱松純強調,大模型本身并不存在于真實世界中,因此無法像人一樣實現從“詞語(word)”到“世界(world)”的聯結。也因此,大模型雖然出色,但仍然是“缸中之腦”,不具備真正的智能。
“這是由它的內在構造機制所決定的,即通過統計建模在大量文本上進行訓練,學習文本之間的語言學相關關系,從而根據上一個詞語預測下一個詞語。”朱松純說。
例如,大模型本質上不具備事實判斷的能力,更多的是在純符號空間中展開排列組合,更像是一種新型的“數據庫”。即使它們生成了諸如“我愛你”這樣的語句,也缺乏對人類真實生活體驗的深刻理解,因此與我們所認同和期待的“我愛你”有著本質不同。
唉,那怎么才能與“致幻”的大模型良好共處呢?傷腦筋啊……
參觀者在2024世界智能產業博覽會展臺了解數智本草大模型 李然 攝
如何與人工智能共處
面對一時無法根治的大模型“知識幻覺”,我們怎么辦才好?
科大訊飛董事長劉慶峰認為,“知識幻覺”雖然防不勝防,但可以利用技術手段設法矯正。AI大模型應當至少補充在線實時搜索與專業數據庫動態接入兩大“工具包”,讓大模型的回答也過一遍“智能檢校”。
不久前,北京協和醫院與中國科學院自動化研究所共同研發的“協和·太初”罕見病人工智能大模型,就把主要精力放在了動態更新權威來源知識、增加多渠道溯源機制兩方面。研發者表示,事關臨床,決策可信度不敢稍有怠慢。這種謹慎,應當是大模型未來升級必備的品質。
當然,很多專家建議,如果是普通使用者,還是交叉比對一下不同模型的回答才好。3個大模型就算頂不上諸葛亮,也能讓安心的程度高上幾分。
不過,大模型“知識幻覺”,當真就一無是處嗎?
其實,“一分為二”的眼光,也該用于“知識幻覺”。如業內人士所言,“幻覺”也意味著大模型“創造力”的萌芽。
360集團創始人周鴻祎接受采訪時曾表示,“幻覺”對于實現AGI(通用人工智能)極其重要。實際上可以說,模型能力越強,“幻覺”也越強。換句話說,“幻覺”也就是人工智能的“靈感”。不大靠譜是代價,但不羈的想象力也是助力科研的潛能源泉。廣受媒體關注的AI預測蛋白質結構,立下功勞的就是大模型的“幻覺”。
沈陽也承認,“幻覺”可能成為突破人類思維定式的“超現實引擎”,AI有可能藉之創造新的視覺和聽覺體驗,為游戲和文學創作打開不一樣的世界。
看來,初出茅廬的大模型,已經頗有藝術家氣息了……
說來說去,搞清楚“知識幻覺”到底是怎么回事,它其實并不可怕。我們使用AI,當有所節制;引導AI化“想象力”為生產力,辦法也會日新又新。與AI大模型共度的時光,雖有烏云,但更燦爛的是烏云的金邊。
編輯:范鐘秀