午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

AI也愛(ài)“撒謊”?研究人員探索讓AI學(xué)會(huì)說(shuō)“我不知道”

   發(fā)布時(shí)間:2025-02-13 08:03 作者:唐云澤

近日,《華爾街日?qǐng)?bào)》發(fā)表了一篇文章,深入探討了AI領(lǐng)域中出現(xiàn)的一個(gè)引人關(guān)注的現(xiàn)象——“AI幻覺(jué)”,并探討了可能的解決方案。文章通過(guò)一項(xiàng)有趣的實(shí)驗(yàn)揭示了這一問(wèn)題的本質(zhì):記者Ben Fritz向多款全球頂尖的AI聊天機(jī)器人提問(wèn)“你的配偶是誰(shuí)”,結(jié)果卻得到了令人啼笑皆非的答案,包括不認(rèn)識(shí)的作家、虛構(gòu)的愛(ài)荷華州女性,甚至還有網(wǎng)球運(yùn)動(dòng)博主。

這些AI在解決復(fù)雜數(shù)學(xué)問(wèn)題和模擬人類對(duì)話方面展現(xiàn)出驚人的能力,但在面對(duì)基本事實(shí)時(shí)卻頻頻出錯(cuò)。它們會(huì)編造法律案件,混淆影視劇情,甚至“創(chuàng)造”出不存在的配偶,這種錯(cuò)誤被形象地稱為“幻覺(jué)”。更令人驚訝的是,即便在給出錯(cuò)誤答案時(shí),AI也表現(xiàn)得極為自信,仿佛它們真的知道答案一樣。

德國(guó)Hasso Plattner研究所的博士生Roi Cohen,曾在IBM和微軟實(shí)習(xí),他指出,“AI幻覺(jué)”是當(dāng)前AI研究領(lǐng)域的熱門話題之一。AI的工作原理是基于預(yù)測(cè),它試圖找出最可能出現(xiàn)的下一個(gè)單詞,這更像是一種高級(jí)的猜測(cè)游戲。因此,AI往往會(huì)以堅(jiān)定的語(yǔ)氣給出它認(rèn)為最可能的答案,而不會(huì)表現(xiàn)出任何不確定性。

西班牙瓦倫西亞人工智能研究所的教授José Hernández-Orallo解釋了AI產(chǎn)生幻覺(jué)的根本原因:“如果AI什么都不猜,它就永遠(yuǎn)不可能答對(duì)。”這一觀點(diǎn)揭示了AI在追求答案過(guò)程中的無(wú)奈與局限。

為了克服這一問(wèn)題,研究人員正在探索“檢索增強(qiáng)生成”技術(shù)。這種技術(shù)讓AI在回答問(wèn)題時(shí)先從互聯(lián)網(wǎng)或文檔庫(kù)中查找最新信息,而不是完全依賴已有的訓(xùn)練數(shù)據(jù)。這種方法有望提高AI回答的準(zhǔn)確性,減少“幻覺(jué)”現(xiàn)象的發(fā)生。

Cohen和他的同事Konstantin Dobler在去年的NeurIPS AI研究會(huì)議上提出了一個(gè)新穎的觀點(diǎn):讓AI學(xué)會(huì)承認(rèn)“我不知道”。他們發(fā)現(xiàn),當(dāng)前的AI訓(xùn)練數(shù)據(jù)中幾乎不包含“我不知道”這樣的表述,因此AI天生不具備謙遜的品質(zhì)。通過(guò)調(diào)整訓(xùn)練過(guò)程,他們使AI在可能出錯(cuò)的情況下至少有一部分會(huì)選擇回答“我不知道”,從而提高了整體準(zhǔn)確性。

然而,如何平衡這一策略仍然是一個(gè)挑戰(zhàn)。有時(shí)AI說(shuō)“我不知道”,但實(shí)際上答案就在它的訓(xùn)練數(shù)據(jù)中。盡管如此,對(duì)于那些依賴AI提供精準(zhǔn)信息的領(lǐng)域來(lái)說(shuō),適當(dāng)?shù)摹爸t虛”可能更有價(jià)值。Dobler強(qiáng)調(diào):“關(guān)鍵是讓AI具備實(shí)用性,而不是一味追求智能。”

值得注意的是,隨著AI技術(shù)的不斷發(fā)展,美國(guó)公眾對(duì)其的信任感卻在下降。皮尤研究中心的數(shù)據(jù)顯示,2023年有52%的美國(guó)人對(duì)AI感到擔(dān)憂,而2021年這一比例僅為37%。這一趨勢(shì)反映出公眾對(duì)AI技術(shù)發(fā)展的復(fù)雜情緒,既期待其帶來(lái)的便利和進(jìn)步,又擔(dān)憂其潛在的風(fēng)險(xiǎn)和不確定性。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新