午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

谷歌Gemini新規(guī):外包評(píng)估員被迫涉足不擅長領(lǐng)域,信息準(zhǔn)確性引擔(dān)憂

   發(fā)布時(shí)間:2024-12-19 11:29 作者:趙云飛

近期,據(jù)TechCrunch披露,谷歌對(duì)其大型語言模型Gemini的回復(fù)評(píng)估流程做出了一項(xiàng)重要調(diào)整,這一變動(dòng)引起了外界對(duì)其在敏感信息領(lǐng)域準(zhǔn)確性的廣泛關(guān)注。谷歌與外包合作伙伴GlobalLogic合作,后者負(fù)責(zé)雇傭合同工來評(píng)估Gemini生成的回復(fù),評(píng)估的關(guān)鍵標(biāo)準(zhǔn)之一是“真實(shí)性”。

在此之前,若評(píng)估員發(fā)現(xiàn)某個(gè)問題超出了他們的專業(yè)知識(shí)范圍,比如涉及心臟病學(xué)的復(fù)雜問題,而自身不具備相應(yīng)的科學(xué)背景,他們可以選擇跳過該評(píng)估任務(wù),以避免對(duì)不熟悉領(lǐng)域的回復(fù)進(jìn)行評(píng)判。這一機(jī)制原本旨在確保評(píng)估的準(zhǔn)確性和專業(yè)性。

然而,GlobalLogic近期宣布,谷歌要求評(píng)估員不得再因缺乏專業(yè)知識(shí)而跳過任何評(píng)估任務(wù)。新的指導(dǎo)方針明確指出,即使面對(duì)高度專業(yè)化的技術(shù)性問題,如罕見疾病的描述,評(píng)估員也不應(yīng)跳過,而是需要評(píng)估他們能夠理解的提示部分,并注明自身在相關(guān)領(lǐng)域的知識(shí)不足。這一變化意味著,即便是醫(yī)療健康等高度專業(yè)性的領(lǐng)域,也可能由不具備相關(guān)背景知識(shí)的評(píng)估員進(jìn)行評(píng)估。

這一調(diào)整引發(fā)了人們的擔(dān)憂,因?yàn)槿狈I(yè)知識(shí)的評(píng)估員在評(píng)估高度專業(yè)化的回復(fù)時(shí),可能難以準(zhǔn)確判斷其準(zhǔn)確性。一位合同工在內(nèi)部通信中表達(dá)了困惑:“我之前以為跳過的目的是將任務(wù)交給更專業(yè)的人來提高準(zhǔn)確性,但現(xiàn)在這樣做似乎并非如此?!?/p>

根據(jù)新的規(guī)定,評(píng)估員只有在兩種情況下可以跳過提示:一是當(dāng)提示或回復(fù)“完全缺失信息”,二是當(dāng)提示包含需要特殊同意書才能評(píng)估的有害內(nèi)容。這一新規(guī)的實(shí)施,無疑增加了Gemini在高度專業(yè)性領(lǐng)域輸出不準(zhǔn)確信息的風(fēng)險(xiǎn)。

在醫(yī)療健康等關(guān)鍵領(lǐng)域,不準(zhǔn)確的信息可能對(duì)用戶造成誤導(dǎo),甚至帶來嚴(yán)重后果。因此,這一調(diào)整引發(fā)了廣泛關(guān)注和擔(dān)憂。用戶期望從Gemini獲得準(zhǔn)確可靠的信息,尤其是在涉及健康等重要問題時(shí)。然而,隨著評(píng)估流程的變化,這一期望可能面臨挑戰(zhàn)。

這一調(diào)整也引發(fā)了關(guān)于人工智能倫理和責(zé)任的討論。在高度專業(yè)化的領(lǐng)域,如何確保人工智能生成的回復(fù)準(zhǔn)確無誤,是一個(gè)復(fù)雜而重要的問題。谷歌作為行業(yè)領(lǐng)先者,其在這一問題上的決策將對(duì)整個(gè)行業(yè)產(chǎn)生深遠(yuǎn)影響。

截至目前,谷歌尚未對(duì)相關(guān)報(bào)道作出回應(yīng)。然而,隨著外界對(duì)Gemini準(zhǔn)確性擔(dān)憂的加劇,谷歌可能需要盡快采取措施來回應(yīng)這些關(guān)切,以確保其大型語言模型在高度專業(yè)性領(lǐng)域的信息輸出保持準(zhǔn)確性和可靠性。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新