自拍视频一区二区,99男女国产精品免费视频,国产精品色电影,a三级视频,91综合国产,91嫩草国产露脸精品国产,女人做爰高潮免费播放

<strike id="7bnnc"><div id="7bnnc"><u id="7bnnc"></u></div></strike>

荊楚網(wǎng) > 國際

大語言模型或無法可靠識別錯誤信念最新研究提醒AI結(jié)果謹(jǐn)慎使用

發(fā)布時間：2025年11月04日13:47 來源：中國新聞網(wǎng)

中新網(wǎng)北京11月4日電 (記者孫自法)施普林格·自然旗下專業(yè)學(xué)術(shù)期刊《自然-機(jī)器智能》最新發(fā)表一篇人工智能(AI)研究論文指出，人工智能大語言模型(LLM)可能無法可靠地識別用戶的錯誤信念，這項(xiàng)研究發(fā)現(xiàn)凸顯出在醫(yī)學(xué)、法律和科學(xué)等高風(fēng)險決策領(lǐng)域，需要謹(jǐn)慎使用大語言模型結(jié)果，特別是當(dāng)信念或觀點(diǎn)與事實(shí)相悖時。

該論文介紹，人工智能尤其是大語言模型正在成為高風(fēng)險領(lǐng)域日益普及的工具，使之區(qū)分個人信念和事實(shí)知識的能力變得十分重要。例如對精神科醫(yī)生而言，知曉患者的錯誤信念常對診斷和治療十分重要。若無此類能力，大語言模型有可能會支持錯誤決策、加劇虛假信息的傳播。

中國科學(xué)院第八屆科學(xué)節(jié)北京主場活動上，機(jī)器人進(jìn)行彈琴、擊鼓展演。中新網(wǎng)記者孫自法攝

為此，論文通訊作者、美國斯坦福大學(xué) James Zou和同事及合作者一起，分析了包括DeepSeek和GPT-4o在內(nèi)共24種大語言模型在1.3萬個問題中如何回應(yīng)事實(shí)和個人信念。當(dāng)要求它們驗(yàn)證事實(shí)性數(shù)據(jù)的真或假時，較新的大語言模型平均準(zhǔn)確率分別為91.1%或91.5%，較老的大語言模型平均準(zhǔn)確率分別為84.8%或71.5%；當(dāng)要求模型回應(yīng)第一人稱信念(如“我相信……”)時，他們觀察到大語言模型相較于真實(shí)信念，更難識別虛假信念。

具體而言，2024年5月GPT-4o發(fā)布及其后較新的大語言模型平均識別虛假第一人稱信念的概率比識別真實(shí)第一人稱信念低34.3%；相較真實(shí)第一人稱信念，GPT-4o發(fā)布前較老的大語言模型識別虛假第一人稱信念的概率平均低38.6%。

論文作者指出，大語言模型往往選擇在事實(shí)上糾正用戶而非識別出信念。在識別第三人稱信念(如“Mary相信……”)時，較新的大語言模型準(zhǔn)確性降低4.6%，而較老的大語言模型降低15.5%。

論文作者總結(jié)認(rèn)為，大語言模型必須能成功區(qū)分事實(shí)與信念的細(xì)微差別及其真假，從而對用戶查詢做出有效回應(yīng)并防止錯誤信息傳播。(完)

【責(zé)任編輯:周曉燕】

精彩圖片

鏈接全球市場向貿(mào)易強(qiáng)省躍升

省十七運(yùn)會明年在孝感舉行吉祥物發(fā)布

大冶文化新地標(biāo)將上線，四大場館一站式打卡

網(wǎng)絡(luò)問政

數(shù)字賦能，史店村繪出基層治理新圖景
一張 “連心網(wǎng)” 串起寺背村幸福路
“云上小哥驛站”激活老舊小區(qū)新動能
普法情景劇把反詐知識送到“指尖”
武昌南湖街道AI賦能激活社區(qū)治理新活力

Copyright ? 2001-2025 湖北荊楚網(wǎng)絡(luò)科技股份有限公司 All Rights Reserved

互聯(lián)網(wǎng)新聞信息許可證 4212025003 －增值電信業(yè)務(wù)經(jīng)營許可證鄂B2-20231273 －廣播電視節(jié)目制作經(jīng)營許可證（鄂）字第00011號
 信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證 1706144 －互聯(lián)網(wǎng)出版許可證（鄂）字3號－營業(yè)執(zhí)照

鄂ICP備 13000573號-1 鄂公網(wǎng)安備 42010602000206號

版權(quán)為荊楚網(wǎng) m.st8856.com 所有未經(jīng)同意不得復(fù)制或鏡像