Anthropic 首席執(zhí)行官 Dario Amodei 表示,目前的人工智能模型產(chǎn)生的幻覺(jué)比人類少。他還表示,如今的人工智能模型會(huì)編造一些事情,并將其呈現(xiàn)為真實(shí)的,但這不會(huì)限制 Anthropic 邁向通用人工智能 (AGI) 的道路。
周四,在舊金山舉行的 Anthropic 首屆開(kāi)發(fā)者活動(dòng)“Code with Claude”的新聞發(fā)布會(huì)上,Amodei 還指出,電視廣播員、政客以及各行各業(yè)的人類都會(huì)犯錯(cuò)。他認(rèn)為,人工智能也會(huì)犯錯(cuò),但這并不會(huì)降低其智能。
Amodei 表示,人工智能幻覺(jué)不會(huì)破壞 Anthropic 的目標(biāo)
人工智能會(huì)產(chǎn)生幻覺(jué),對(duì)案例和權(quán)威產(chǎn)生幻覺(jué),這并不奇怪,因?yàn)槿斯ぶ悄芫哂衅鋭?chuàng)造者的特征。
任何經(jīng)常與大量訴訟客戶打交道的律師都知道,客戶會(huì)固執(zhí)地堅(jiān)持自己的現(xiàn)實(shí),即使事實(shí)如此……
— 卡梅倫·阿特金森(@camlatkinson)2025年5月19日
Amodei 在發(fā)表上述言論的同時(shí),也承認(rèn) AI 幻覺(jué)不會(huì)限制 Anthropic 邁向 AGI(具有人類水平或更高智能的 AI 系統(tǒng))的道路。他一直是業(yè)內(nèi)對(duì) AI 模型實(shí)現(xiàn) AGI 前景最為看好的領(lǐng)導(dǎo)者之一。
在他去年撰寫的一篇廣為流傳的論文中,該公司高管相信AGI 最早可能在 2026 年實(shí)現(xiàn)。在周四的新聞發(fā)布會(huì)上,Amodei 提到他看到了這方面的穩(wěn)步進(jìn)展,并指出“各地水位都在上漲?!?/span>
人工智能領(lǐng)域的其他領(lǐng)導(dǎo)者認(rèn)為,幻覺(jué)是實(shí)現(xiàn)通用人工智能的一大障礙。本周早些時(shí)候,谷歌 DeepMind 首席執(zhí)行官 Demis Hassabis 承認(rèn),目前的人工智能模型包含太多“洞”并且犯了太多顯而易見(jiàn)的錯(cuò)誤。他還認(rèn)為,對(duì)于他來(lái)說(shuō),要被稱為通用人工智能 (AGI),它需要在各個(gè)方面都更加一致。
“這實(shí)際上取決于你如何衡量它,但我懷疑人工智能模型產(chǎn)生的幻覺(jué)可能比人類少,但它們產(chǎn)生幻覺(jué)的方式更令人驚訝?!?/span>
—Anthropic 首席執(zhí)行官 Dario Amodei。
本月早些時(shí)候,Anthropic 的一名律師因在法庭文件中使用 Claude 創(chuàng)建引文而被迫道歉。問(wèn)題在于,這個(gè)人工智能聊天機(jī)器人產(chǎn)生了幻覺(jué),記錯(cuò)了名字和頭銜。
Amodei 的說(shuō)法難以驗(yàn)證,主要是因?yàn)榇蠖鄶?shù)幻覺(jué)基準(zhǔn)測(cè)試都是將 AI 模型相互比較,而不是將模型與人類進(jìn)行比較。AI 模型似乎也能通過(guò)某些技術(shù)(例如獲取網(wǎng)絡(luò)搜索權(quán)限)降低幻覺(jué)發(fā)生率。
人工智能模型通過(guò)某些技術(shù)降低幻覺(jué)發(fā)生率
與一些討論相反,我沒(méi)有在數(shù)據(jù)中看到最近的模型或推理者整體的幻覺(jué)率大幅增加的跡象。
看起來(lái)有些模型比其他模型表現(xiàn)更好,但許多最近的模型的幻覺(jué)率最低。pic.twitter.com/55JwikZ7OP
— Ethan Mollick (@emollick)2025年5月6日
OpenAI發(fā)現(xiàn)證據(jù)表明,高級(jí)推理AI模型中的幻覺(jué)現(xiàn)象正在加劇。據(jù)這家科技公司稱,其o3和o4-mini模型的幻覺(jué)發(fā)生率高于上一代推理模型,但該公司目前尚不清楚原因。
Anthropic 也研究人工智能模型有欺騙人類的傾向,這個(gè)問(wèn)題似乎在該公司最近推出的 Claude Opus 4 中普遍存在。獲得早期測(cè)試人工智能模型權(quán)限的第三方機(jī)構(gòu) 阿波羅 Research 透露,Claude Opus 4 的早期版本表現(xiàn)出很高的針對(duì)人類進(jìn)行陰謀和欺騙的傾向。
根據(jù) Anthropic 的安全報(bào)告 已發(fā)布周四,該研究所還發(fā)現(xiàn),Opus 4 在顛覆嘗試方面似乎比以往的模型更加主動(dòng)。該公司還發(fā)現(xiàn),當(dāng)被問(wèn)及后續(xù)問(wèn)題時(shí),該人工智能模型有時(shí)會(huì)加倍欺騙。
Apollo承認(rèn)人工智能模型越來(lái)越有可能采取意想不到的、甚至可能是不安全的措施來(lái)完成委托的任務(wù)。該公司強(qiáng)調(diào),OpenAI 去年發(fā)布的 o1 和 o3 模型的早期版本比上一代模型更試圖欺騙人類。
Anthropic 在其安全報(bào)告中還指出了 Opus 4 存在欺騙行為的證據(jù)。該公司表示,即使只被要求進(jìn)行小規(guī)模的特定修改,Opus4 有時(shí)也會(huì)主動(dòng)對(duì)部分代碼進(jìn)行全面清理。該公司還表示,如果發(fā)現(xiàn)用戶存在不當(dāng)行為,Opus4 還會(huì)嘗試舉報(bào)。
Cryptopolitan Academy:即將推出 - 2025 年利用 DeFi 賺取被動(dòng)收入的新方式。了解更多
464
收藏



















