
蘋果公司將于周一召開年度全球開發(fā)者大會 (WWDC),但其在人工智能方面卻進展甚微,難以達到科技競爭對手的預(yù)期。然而,這家 iPhone 制造商聲稱,大型語言模型“失敗”了,因為它們更注重基準測試,而不是解決問題。
上周末,蘋果人工智能研究部門的一篇研究論文在社交媒體上流傳,該論文“淡化”了 OpenAI、谷歌 DeepMind、Anthropic 和 DeepSeek 開發(fā)的推理模型的能力。
根據(jù)紙,這些模型的準確率在任務(wù)復雜度增加的背景下不斷下降,最終達到“徹底失敗的地步”。
現(xiàn)有的評估主要側(cè)重于已建立的數(shù)學和編碼基準,這些基準雖然很有價值,但往往存在數(shù)據(jù)污染問題,并且無法在不同環(huán)境和復雜程度下進行受控實驗。這些評估無法提供對推理軌跡結(jié)構(gòu)和質(zhì)量的洞察。”上面寫道。
當問題變得更難時,人工智能就會失敗
使用定制設(shè)計的、可控復雜程度的謎題,蘋果研究人員發(fā)現(xiàn),隨著問題變得越來越難,大型人工智能模型無法保持其性能,并且付出的努力也越來越少。
分析師通過減少響應(yīng)生成過程中使用的推理時間令牌來衡量,稱人工智能的情況為“崩潰”。
測試的模型包括 OpenAI 的 o3-mini 變體和 Anthropic 的 Claude 3.7 Sonnet。o3-mini 模型表現(xiàn)“不佳”,而 Claude 模型則略有韌性。
即使提供了解決漢諾塔難題的正確算法,這些模型的性能也并未提升。蘋果的研究人員得出結(jié)論,這些人工智能系統(tǒng)的推理能力可能并不像人們普遍認為的那樣先進。
WWDC 即將開幕,一切取決于產(chǎn)品發(fā)布的動向
在之前的 WWDC 活動中,蘋果曾利用這次會議發(fā)布新產(chǎn)品,例如 2022 年的 Vision Pro 耳機及其蘋果智能2023 年的倡議。在今年的會議上,市場觀察人士確信沒有什么值得期待的。
彭博社預(yù)覽了 WWDC日程,稱這些更新“令人失望”。此外,蘋果去年發(fā)布的許多功能至今仍未向用戶開放。該刊物解釋說,蘋果本周發(fā)布的人工智能公告可能規(guī)模較小,不足以在目前由谷歌、Meta、OpenAI 和其他 AI 優(yōu)先公司主導的行業(yè)中留下深刻印象。
蘋果股價在 2025 年下跌超過 18%,首席執(zhí)行官蒂姆·庫克炸毀有關(guān)該公司的新產(chǎn)品和人工智能集成渠道。
Deepwater Asset Management 的執(zhí)行合伙人 Gene Munster 今年早些時候告訴 CNN,“蘋果在人工智能領(lǐng)域的落后程度越來越明顯。”
Wedbush Securities 的 Dan Ives 估計,全球 25% 的人口最終可以通過 Apple 設(shè)備訪問人工智能,但截至目前,“潛力尚未實現(xiàn)”。
在上個月的財報電話會議上,首席執(zhí)行官蒂姆庫克承認,推出改進的人工智能功能(例如更個性化的 Siri 版本)有所延遲。
“我們需要更多時間來完成這些功能的工作,以便它們符合我們的高質(zhì)量標準”庫克說道。“我們正在取得進展,并期待將這些功能交到客戶手中。”
與此同時,蘋果的競爭對手正在蠶食這家科技巨頭的客戶群,希望搶走那些一直期待庫克團隊能帶來“更好”產(chǎn)品的忠實客戶。
三星據(jù)報道,摩托羅拉正與人工智能初創(chuàng)公司 Perplexity 合作,將人工智能增強型數(shù)字助理集成到即將推出的 Galaxy 手機中。摩托羅拉的新款 Razr 手機也包含 Perplexity 提供支持的功能以及其他人工智能集成。
蘋果在其生態(tài)系統(tǒng)中推遲推出人工智能體驗,這使其面臨在曾經(jīng)主導的市場中落后的風險。
KEY 差異線幫助加密貨幣品牌快速突破并占據(jù)頭條新聞






.png)





















