Google旗艦AI模型雙子座 2.5 Pro已完成1996年的Game Boy Classic“PokémonBlue”。
昨晚,Google首席執(zhí)行官Sundar Pichai在X上分享了新聞,寫道:“ Gemini 2.5 Pro剛剛完成了PokémonBlue!”
真好! Gemini 2.5 Pro剛剛完成了PokémonBlue!??特別感謝@thecodeofjoel為了創(chuàng)建和運行直播,并向所有在此過程中歡呼寶石的人。pic.twitter.com/E2pn3tpfEb
- Sundar Pichai(@sundarpichhai)2025年5月3日
TechCrunch報告喬爾·Z(Joel Z)是一位30歲的軟件工程師,他說他“與Google不相關(guān)”流在抽搐上運行。
即便如此,搜索巨頭的高管們一直在為該項目加油。 Logan Kilpatrick,Google AI Studio的產(chǎn)品負(fù)責(zé)人,發(fā)表上個月,雙子座“在完成神奇寶貝方面取得了長足的進(jìn)步”,并“贏得了第五個徽章(迄今為止,下一個最佳模特只有3個徽章,盡管有不同的特工安全帶)。 pichai回答開玩笑說:“我們正在研究API,人造神奇寶貝智能:)”
雙子座擊敗了人類AI模型Claude,該模型仍在PokémonRed上
游戲的選擇絕非易事。 2月,競爭對手公司Anthropic在演奏“PokémonRed”時,其Claude模特帶來的穩(wěn)定增長。該公司表示,克勞德(Claude)“擴展思維和經(jīng)紀(jì)人的培訓(xùn)”為意外任務(wù)(例如經(jīng)典角色扮演游戲)提供了“重大提升”。
喬爾·Z(Joel Z)列舉了克勞德(Claude)扮演神奇寶貝Twitch Feed,這是他的靈感之一。
到目前為止,克勞德尚未完成“神奇寶貝紅”。這意味著雙子座是一個更好的游戲玩家。
但是,喬爾·Z(Joel Z)警告觀眾不要過多地閱讀比較。他在Twitch頁面上寫道:“請不要認(rèn)為這是LLM可以玩神奇寶貝的基準(zhǔn)?!?“您無法真正進(jìn)行直接比較 - Gemini和Claude擁有不同的工具并接收不同的信息?!?/p>
Google Gemini與其他AI模型一樣,需要在提示或所謂的代理安全帶中提供幫助
這特工安全帶與攜帶額外屏幕上數(shù)據(jù)的LLM共享更新的屏幕截圖。 Gemini然后出現(xiàn)這種情況的原因,可以致電子代理執(zhí)行專業(yè)任務(wù),最后指示在游戲男孩模擬器中按下哪個按鈕。
喬爾·Z(Joel Z)承認(rèn),他偶爾會介入,但認(rèn)為幫助在公平的范圍內(nèi)。他解釋說:“我的干預(yù)措施改善了雙子座的整體決策和推理能力。”此外,該模型不需要特定的提示,演練或直接說明,例如月亮山等特定挑戰(zhàn)。
他補充說:“唯一接近的事情就是讓Gemini知道它需要兩次與火箭咕unt交談以獲取升降機鑰匙,這是一個蟲子,后來固定在神奇寶貝黃色中。”
喬爾說:“雙子座扮演神奇寶貝仍在積極發(fā)展。”他指出,該項目背后的框架“繼續(xù)發(fā)展”。
加密大都會學(xué)院:想在2025年養(yǎng)活您的錢嗎?在即將到來的WebClass中學(xué)習(xí)如何使用Defi進(jìn)行操作。保存您的位置
1872
收藏



















