
來(lái)源:量子號(hào)
OpenAI 正在推出一款可以與之交談的先進(jìn)人工智能聊天機(jī)器人。這款機(jī)器人現(xiàn)已上市,至少對(duì)某些人來(lái)說(shuō)是這樣。?
新的聊天機(jī)器人代表著 OpenAI 向新一代人工智能語(yǔ)音助手邁進(jìn),該助手類似于 Siri 和 Alexa,但功能更強(qiáng)大,可以實(shí)現(xiàn)更自然、更流暢的對(duì)話。這是向更全面的人工智能代理邁出的一步。新的 ChatGPT 語(yǔ)音機(jī)器人可以分辨出不同語(yǔ)調(diào)所傳達(dá)的信息,對(duì)中斷做出反應(yīng),并實(shí)時(shí)回答查詢。它還經(jīng)過(guò)訓(xùn)練,聲音聽(tīng)起來(lái)更自然,可以用聲音傳達(dá)各種不同的情緒。
其語(yǔ)音模式由 OpenAI 的新 GPT-4o 模型所驅(qū)動(dòng),該模型結(jié)合了語(yǔ)音、文本和視覺(jué)能力。為了收集反饋意見(jiàn),該公司最初向“一小部分”ChatGPT Plus 的付費(fèi)用戶推出了該聊天機(jī)器人,但該公司表示將在今年秋天向所有 ChatGPT Plus 訂閱用戶提供。ChatGPT Plus 訂閱費(fèi)用為每月 20 美元(約 144 元人民幣)。OpenAI 表示,它將在 ChatGPT 應(yīng)用程序中通知第一批推出的用戶,并提供有關(guān)如何使用新模型的說(shuō)明。??
這項(xiàng)新語(yǔ)音功能于 5 月份宣布,但比原計(jì)劃晚了一個(gè)月才推出,因?yàn)樵摴颈硎拘枰鄷r(shí)間來(lái)改進(jìn)安全功能,例如模型檢測(cè)和拒絕不良內(nèi)容的能力。該公司還表示,正在準(zhǔn)備其基礎(chǔ)設(shè)施,以便為數(shù)百萬(wàn)用戶提供實(shí)時(shí)響應(yīng)。?
OpenAI 表示,它已經(jīng)與 100 多名外部紅隊(duì)成員一起測(cè)試了該模型的語(yǔ)音功能,他們的任務(wù)是探測(cè)該模型是否存在缺陷。據(jù) OpenAI 稱,這些測(cè)試人員總共會(huì)說(shuō) 45 種語(yǔ)言,來(lái)自 29 個(gè)國(guó)家。
該公司表示,已實(shí)施了多項(xiàng)安全機(jī)制。例如,為了防止該模型被用于制作音頻深度偽造,該公司與配音演員合作創(chuàng)建了四種預(yù)設(shè)聲音。GPT-4o 不會(huì)模仿或生成他人的聲音。?
OpenAI 首次推出 GPT-4o 時(shí),該公司因使用一種名為“Sky”的聲音而遭到強(qiáng)烈反對(duì),該聲音聽(tīng)起來(lái)很像女演員斯嘉麗·約翰遜。約翰遜發(fā)表聲明稱,該公司已與她取得聯(lián)系,希望允許在模型中使用她的聲音,但她拒絕了。她說(shuō),在模型演示中聽(tīng)到一個(gè)與她“驚人地相似”的聲音讓她感到震驚。OpenAI 否認(rèn)該聲音是約翰遜的,但已暫停使用 Sky。?
該公司還卷入了多起涉嫌侵犯版權(quán)的訴訟。OpenAI 表示,它已采用過(guò)濾器來(lái)識(shí)別和阻止生成音樂(lè)或其他受版權(quán)保護(hù)的音頻的請(qǐng)求。OpenAI 還表示,它已將其在基于文本的模型中使用的相同安全機(jī)制應(yīng)用于 GPT-4o,以防止其違反法律并生成有害內(nèi)容。?
OpenAI 計(jì)劃在未來(lái)加入更多高級(jí)功能,例如視頻和屏幕共享,這些功能可能會(huì)讓該助手更加有用。在 5 月份的一次演示中,員工將手機(jī)攝像頭對(duì)準(zhǔn)一張紙,并要求人工智能模型幫助他們解決數(shù)學(xué)方程式。他們還共享電腦屏幕,并要求模型幫助他們解決編程問(wèn)題。OpenAI 表示,這些功能現(xiàn)在不會(huì)推出,但會(huì)在稍后某個(gè)未指定的日期推出。






.png)





















