新一輪AI大戰(zhàn),即將拉開序幕!
下周一,OpenAI將開啟線上直播,官宣GPT-4升級(jí),甚至還有一個(gè)超級(jí)「AI助手」等著我們。
OpenAI「音頻AGI研究負(fù)責(zé)人」Alexis Conneau已更換主頁(yè)背景,并與奧特曼同頻——下周我們將會(huì)見(jiàn)證Magic。
OpenAI研究科學(xué)家Bowen Cheng甚至表示,這可比GPT-5酷多了。
這些種種,暗示著真正的「Her」即將登場(chǎng)。
頂著OpenAI的壓力,谷歌將在第二天的I/O大會(huì)上公布模型新進(jìn)展,據(jù)傳還將發(fā)布一個(gè)名為「Pixie」個(gè)人數(shù)字助理,由Gemini加持。
緊接著,微軟將在21日召開Build開發(fā)者大會(huì),大概率將OpenAI最新能力集成到自家產(chǎn)品線中,甚至可能會(huì)透露最新5000億參數(shù)自研大模型MAI-1。
還有萬(wàn)眾期待的蘋果WWDC大會(huì),將發(fā)布集成生成式AI能力的iOS 18系統(tǒng),并把ChatGPT塞進(jìn)iPhone之中。
一系列重磅發(fā)布,連番轟炸,簡(jiǎn)直不給其他公司喘氣的機(jī)會(huì)。
有網(wǎng)友問(wèn)道,「蘋果是在放棄自己的『AJAX』人工智能系統(tǒng),全力與OpenAI公司合作?還是直到他們的AI能力趕上之前,OpenAI只是權(quán)宜之計(jì)」?
蘋果內(nèi)幕人Gurman總結(jié)了蘋果的人工智能戰(zhàn)略:
- 設(shè)備端LLM(自研)
- 云端LLM(自研)
- 聊天機(jī)器人(可能是OpenAI,也可能是谷歌)
蘋果不打算自己開發(fā)聊天機(jī)器人,但意識(shí)到市場(chǎng)對(duì)此有需求,因此會(huì)從外部獲取這項(xiàng)技術(shù)。這一策略與其在搜索領(lǐng)域的做法相似。
顯然,現(xiàn)在的局面是,OpenAI與微軟、甚至蘋果通過(guò)AI合作捆綁在一起,只剩下谷歌自己?jiǎn)未颡?dú)斗。
不知,這波AI爭(zhēng)霸之戰(zhàn),誰(shuí)勝誰(shuí)負(fù)?
ChatGPT可以通話,周一直播再爆料
全網(wǎng)的焦點(diǎn),還是在OpenAI。
「他們將會(huì)發(fā)布什么」,這一話題熱度只增不減,鮮有人討論谷歌I/O大會(huì)。
關(guān)于周一的發(fā)布預(yù)測(cè),網(wǎng)友Ananay又有了一個(gè)新發(fā)現(xiàn):
ChatGPT或?qū)⒕邆渚邆渫ㄔ捘芰?/p>
其實(shí)可以從如下代碼中,打電話、拒接等關(guān)鍵詞中,可以看出這一功能。
另外,OpenAI已經(jīng)部署了webRTC服務(wù)器來(lái)實(shí)現(xiàn)這一功能,這些服務(wù)器最近也進(jìn)行了配置。
起初,網(wǎng)友還以為,這是OpenAI部署WebRTC服務(wù)器可能是為了純語(yǔ)音模式,而現(xiàn)在看來(lái),并非如此。
因?yàn)?,這個(gè)功能是由Livekit提供的。(這是一個(gè)可以提供實(shí)時(shí)音視頻通信的解決方案)
下面網(wǎng)友評(píng)論道,這是不是意味著,ChatGPT能夠主動(dòng)給我打電話,而不需要我先發(fā)起呼叫?
他提出這一問(wèn)題,是因?yàn)樵陔娪癏er中,人工智能助手Samantha主動(dòng)給男主人公打了電話,告知他一些事情。
想象一下,ChatGPT助手主動(dòng)給你打電話,提醒或查看用戶習(xí)慣,將是多么神奇的一件事。
不過(guò),Ananay表示,這需要用戶自己選擇允許這一功能。
Hallid.ai的聯(lián)合創(chuàng)始人indigo也做了一個(gè)全面的預(yù)測(cè)/趨勢(shì)猜想。
根據(jù)indigo的介紹,GPT-4的新版應(yīng)該會(huì)按照參數(shù)規(guī)模不同,分化成多個(gè)版本。
昨天,就有網(wǎng)友猜測(cè),可能會(huì)有g(shù)pt4-lite、gpt4-auto、gpt4-lite-auto的版本發(fā)布。
而幾天前出現(xiàn)在LMSYS競(jìng)技場(chǎng)上的gpt2-chatbot,可能是輕量級(jí)的GPT-4新版。而且,這意味著,GPT-3.5的使命要結(jié)束了,最新輕量版本可能會(huì)免費(fèi)用,同時(shí)API價(jià)格大降。
至于,奧特曼所說(shuō)的「魔法」,可能就是升級(jí)后的GPT-4——gpt4-auto,具備自主執(zhí)行Agent任務(wù)的能力,記憶更強(qiáng),規(guī)劃能力更強(qiáng)。
當(dāng)然,「AI助手」也將Her帶入現(xiàn)實(shí)。
來(lái)源:indigo
昨天,OpenAI視頻生成研究科學(xué)家Will Depue發(fā)了一張奇點(diǎn)降臨的logo,或許又在暗示著什么。
谷歌打擂臺(tái),或推出AI助手Pixie
在這個(gè)與OpenAI和微軟對(duì)飆的關(guān)鍵時(shí)刻,谷歌明確表示,這場(chǎng)大會(huì)發(fā)布的內(nèi)容都是關(guān)于AI的。
根據(jù)谷歌官網(wǎng),本年度的I/O大會(huì)將在美東時(shí)間5月14日下午1點(diǎn)召開。
據(jù)猜測(cè),谷歌將在搜索引擎中融合生成式AI,讓用戶可以進(jìn)行對(duì)話式搜索。
此外,谷歌也一直在測(cè)試新的搜索功能,比如針對(duì)英語(yǔ)學(xué)習(xí)者的AI對(duì)話練習(xí),以及在購(gòu)物時(shí)生成虛擬試穿圖像。
不僅僅是搜索引擎,更多的谷歌應(yīng)用也會(huì)更深入地集成AI功能,比如在Google Maps中幫用戶找到合適的餐廳、購(gòu)物中心和電動(dòng)汽車充電站。
打客服電話時(shí)轉(zhuǎn)接太久怎么辦?
谷歌測(cè)試的AI新功能甚至可以幫你自動(dòng)等待轉(zhuǎn)接,直到有人接聽(tīng)再來(lái)通知你。
除了各種應(yīng)用,操作系統(tǒng)也不能落下。
上個(gè)月Android 15的開發(fā)者預(yù)覽已經(jīng)發(fā)布,谷歌將在I/O大會(huì)上進(jìn)一步介紹其中的新功能,可能會(huì)加入更深度的Gemini集成。
目前在安卓系統(tǒng)中,生成式AI的功能主要由Gemini Nano驅(qū)動(dòng),用在各種軟件功能中。
比如Magice Compose可以在Google Messages等應(yīng)用程序中提供回復(fù)建議,Cinematic Wallpaper利用機(jī)器學(xué)習(xí)幫助用戶定制屏幕壁紙。
可以想象一下,有AI進(jìn)一步參與的安卓會(huì)帶來(lái)哪些更個(gè)性化的用戶體驗(yàn)?比如,更智能的手機(jī)主屏幕、鎖屏界面和通知欄?
去年的I/O大會(huì)上我們看到了與ChatGPT競(jìng)爭(zhēng)的大語(yǔ)言模型Gemini,今年是否會(huì)有新的模型出現(xiàn)呢?
除了Gemini的新版本,或許也可以期待一下谷歌推出的圖像和視頻大模型。
Reddit上有網(wǎng)友爆料,稱谷歌存貨中有3個(gè)模型已經(jīng)在測(cè)試但還未向公眾發(fā)布,估計(jì)會(huì)在2024 I/O大會(huì)亮相。
這三個(gè)模型分別是圖像生成模型Imagen 3,以及兩個(gè)可以對(duì)圖像進(jìn)行優(yōu)化、補(bǔ)全的模型Juno和Miro。
據(jù)說(shuō),Miro還會(huì)有視頻生成的功能。
此外,谷歌可能會(huì)在今年I/O上發(fā)布新版本的AI助手「Pixie」,或許可以取代原有的同類產(chǎn)品Google Assistant。
Pixie由語(yǔ)言模型Gemini驅(qū)動(dòng),安裝在谷歌自己開發(fā)的硬件設(shè)備Pixel上,對(duì)其他第三方設(shè)備是否開放我們尚未可知。
但本次I/O大會(huì)上我們應(yīng)該不會(huì)看到更新版本的Pixel產(chǎn)品,谷歌已經(jīng)在近期發(fā)布了新版本Pixel 8a,而且已經(jīng)開放給用戶預(yù)定購(gòu)買。
網(wǎng)上流出的新版本Pixel 9外觀
預(yù)計(jì),Pixel 9與折疊款Pixel 9 Pro Fold預(yù)計(jì)將在今年秋季發(fā)布。
蘋果緊抓救命稻草
與此同時(shí),面對(duì)OpenAI和谷歌來(lái)勢(shì)洶洶的AI語(yǔ)音助手沖擊,網(wǎng)友們向蘋果喊話:
留給蘋果的時(shí)間不多了!
雖然已有消息稱OpenAI與蘋果即將敲定一項(xiàng)合作協(xié)議,讓ChatGPT能夠裝進(jìn)iPhone中,并為今年的iOS系統(tǒng)提供全新的生成式AI能力。
但蘋果并不準(zhǔn)備放棄自家的Siri。
近日,紐約時(shí)代報(bào)道,蘋果將對(duì)Siri進(jìn)行升級(jí)重組,以應(yīng)對(duì)其他聊天機(jī)器人競(jìng)爭(zhēng)對(duì)手。
而這一決定早已做下。
2023年年初,蘋果高管Craig Federighi和John Giannandrea花費(fèi)數(shù)周時(shí)間測(cè)試了風(fēng)頭一時(shí)無(wú)兩的OpenAI新聊天機(jī)器人ChatGPT后,就深感危機(jī)。
他們認(rèn)為生成式人工智能的出現(xiàn)讓Siri顯得過(guò)時(shí)、落后。
Siri作為蘋果2011年推出、每部iPhone中最初的虛擬助手,一直以來(lái)都僅限于滿足個(gè)人請(qǐng)求,不能跟上用戶發(fā)起的對(duì)話。
例如,有人先詢問(wèn)了舊金山的天氣然后說(shuō):「紐約怎么樣?」時(shí),Siri經(jīng)常會(huì)誤解用戶的提問(wèn)。
但ChatGPT知道用戶想要的是后一個(gè)問(wèn)題的回答。
在意識(shí)到新技術(shù)已經(jīng)超越Siri之后,這家科技巨頭發(fā)起了十多年來(lái)最重大的重組。
蘋果公司決心在科技行業(yè)的人工智能競(jìng)賽中迎頭趕上,它將生成式人工智能作為公司內(nèi)部的特殊標(biāo)桿項(xiàng)目,圍繞著十年一遇的計(jì)劃來(lái)組織員工。
Siri超進(jìn)化
據(jù)蘋果的三名內(nèi)部人士透露,蘋果將于今年6月10日的年度開發(fā)者大會(huì)上發(fā)布改進(jìn)后的Siri。
新版本中的基礎(chǔ)技術(shù)包含新的生成式人工智能,將允許Siri與用戶進(jìn)行聊天而不是一次回答一個(gè)問(wèn)題。
并且使Siri的對(duì)話性更強(qiáng)、用途更廣。
Siri的更新是蘋果公司在全面擁抱生成式AI 領(lǐng)域處于領(lǐng)先地位的舉措之一。
為了支持其新的Siri功能,還在今年的iPhone中增加了內(nèi)存。
此外,蘋果還討論了與包括Google、Cohere和OpenAI 在內(nèi)的幾家公司合作,以獲得支持聊天機(jī)器人的AI模型使用權(quán)的可能性。
另一方面,蘋果的高管也在擔(dān)心新興的AI技術(shù)將作為未來(lái)主要的操作系統(tǒng)取代iOS,威脅蘋果在全球智能手機(jī)市場(chǎng)的主導(dǎo)地位。
并且,這項(xiàng)新技術(shù)還可能促成一個(gè)以AI應(yīng)用(AI智能體)為核心的生態(tài)系統(tǒng)。
這可能會(huì)削弱蘋果的App Store,該商店每年的銷售額約為240億美元。
但蘋果更擔(dān)心的是,如果不能開發(fā)出自己的AI系統(tǒng),iPhone將會(huì)在與其他先進(jìn)技術(shù)的比較中可能變成「啞巴手機(jī)」,失去市場(chǎng)。
iPhone目前占據(jù)了全球智能手機(jī)利潤(rùn)的85%份額,并創(chuàng)造了超過(guò)2000億美元的銷售額。
可以預(yù)想這個(gè)損失是不可估量的,也是蘋果不能接受的。
在這種危機(jī)的緊迫感促使下,蘋果取消了另一項(xiàng)重大的投資——
一個(gè)耗資100億美元的自動(dòng)駕駛汽車項(xiàng)目,并調(diào)派數(shù)百名工程師轉(zhuǎn)向AI的開發(fā)工作。
并且,蘋果還將延續(xù)一貫的設(shè)備流程工具上的一致性,探索創(chuàng)建由iPhone和Mac處理器驅(qū)動(dòng)的服務(wù)器。
內(nèi)部人士的爆料里,蘋果對(duì)Siri的升級(jí)并不在于讓它與ChatGPT競(jìng)爭(zhēng)詩(shī)歌創(chuàng)作等內(nèi)容生成的部分,而是讓Siri專注于處理它原有的任務(wù):
包括設(shè)置鬧鐘、創(chuàng)建日歷備忘提醒、添加購(gòu)物清單中的物品,以及總結(jié)短信內(nèi)容。
蘋果計(jì)劃宣稱升級(jí)后的Siri將比競(jìng)對(duì)公司的人工智能提供更加私密的服務(wù),成本更劃算。
因?yàn)镾iri是在iPhone上處理請(qǐng)求,這避免了數(shù)據(jù)在云端的泄露以及云計(jì)算的成本。
但是,蘋果公司也面臨著安裝在iPhone上的小型人工智能系統(tǒng)的風(fēng)險(xiǎn):
研究發(fā)現(xiàn),較小的人工智能系統(tǒng)可能比較大的系統(tǒng)更容易出現(xiàn)幻覺(jué)。
Siri聯(lián)合創(chuàng)始人Tom Gruber表示:
「Siri的目標(biāo)始終是創(chuàng)建一個(gè)能理解語(yǔ)言和上下文的對(duì)話界面,但這是個(gè)難題。
隨著技術(shù)的變革,我們應(yīng)該能做得更好。只要不試圖用同一種方法解決所有問(wèn)題,就能避免很多困難?!?/p>
蘋果在人工智能領(lǐng)域擁有多項(xiàng)優(yōu)勢(shì),包括在全球超過(guò)20億臺(tái)在使用的設(shè)備,領(lǐng)先的半導(dǎo)體團(tuán)隊(duì)等。
它們能夠支持蘋果推廣AI產(chǎn)品,并支持包括面部識(shí)別在內(nèi)需要大量芯片的AI任務(wù)。
一個(gè)月時(shí)間,蘋果能否扭轉(zhuǎn)局勢(shì)
但在過(guò)去的十年里,蘋果從未制定出一個(gè)全面的人工智能戰(zhàn)略,Siri自推出以來(lái)也沒(méi)有大的升級(jí)改進(jìn)。
同時(shí),作為語(yǔ)音助手的局限性也減弱了公司智能音箱HomePod的吸引力,因?yàn)樗鼰o(wú)法穩(wěn)定完成一些簡(jiǎn)單的任務(wù),比如響應(yīng)歌曲播放請(qǐng)求。
曾在Siri團(tuán)隊(duì)工作兩年后,創(chuàng)立了生成式人工智能平臺(tái)Brighten.ai的John Burkey表示:
「Siri團(tuán)隊(duì)創(chuàng)立以來(lái),未能獲得過(guò)與蘋果內(nèi)其他團(tuán)隊(duì)同等的關(guān)注和資源。
而蘋果的不同部門,往往各自獨(dú)立,信息共享有限。
但事實(shí)是AI需要被整合到產(chǎn)品中,才能取得成功?!?/p>
另外,蘋果在招募和留住領(lǐng)先人工智能人才方面也有著相當(dāng)?shù)淖枇Α?/p>
由于蘋果的保密性,研究成果發(fā)表論文、參加會(huì)議的都很少,這對(duì)于科學(xué)家來(lái)說(shuō)幾乎是不可忍受的弊端。
最近幾個(gè)月來(lái),蘋果略微調(diào)整了一貫的戰(zhàn)略,增加了人工智能論文發(fā)表的數(shù)量,但業(yè)內(nèi)的研究人員仍質(zhì)疑論文的質(zhì)量,認(rèn)為它們是蘋果的營(yíng)銷炒作手段。
但對(duì)一些初出茅廬且野心勃勃的研究人員來(lái)說(shuō),加入蘋果能夠成為項(xiàng)目的領(lǐng)導(dǎo)成員,是他們選擇蘋果的重要原因。
盡管蘋果已調(diào)整了發(fā)展戰(zhàn)略,并吸收了不少新鮮血液。
但在這場(chǎng)聲勢(shì)浩大、令人眼花繚亂的AI語(yǔ)音助手之戰(zhàn)中,蘋果能否在6月的開發(fā)者大會(huì)上逆轉(zhuǎn)劣勢(shì)尚未可知。
未來(lái)的AI語(yǔ)音助手形態(tài)如何,又會(huì)怎樣影響我們的生活?
這個(gè)問(wèn)題的答案正在不斷接近我們。