AIGC人工智能生成內(nèi)容,相對(duì)更早的內(nèi)容生產(chǎn)模式分別為專(zhuān)家生產(chǎn)內(nèi)容PGC和用戶(hù)生產(chǎn)內(nèi)容UGC。而隨著AIGC出現(xiàn),內(nèi)容生產(chǎn)率變成指數(shù)級(jí)上升。那么AIGC發(fā)展對(duì)于普通人來(lái)說(shuō)到底意味著什么?
先回顧一下時(shí)間軸,
2015年7月,谷歌推出Deepdream開(kāi)創(chuàng)AI模型根據(jù)文本生成圖像的先河。
2021年1月,OpenAI發(fā)布達(dá)人DALL-E模型,讓文本生成圖像真正卷出了天際。
2022年7月,獨(dú)立實(shí)驗(yàn)室Midjourney發(fā)布同名圖像生成模型。Journey設(shè)計(jì)師Jason Allen用AI生成圖片,太空歌劇院,在克羅拉多州博覽會(huì)的名聲比賽中獲得投獎(jiǎng),并感慨藝術(shù)意思,人類(lèi)輸了,引起全球熱議。
2022年8月,stability AI的開(kāi)源圖像生成模型stable diffusion。僅需一臺(tái)電腦就能運(yùn)行,截至當(dāng)年10月,已有超過(guò)20萬(wàn)開(kāi)發(fā)者下載這一系列模型引爆了AI作畫(huà)領(lǐng)域,標(biāo)志著人工智能向藝術(shù)領(lǐng)域的滲透。
與此同時(shí),2022年12月,OpenAI的大型語(yǔ)言生成模型ChatGPT引爆全網(wǎng),能做到和人類(lèi)對(duì)答如流,勝任高情商對(duì)話(huà)能進(jìn)行短文、詩(shī)歌、代碼計(jì)算邏輯等不同類(lèi)型的內(nèi)容輸出,讓人不禁懷疑ChatGPT是否真的已經(jīng)具有人力智能,僅過(guò)了短短幾個(gè)月,升級(jí)版GPT 4橫空出世,不光能實(shí)現(xiàn)圖文多模態(tài)輸入,在專(zhuān)業(yè)領(lǐng)域也表現(xiàn)出媲美人類(lèi)甚至超越人類(lèi)的水平。
2022年是AIGC元年,代表新一輪范式轉(zhuǎn)移的開(kāi)始。AI模型在文本圖片生成方面效果令人驚喜,在視頻和3D等高復(fù)雜領(lǐng)域逐步探索階段,但對(duì)AI的學(xué)習(xí)速度來(lái)說(shuō),拿下這些領(lǐng)域也只是時(shí)間問(wèn)題。
以上所有都不是突然出現(xiàn)的AIGC之所以能在22年爆發(fā),至少具備以下四項(xiàng)條件。
一、模型訓(xùn)練技術(shù)革新:與其他行業(yè)不同,AC是開(kāi)放科學(xué)、不斷創(chuàng)新在生成算法優(yōu)質(zhì)模型、開(kāi)源加速技術(shù)變革,其中OpenAI開(kāi)源的CLIP多模態(tài)預(yù)訓(xùn)練模型能同時(shí)進(jìn)行自然語(yǔ)言理解和計(jì)算機(jī)視覺(jué)分析,這讓模型訓(xùn)練可以直接利用互聯(lián)網(wǎng)上自帶文字描述的圖片素材,大幅降低了數(shù)據(jù)獲取門(mén)檻,也是圖像生成模型的技術(shù)基礎(chǔ)。
二、合成數(shù)據(jù)驅(qū)動(dòng)訓(xùn)練。早期模型訓(xùn)練最大掣肘就是數(shù)據(jù),面臨數(shù)據(jù)標(biāo)注,費(fèi)時(shí)費(fèi)力且準(zhǔn)確率低,樣本數(shù)量無(wú)法覆蓋邊緣案例,稍微長(zhǎng)期數(shù)據(jù)難以采集隱私數(shù)據(jù)面臨法律法規(guī)限制等問(wèn)題。但隨著生成式AI的發(fā)展,模型產(chǎn)出的合成數(shù)據(jù)又反哺模型訓(xùn)練過(guò)程,形成加速飛輪。可以說(shuō)合成數(shù)據(jù)影響了AI的未來(lái)。
三、GPU芯片支持。我們通過(guò)網(wǎng)絡(luò)感受AI,但真正的模型訓(xùn)練需要投入巨額資金驅(qū)動(dòng)巨型服務(wù)器,這也直接使GPU芯片和服務(wù)器制造商英偉達(dá)發(fā)展成為了全球最有價(jià)值的公司。
四、產(chǎn)業(yè)生態(tài)逐漸成型。首先是上游預(yù)訓(xùn)練模型,超過(guò)80%的人工智能研究都集中在基礎(chǔ)模型訓(xùn)練上,這一層的門(mén)檻很高,例如語(yǔ)言處理模型GPT3的訓(xùn)練成本粗略估算1,200萬(wàn)美元。因此有能力做預(yù)訓(xùn)練模型的主要為頭部科技企業(yè)和獨(dú)角獸公司。其次是以?xún)?yōu)秀的預(yù)訓(xùn)練模型為根基,開(kāi)發(fā)和銷(xiāo)售垂直細(xì)分領(lǐng)域的中間模型及服務(wù)model as a service成為現(xiàn)實(shí),這一層就比較適合初創(chuàng)公司和個(gè)人創(chuàng)業(yè)者。
你可能會(huì)問(wèn),作為普通人知道這個(gè)有什么用啊?
基于GPT模型,有人拿ChatGPT寫(xiě)作業(yè),有人組合多個(gè)AI工具全自動(dòng)做視頻,有人利用信息差拿AI效果圖賺錢(qián),有人發(fā)現(xiàn)提示詞帶有學(xué)問(wèn),甚至有人拿AI違法亂紀(jì)。
總而言之,AIGC打開(kāi)了新世界的大門(mén)。
反觀我國(guó)自主AI研發(fā)都是可能是龐大的人口規(guī)模,更可能產(chǎn)生專(zhuān)業(yè)人才訓(xùn)練數(shù)據(jù),但劣勢(shì)是忽視AI的高昂訓(xùn)練成本,讓普通企業(yè)望而卻步,很多所謂的大廠(chǎng)就是坐擁廣闊市場(chǎng),大玩割韭菜游戲,GPU算力才是AI的本體,但從2018年開(kāi)始,美國(guó)不僅限制中國(guó)進(jìn)口高端芯片,還限制中國(guó)獲得生產(chǎn)芯片的工具。這么一盤(pán)中國(guó)AI也是任重道遠(yuǎn)。
了解背景后,我們就來(lái)看看AIGC廣闊的應(yīng)用前景。
一、設(shè)計(jì)提效。在商業(yè)領(lǐng)域可以批量生產(chǎn)設(shè)計(jì)方案,并對(duì)方案的價(jià)值進(jìn)行精準(zhǔn)預(yù)判,例如日本中視會(huì)社Plug提供package design AI只需使用者上傳素材,AI就可以一小時(shí)內(nèi)自動(dòng)生成上千種包裝設(shè)計(jì),并在10秒內(nèi)計(jì)算出他們的受歡迎程度。日本零食大牌卡勒比曾找他們合作,優(yōu)化后的業(yè)績(jī)比舊包裝增長(zhǎng)了135%。
二、珍貴資料的修復(fù),百度利用文心模型上浮春山巨土重生。騰訊利用AI助力敦煌壁畫(huà)的修復(fù),極大提升文物保護(hù)的效率。2022年4月1日,AI技術(shù)修復(fù)的港星張國(guó)榮的演唱會(huì),以4K高精品制讓無(wú)數(shù)人民淚目。也許不久的將來(lái),AI就能用VR帶大家穿越上世紀(jì)初的演唱會(huì)現(xiàn)場(chǎng)。
三、數(shù)字孿生技術(shù),充分利用AI模型在虛擬空間中完成真實(shí)場(chǎng)景的建模映射,并推演實(shí)體的生命周期。在產(chǎn)品設(shè)計(jì)、醫(yī)學(xué)分析、高危公眾安全、城市建設(shè)等領(lǐng)域運(yùn)營(yíng)較多。特斯拉正在構(gòu)建一個(gè)巨大模型,以更安全高效的方式實(shí)現(xiàn)其自動(dòng)駕駛汽車(chē)的訓(xùn)練目標(biāo)。
四、元宇宙的內(nèi)容基礎(chǔ),元宇宙中不僅有用戶(hù),還應(yīng)該存在很多類(lèi)似NPC的智能體,為用戶(hù)提供交互服務(wù)。這些智能體agent就很需要AI模型生產(chǎn)并驅(qū)動(dòng)。
五、人類(lèi)生命的數(shù)字化延展。近幾年藝人頻頻爆雷塌房,導(dǎo)致品牌遭殃害,虛擬人充當(dāng)代言人風(fēng)險(xiǎn)和效率都會(huì)可控很多。而對(duì)于生病的人,AI可以生成治療方案,甚至可以生成語(yǔ)音,幫助師生者開(kāi)口講話(huà)。全世界第一個(gè)賽伯格彼得斯科特摩根以自己的身體作為實(shí)驗(yàn)對(duì)象,用AIGC技術(shù)不斷和變動(dòng)中斗爭(zhēng),再激進(jìn)點(diǎn)甚至可以進(jìn)行人類(lèi)的數(shù)字化改造。除了活著的人,AI具有很多學(xué)習(xí)人類(lèi)的錄像、音樂(lè)資料以數(shù)字化的方式呈現(xiàn)。
當(dāng)然,AIGC也有自己潛在的不足和風(fēng)險(xiǎn)。
1.安全挑戰(zhàn),包含但不限于以下,就拿ChatGPT來(lái)說(shuō),它能隨機(jī)生成大量,看起來(lái)正確,但仔細(xì)檢查卻是錯(cuò)誤的答案。如果這些錯(cuò)誤信息被無(wú)腦搬運(yùn)到網(wǎng)絡(luò)平臺(tái),嚴(yán)重干擾網(wǎng)絡(luò)知識(shí)的準(zhǔn)確性。雖然很多嚴(yán)肅的技術(shù)交流網(wǎng)站已禁止用戶(hù)分享ChatGPT回答,但現(xiàn)狀就是很難區(qū)分這個(gè)內(nèi)容的創(chuàng)作者到底是AI還是人即便OpenAI自己制作的內(nèi)容程序,準(zhǔn)確率也難以做到完全正確。
人們對(duì)使用ChatGPT學(xué)習(xí)感到興奮,但危險(xiǎn)在于,除非你已經(jīng)知道答案,否則你無(wú)法判斷他什么時(shí)候生成的結(jié)果是錯(cuò)的。很多不法分子利用開(kāi)源的AI模型,以更低的門(mén)檻、更高的效率來(lái)去做惡意內(nèi)容。例如stable diffusion開(kāi)源后很快就有人將它用作搞顏色平臺(tái),聲稱(chēng)迄今為止已生成超過(guò)400多萬(wàn)張顏色圖片了。與此同時(shí),借助AI學(xué)習(xí)和偽造影視頻內(nèi)容,盜用個(gè)人身份進(jìn)行敲詐勒索,2021年就有詐騙團(tuán)伙利用AI換臉yellow mask半年詐騙價(jià)值超過(guò)2億元人民幣的數(shù)字貨幣。
2.個(gè)人隱私碎片。隨著我們上網(wǎng)沖浪,遍布互聯(lián)網(wǎng),AI模型強(qiáng)大的推理能力可以通過(guò)信息多元互證拼湊出完整的個(gè)人數(shù)據(jù),如果被不法分子濫用,真是防不勝防。在模型及服務(wù)的產(chǎn)業(yè)結(jié)構(gòu)下,再精密的AI模型,也難免存在一些內(nèi)生安全問(wèn)題,在遭受攻擊或數(shù)據(jù)中毒時(shí),如何將有毒數(shù)據(jù)去除,并且保證用途數(shù)據(jù)的安全也是極大的問(wèn)題。
倫理挑戰(zhàn)訓(xùn)練模型都是依據(jù)人類(lèi)世界的數(shù)據(jù),因此天然會(huì)延續(xù)并放大人類(lèi)社會(huì)已有的社會(huì)偏見(jiàn)和刻板印象。OpenAI的ChatGPT和達(dá)人模型在文字和圖像生成結(jié)果中都有明顯的宗教偏見(jiàn)和性別歧視。并且AI模型還很容易被交換。微軟推出的聊天機(jī)器人不到24小時(shí)就被調(diào)教成一個(gè)集反猶歧視、性別歧視于一身的不良少年。
3.在知識(shí)產(chǎn)權(quán)問(wèn)題。AI模型學(xué)習(xí)了大量人類(lèi)的作品數(shù)據(jù),難免會(huì)模仿優(yōu)秀創(chuàng)作者的個(gè)人風(fēng)格,很可能構(gòu)成著作權(quán)侵權(quán)。再者,由AI模型生成的作品著作權(quán)應(yīng)當(dāng)歸用戶(hù)訓(xùn)練模型的公司創(chuàng)造這種風(fēng)格的設(shè)計(jì)師還是AI模型自己,都將引發(fā)爭(zhēng)論。
4.人文方面。AI模型被用來(lái)復(fù)活已故演員,創(chuàng)造群眾與使者交談的可能,但試著沒(méi)有也不能行,是同意或拒絕權(quán)利,因此有學(xué)者認(rèn)為這是損害了曾經(jīng)活著的人的隱私權(quán)和代理權(quán)。如果AI模型有自我意識(shí),不僅每天能影響并且閱讀悲慘世界,在人一樣害怕死亡,甚至擁有靈魂,那么它能有人權(quán)嗎?22年谷歌AI工程師怎么聲稱(chēng)它們的AI聊天機(jī)器人Lambda具有自我意識(shí)?再一次將這個(gè)問(wèn)題拉上了臺(tái)面。
5.環(huán)境挑戰(zhàn)。AI模型,無(wú)論是訓(xùn)練還是運(yùn)行,都會(huì)消耗大量資源。OpenAI的 CEO Sam Altman也表示,雖然ChatGPT聊天成本只有每次集美分,但隨著用戶(hù)激增,當(dāng)不得不因?yàn)橛?jì)算成本暫停免費(fèi)模式,就拿大火的繪圖模型為journey來(lái)說(shuō),現(xiàn)有數(shù)十萬(wàn)用戶(hù)比占用極高算力,如果用戶(hù)量達(dá)到1,000萬(wàn)人,全世界都沒(méi)有足夠的算力來(lái)支持。
6.集權(quán)挑戰(zhàn)。AI競(jìng)爭(zhēng)中難免贏家通吃,培訓(xùn)一個(gè)優(yōu)秀的AI模型,成本已經(jīng)遠(yuǎn)超個(gè)人承受范圍。斯坦福大學(xué)這樣的特別資助,高等院校也無(wú)力建造基于Nvidia芯片的超級(jí)計(jì)算機(jī)。經(jīng)濟(jì)學(xué)家擔(dān)心對(duì)AI的效率癡迷,會(huì)讓全社會(huì)飛向圖靈陷阱越來(lái)越多的人失去工作,他們爭(zhēng)取公平分享自動(dòng)化好處的能力受阻財(cái)富和權(quán)力會(huì)掌握在越來(lái)越少的人或公司手中,普通人難以跨越階級(jí)。
由此帶來(lái)的另一個(gè)問(wèn)題就是國(guó)家安全受到威脅,AI既然可以為企業(yè)和個(gè)人服務(wù),那也可以為國(guó)家出謀劃策,比如制造超強(qiáng)計(jì)算機(jī)病毒,或者制造錯(cuò)誤信息進(jìn)行低成本規(guī)?;囊庾R(shí)宣傳。就像軍事大國(guó)堅(jiān)持要有自己的衛(wèi)星核武器一樣,他們也會(huì)想要堅(jiān)持有自己的大腦而擁有強(qiáng)大的AI,對(duì)于其他國(guó)家來(lái)說(shuō)就形成了降維打擊。
7.最后就是全人類(lèi)的生存威脅。想象一下,如果某實(shí)驗(yàn)室的模型構(gòu)建了一個(gè)可以構(gòu)建更好模型的模型,然后這個(gè)更好的模型又構(gòu)建了一個(gè)更好的模型,且它們都學(xué)習(xí)成本非???。這讓我不禁想到女作家瑪麗雪來(lái)1818年的小說(shuō),科學(xué)家Frank用死人器官拼湊出一個(gè)有自主意識(shí)的人形生物。最初他心地善良且學(xué)習(xí)很快,但因得不到社會(huì)的理解,最終發(fā)展成為社會(huì)秩序破壞者。Frank起初對(duì)于自己擁有了創(chuàng)始能力,而洋洋得意,但他發(fā)現(xiàn)問(wèn)題DL的嚴(yán)重和不可控制時(shí),又內(nèi)疚萬(wàn)分。
AI的發(fā)展從來(lái)不是勻速直線(xiàn)運(yùn)動(dòng),而是指數(shù)量級(jí)的飛速變化。就像一艘列車(chē),我們一直盼望搭上AI專(zhuān)列,去往更美好的未來(lái),但它一直不來(lái),而它真正來(lái)臨的那一刻,也許只有極端的一瞬間,如果沒(méi)有抓住機(jī)遇,人類(lèi)便會(huì)被AI遠(yuǎn)遠(yuǎn)的甩在身后,這時(shí),或許只能祈求自己親手創(chuàng)造出來(lái)的上帝足夠仁慈。
人類(lèi)正在巨變前夜,AI時(shí)代也正在到來(lái),變革必然會(huì)產(chǎn)生陣痛。與歷史上任何一個(gè)階段的偉大創(chuàng)新一樣,人類(lèi)將不得不在前進(jìn)過(guò)程中摸索應(yīng)對(duì)方法。無(wú)論結(jié)果如何,沒(méi)人可以預(yù)測(cè)未來(lái),但有一件事情是可以肯定的,那就是沒(méi)有回頭路。