每年,斯坦福大學(xué)以人為中心的AI研究所都會發(fā)布其AI指數(shù),這是一份試圖總結(jié)AI現(xiàn)狀的大量數(shù)據(jù)和圖表匯編。近期出爐的2022AI指數(shù)依舊讓人印象深刻,共有190頁,囊括研發(fā)、技術(shù)績效、倫理、政策、教育和經(jīng)濟(jì)。本文挑選了其中最具代表性的12個圖表。
值得注意的是,2021年的AI指數(shù)報告中的很多趨勢依然存在。比如,我們?nèi)耘f生活在一個AI的黃金時代,出版物持續(xù)增加,AI就業(yè)市場仍舊是全球性的,企業(yè)對AI風(fēng)險的認(rèn)識與減輕上述風(fēng)險的嘗試之間仍舊存在讓人不安的差距。我們不在這里重復(fù)這些要點。
下面,我們來開始今年的總結(jié)報道:
文章來源:半導(dǎo)體行業(yè)觀察
涌入AI的資金數(shù)額依舊令人難以相信。最值得注意的部份來自全球私人投資,這個數(shù)字從2020年的460億美元飆升至2021年的935億美元。增長來自于大型融資輪次的增加;2020年有四輪融資超過5億美元,2021年有15輪。報告還指出,所有這些資金都流向了更少的公司,因為自2018年以來新融資的初創(chuàng)公司數(shù)量一直在下降。這是一個偉大的時刻加入一家AI初創(chuàng)公司,但或許不是自己找到一家。
美中關(guān)系復(fù)雜
這些天來,關(guān)于中美之間的AI競賽的討論頗多。“當(dāng)你看到所有關(guān)于地緣政治緊張局勢的新聞時,你會認(rèn)為這兩個國家之間的合作數(shù)量會減少,”斯坦福大學(xué)AI研究所的政策研究員兼今年AI Index的主編Daniel Zhang說。相反,他告訴IEEE Spectrum,“過去10年,中美合作一直呈上升趨勢。”在出版物的跨國合作方面,中國和美國的產(chǎn)出是中國和英國合作的兩倍多。
申請專利和獲得專利是兩件不同的事情
中國專利申請量居世界第一;該報告指出,中國在2021年占全球?qū)@暾埩康?2%。但美國在授予的專利數(shù)量上占主導(dǎo)地位,占全球總數(shù)的40%。張指出,授予專利“證明您的專利實際上是可信和有用的”,并表示這種情況有點類似于出版物和引用的情況。雖然中國在出版物數(shù)量、出版物引用和會議出版物方面領(lǐng)先,但美國在會議出版物的引用方面仍舊領(lǐng)先,這表明美國研究人員的著名論文仍舊具有巨大的影響力。
計算機(jī)視覺的高原(Plateau)
計算機(jī)視覺領(lǐng)域發(fā)展如此迅速,很難跟上最新的消息。AI指數(shù)顯示,計算機(jī)視覺系統(tǒng)非常擅長涉及靜態(tài)圖像的任務(wù),比如對象分類和面部識別,并且它們在視頻任務(wù)(比如活動分類)方面也越來越出色。
但是一個相對較新的基準(zhǔn)顯示了計算機(jī)視覺系統(tǒng)可以做的事情的局限性:它們擅長識別事物,而不擅長推理它們所看到的。視覺常識推理挑戰(zhàn)賽于2018年推出,要求AI系統(tǒng)回答有關(guān)圖像的問題并解釋其推理。比如,一張圖片顯示人們坐在餐桌旁,而服務(wù)員端著盤子走近;測試詢問為什么其中一個坐著的人指向桌子對面的人。該報告指出,近年來性能改進(jìn)變得越來越微不足道,“這表明可能需要發(fā)明新技術(shù)來顯著提高性能。”
AI還沒有為法學(xué)院做好準(zhǔn)備
自然語言處理(NLP)領(lǐng)域比計算機(jī)視覺晚了幾年才開始蓬勃發(fā)展,但它與計算機(jī)視覺的位置有點相似(圖4)。文本摘要和基本閱讀理解等任務(wù)的基準(zhǔn)顯示出令人印象深刻的結(jié)果,AI系統(tǒng)通常超過人類的表現(xiàn)。但是當(dāng)NLP系統(tǒng)必須對他們所讀到的內(nèi)容進(jìn)行推理時,他們就會遇到麻煩。
此圖表顯示了由LSAT考試中用作法學(xué)院入學(xué)考試的邏輯推理問題組成的基準(zhǔn)測試的表現(xiàn)。雖然NLP系統(tǒng)在該基準(zhǔn)的一組較簡單的問題上表現(xiàn)良好,但在一組較難的問題上表現(xiàn)最佳的模型的準(zhǔn)確率僅為69%。研究人員從要求NLP系統(tǒng)從不完整信息中得出結(jié)論的基準(zhǔn)測試中得到了類似的結(jié)果。推理仍舊是AI的前沿。
道德無處不在
報告中有一個好消息:從參加ACM公平、問責(zé)和透明度會議(FAccT)等會議以及NeurIPS的道德相關(guān)研討會來判斷,現(xiàn)在人們對AI道德有極大的興趣。對于那些還沒有聽說過FAccT的人,報告指出,它是最早關(guān)注算法社會技術(shù)分析的主要會議之一。這張圖表顯示了FAccT的行業(yè)參與度不斷提高,張認(rèn)為這是進(jìn)一步的好消息。“這個領(lǐng)域一直由學(xué)術(shù)研究人員主導(dǎo),”他說,“但現(xiàn)在我們看到更多的私營部門參與其中。”張說,很難猜測這種參與對行業(yè)內(nèi)如何設(shè)計和部署AI系統(tǒng)意味著什么,但這是一個積極的信號。
Detox:如果你不這樣做該死,如果你這樣做該死
AI的一大倫理問題涉及大型語言模型,比如OpenAI的GPT-3,它有一個非常糟糕的習(xí)慣,即生成文本,其中充滿了從其訓(xùn)練數(shù)據(jù)(互聯(lián)網(wǎng))中學(xué)到的每一種偏見和偏見。多個研究小組(包括OpenAI本身)正在研究這個toxic-language問題,用新的基準(zhǔn)來衡量偏見和detoxification計劃。但上圖顯示了通過三種不同的detox方法運行語言模型GPT-2的結(jié)果。所有這三種方法都損害了模型在一個稱為perplexity的指標(biāo)上的性能(分?jǐn)?shù)越低越好),對涉及非裔美國人對齊的英語和提及少數(shù)群體的文本的性能影響最差。正如專家所說,需要更多的研究。
大學(xué)正在與CS學(xué)生一起爬行
AI管道從未如此充實。計算研究協(xié)會的年度調(diào)查收集了來自北美200多所大學(xué)的數(shù)據(jù),其最新數(shù)據(jù)顯示,2020年有超過31,000名本科生完成了計算機(jī)科學(xué)學(xué)位。這比2019年的數(shù)字增加了11.6%。
AI需要女性
同一項調(diào)查著眼于AI領(lǐng)域的新博士,結(jié)果令人沮喪。在過去十年中,女性新的AI和CS博士的百分比僅增加了幾個百分點,至少在北美是這樣。這一點實際上是去年對2021年報告的報道的重復(fù),但每個人都應(yīng)該繼續(xù)談?wù)撍?,直到事情發(fā)生變化。
AI需要所有種族背景的人
同上這一點。AI Index在不同的圖表上顯示AI和CS博士的數(shù)據(jù),但它們講述的是同一個故事。早在人們獲得博士學(xué)位之前,AI領(lǐng)域就需要在多樣性方面做得更好。
立法者正在關(guān)注
2021年,與AI相關(guān)的法案比以往任何時候都多。在AI Index一直關(guān)注的25個國家中,西班牙、英國和美國處于領(lǐng)先地位,去年分別通過了三項法案。報告還指出,在美國,通過的這三項法案是提出的高達(dá)130項法案之一。從報告中不清楚這些法案中的大多數(shù)是通過公共資金促進(jìn)AI還是制定法規(guī)來管理AI可能帶來的風(fēng)險。張說這是一個混合體,并表示AI研究所將在來年發(fā)布對全球立法的更詳細(xì)分析。
氣候變化
AI指數(shù)跟蹤美國55個公共政策團(tuán)體發(fā)表與AI相關(guān)的論文,這張圖表顯示了這些團(tuán)體去年關(guān)注的主題。我用這張圖表作為借口來提出AI越來越大的能源足跡(訓(xùn)練大型模型需要大量計算)以及它對氣候變化的潛在影響的話題。政策小組似乎并不認(rèn)為這些是2021年的重要話題。我還問張,AI Index是否會在明年的報告中討論這些問題,他說他的團(tuán)隊正在與各個組織討論如何衡量和收集有關(guān)計算效率和氣候影響的數(shù)據(jù)。所以請繼續(xù)關(guān)注。