什么知識(shí)讓我們變得聰明?我們用來理解世界、解釋新體驗(yàn)和做出深思熟慮的選擇的認(rèn)知結(jié)構(gòu)是什么?定義一個(gè)闡明給人類或AI更深入理解和更高認(rèn)知的知識(shí)的框架,將有助于我們對(duì)此話題進(jìn)行結(jié)構(gòu)化的討論。
近日,英特爾實(shí)驗(yàn)室副總裁兼緊急AI研究主任Gadi Singer介紹了這種賦予AI更高認(rèn)知的知識(shí)構(gòu)建的數(shù)個(gè)維度,并指出一條通往更高智能機(jī)器的道路。
圖為英特爾實(shí)驗(yàn)室副總裁Gadi Singer
更高層次的機(jī)器智能的核心,可能是讓知識(shí)構(gòu)建幫助AI系統(tǒng)組織自己的世界觀,賦予AI理解意義、事件和任務(wù)的能力。如此一來,機(jī)器認(rèn)知將從數(shù)據(jù)擴(kuò)展到知識(shí)結(jié)構(gòu),包括描述性知識(shí)、世界動(dòng)態(tài)模型和起源等維度。
在學(xué)習(xí)語言時(shí),我們要區(qū)分形式和意義:形式指的是用來表達(dá)意義的符號(hào),也就是表面的表達(dá)。每種形式在特定的語境中都有特定的含義,而形式在不同的語境中可以有不同的含義。
正如Bengio和Schölkopf等人在“Towards Causal Representation Learning”一文中總結(jié)的那樣:“目前機(jī)器學(xué)習(xí)的大多數(shù)成功都是源于對(duì)適當(dāng)收集的獨(dú)立和相同分布(i.i.d)數(shù)據(jù)的大規(guī)模模式識(shí)別。”系統(tǒng)吸收可觀察到的元素,如文本字符、聲音信號(hào)和圖像像素,并建立模式和隨機(jī)相關(guān)性,同時(shí)在基于識(shí)別的任務(wù)中產(chǎn)生出色的結(jié)果。
越來越多的人認(rèn)為,算法必須超越表面相關(guān)性,達(dá)到真正理解的水平,從而實(shí)現(xiàn)更高水平的機(jī)器智能。這種徹底的轉(zhuǎn)變將使所謂的System 2、3rdWave或廣義/靈活的 AI 成為可能。正如Gadi Singer在核心博客“認(rèn)知AI的崛起”中所說的那樣,更高水平的機(jī)器智能需要深層次的知識(shí)構(gòu)建,這種知識(shí)構(gòu)建可以將AI從表面相關(guān)性轉(zhuǎn)化為真正理解這個(gè)世界。
美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)的 John Launchbury 指出,在第三次AI浪潮中,抽象(比如創(chuàng)造新的意義)和推理(規(guī)劃和決策)將掀起一場(chǎng)新革命。第三次浪潮本身的特點(diǎn)是語境適應(yīng),即系統(tǒng)為現(xiàn)實(shí)世界的各種現(xiàn)象構(gòu)建語境解釋模型。
知識(shí)維度中有兩個(gè)維度反映了對(duì)世界的看法,一個(gè)是描述性維度,描述性維度對(duì)世界上存在的事物進(jìn)行了概念性的抽象,另一個(gè)是現(xiàn)實(shí)世界及其現(xiàn)象的動(dòng)態(tài)模型。
此外,故事提升了人類在共同信仰和神話基礎(chǔ)上的理解和交流復(fù)雜故事的能力。語境和來源歸因以及價(jià)值和優(yōu)先級(jí)是元知識(shí)維度,這些維度帶來了基于條件的有效性和知識(shí)的不斷疊加。最后,概念參考是結(jié)構(gòu)基礎(chǔ),跨維度、模態(tài)和參考而存在。
這六個(gè)知識(shí)維度結(jié)合在一起,可以讓AI不僅僅停留在事件相關(guān)性上,而是獲得更深入的理解,因?yàn)檫@六個(gè)知識(shí)維度的潛在概念是持續(xù)的,可以解釋和預(yù)測(cè)過去和未來的事件,甚至允許計(jì)劃和干預(yù),并考慮反事實(shí)的現(xiàn)實(shí)——因此文中使用了“深度知識(shí)(deep knowledge)”一詞。
闡明和描述機(jī)器智能所需的知識(shí)構(gòu)建類型,有助于確定實(shí)現(xiàn)這種知識(shí)構(gòu)建的最佳方式,從而實(shí)現(xiàn)更高水平的機(jī)器智能。
1 支持更高水平智能的六大知識(shí)維度
對(duì)于AI系統(tǒng)來說,實(shí)施人類理解和交流中觀察到的知識(shí)構(gòu)建可以為智能提供實(shí)質(zhì)性的價(jià)值。當(dāng)所有的知識(shí)類型都得到支持和組合時(shí),實(shí)際價(jià)值會(huì)大幅增長(zhǎng)。
圖注:支持更高水平智能的知識(shí)維度。圖源:Gadi Singer/英特爾實(shí)驗(yàn)室
(1)描述性知識(shí):層次、分類和屬性繼承
描述性知識(shí)(即概念性的、命題性的或陳述性的知識(shí))描述事物、事件、事物/事件的屬性以及其之間的關(guān)系。假設(shè)使用(適當(dāng)?shù)模╊惢蚋拍畹姆謱樱疃让枋鲂灾R(shí)就能擴(kuò)展其原本的定義。這類知識(shí)可以包括事實(shí)和記錄系統(tǒng)。與特定用例和環(huán)境相關(guān)的事實(shí)和信息可以作為層次知識(shí)進(jìn)行組織、利用和更新。
單個(gè)AI系統(tǒng)中使用的基礎(chǔ)本體(ontology)可以使用來自策劃系統(tǒng)的與任務(wù)相關(guān)的類和實(shí)體(例如,OpenCyc本體或AMR命名的實(shí)體類型)進(jìn)行播種。這種基礎(chǔ)本體應(yīng)該是可以通過神經(jīng)網(wǎng)絡(luò)/機(jī)器學(xué)習(xí)技術(shù)進(jìn)行擴(kuò)展——也就是說,獲取新知識(shí)就會(huì)得到新的實(shí)體,關(guān)系和類。
(2)世界模型
世界上的現(xiàn)象模型讓AI系統(tǒng)能夠理解情況、解釋輸入/事件以及預(yù)測(cè)潛在的未來結(jié)果并采取行動(dòng)?,F(xiàn)象模型是抽象/概括,可以分為正式模型和近似(非正式)真實(shí)世界模型;現(xiàn)象模型允許在特定情況下對(duì)實(shí)例使用變量和應(yīng)用程序,并允許對(duì)特定實(shí)例或更通用的類進(jìn)行符號(hào)操作。
正式模型的例子包括邏輯、數(shù)學(xué)/代數(shù)和物理。與正式模型相比,現(xiàn)實(shí)世界的模型通常是經(jīng)驗(yàn)的、實(shí)驗(yàn)性的、有時(shí)甚至顯得有些混亂?,F(xiàn)實(shí)世界的模型包括物理模型、心理模型和社會(huì)學(xué)模型。程序模型(“專有知識(shí)”)包括在這個(gè)類中。
因果模型可以幫助AI系統(tǒng)發(fā)展更上一層樓。在語境發(fā)生變化的情況下,如果與因果關(guān)系等知識(shí)模型相結(jié)合,并理解了控制原因的語境和考慮反事實(shí)的能力,那么過去的統(tǒng)計(jì)數(shù)據(jù)就可以有效地應(yīng)用于現(xiàn)在從而預(yù)測(cè)未來。這些模型有助于從條件和可能因素的角度理解情況或事件。因果推理是人類思想不可或缺的組成部分,通過這種方式可以實(shí)現(xiàn)人類智慧級(jí)別的機(jī)器智能。
(3)故事和腳本
正如歷史學(xué)家尤瓦爾·哈拉瑞所說,故事構(gòu)成了個(gè)人和社會(huì)的文化和世界觀的關(guān)鍵部分。故事的概念對(duì)于充分理解和解釋人類的行為和交流是必要的。故事是復(fù)雜的,在一個(gè)連貫的敘述中可能包含多個(gè)事件和各種信息。故事不僅僅是事實(shí)和事件的集合,故事還包含了重要的信息,這些信息有助于發(fā)展對(duì)所呈現(xiàn)數(shù)據(jù)之外的理解和概括。與世界模型不同的是,故事可以被視為具有歷史意義、參考意義或精神意義。故事可以代表價(jià)值觀和經(jīng)歷,這些價(jià)值觀和經(jīng)歷會(huì)影響人們的信仰和行為。例子包括宗教或民族故事、神話,以及在任何層次的人群中分享的故事。
(4)語境和來源歸因
語境的定義是圍繞著某個(gè)事件并為其自圓其說提供資源的框架。語境可以看作是一種覆蓋的知識(shí)結(jié)構(gòu),調(diào)節(jié)著它所包含的知識(shí)。語境可以是持久的,也可以是短暫的。
持久的語境可以是長(zhǎng)期的(比如從西方哲學(xué)角度或東方哲學(xué)角度獲取的知識(shí)),也可以隨著時(shí)間的推移、根據(jù)新的學(xué)習(xí)材料而改變。持久語境不會(huì)對(duì)每個(gè)任務(wù)進(jìn)行更改。
當(dāng)特定的本地語境很重要時(shí),瞬態(tài)語境是相關(guān)的。單詞是根據(jù)其周圍句子或段落的局部語境來解釋的。圖像中感興趣的區(qū)域通常在整個(gè)圖像或視頻的語境中得到解釋。
持久語境和瞬態(tài)語境的結(jié)合可以為解釋和操作知識(shí)提供完整的設(shè)置。
知識(shí)的另一個(gè)相關(guān)方面是數(shù)據(jù)來源(又名數(shù)據(jù)追溯),其包括數(shù)據(jù)來源、在數(shù)據(jù)傳播的過程中發(fā)生了什么以及隨著時(shí)間的推移數(shù)據(jù)將去往何方。AI系統(tǒng)不能假設(shè)所接收的所有信息都是正確或可信的,尤其是在被稱為“后真相時(shí)代”的情況下信息更不可輕易相信。將信息與其來源相關(guān)聯(lián)可能是建立可信性、可認(rèn)證性和可追溯性所必需的。
(5)價(jià)值和優(yōu)先級(jí)(包括善/威脅和倫理)
知識(shí)的所有方面(例如,對(duì)象、概念或程序)在整個(gè)判斷范圍內(nèi)都有相對(duì)應(yīng)的價(jià)值——從最大的善到最大的惡都有對(duì)應(yīng)。可以假設(shè),人類智力的進(jìn)化包括追求回報(bào)和避免風(fēng)險(xiǎn)(比如,追求吃午餐;避免被當(dāng)成午餐)。這種風(fēng)險(xiǎn)/回報(bào)的關(guān)聯(lián)與知識(shí)緊密相連。潛在的得失具有功利價(jià)值;對(duì)于實(shí)體或潛在的未來狀態(tài),還有一種基于倫理的價(jià)值。這種基于倫理的價(jià)值反映了一種道德價(jià)值觀,即“善”不是基于潛在的有形回報(bào)或威脅,而是基于對(duì)什么是正確的潛在信念。
價(jià)值和優(yōu)先級(jí)是元知識(shí)(meta-knowledge),其反映了AI系統(tǒng)對(duì)知識(shí)、行動(dòng)和結(jié)果相關(guān)方面的主觀斷定。這為問責(zé)制奠定了基礎(chǔ),應(yīng)該由負(fù)責(zé)特定AI系統(tǒng)的人認(rèn)真處理。當(dāng)AI系統(tǒng)與人類互動(dòng)并做出影響人類福祉的選擇時(shí),潛在的價(jià)值和優(yōu)先級(jí)系統(tǒng)很重要。
6. 概念參考:消除歧義,統(tǒng)一和跨模態(tài)
知識(shí)是以概念為基礎(chǔ)的。例如,“狗”是一個(gè)抽象概念——一個(gè)有多個(gè)名稱(在各種語言中狗的說法都不一樣)、一些視覺特征、聲音聯(lián)想等等的概念。然而不管其表現(xiàn)形式和用法如何,“狗”這個(gè)概念都是獨(dú)一無二的。“狗”的概念被映射到英語單詞“dog”,以及法語單詞“chien”。“狗”的視覺特征可能如下圖:
同時(shí)“狗”也和汪汪吠叫聲對(duì)應(yīng)了起來。
概念引用(Concept Reference,簡(jiǎn)稱ConceptRef)是與給定概念相關(guān)的所有事物的標(biāo)識(shí)符和引用集。概念引用本身實(shí)際上不包含任何知識(shí)——知識(shí)駐留在前面介紹的維度中。概念引用是多維知識(shí)庫(KB)的關(guān)鍵,因?yàn)楦拍钜萌诤狭烁拍畹乃斜硐蟆?/p>
Wikidata就是集中存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)的多維知識(shí)庫的一個(gè)很好的例子。在Wikidata中,項(xiàng)(items)代表人類知識(shí)中的所有事物,包括主題、概念和對(duì)象。Wikidata的條目與這個(gè)框架中ConceptRef的定義相似——只有一個(gè)關(guān)鍵的區(qū)別:在Wikidata中,術(shù)語“項(xiàng)”既指給定的標(biāo)識(shí)符,也指有關(guān)標(biāo)識(shí)符的信息;而ConceptRefs 只是帶有指向KB指針的標(biāo)識(shí)符。關(guān)于概念的信息則被填充在前面章節(jié)中描述的各種視圖中(例如與概念相關(guān)的描述性或程序性知識(shí))。
常識(shí)
常識(shí)知識(shí)由隱性信息組成,隱性信息是指廣泛(且為大眾共享)的不成文的假設(shè),人類自動(dòng)運(yùn)用這些假設(shè)來理解世界。AI想要更深入地理解這個(gè)世界,將常識(shí)應(yīng)用到情境中是必不可少的。在這個(gè)框架中,常識(shí)知識(shí)被認(rèn)為是上述六種知識(shí)類型的子集。
2 理解與知識(shí)類型之間的關(guān)系
理解是智能的基礎(chǔ)。向更高級(jí)機(jī)器智能的發(fā)展引發(fā)了一場(chǎng)關(guān)于“理解”的討論。約書亞·本吉奧將擁有人類理解能力的AI描述為:
明白因果關(guān)系,理解世界如何運(yùn)轉(zhuǎn);
理解抽象的行為;
知道如何使用以上知識(shí)去控制、推理和計(jì)劃,即使是在新穎的場(chǎng)景中也依然擁有這種能力;
解釋發(fā)生了什么;
out-of-distribution(即OOD,分布外)生成。
而以知識(shí)為中心的對(duì)理解的定義是:用豐富的知識(shí)表示創(chuàng)建世界觀的能力;獲取和解釋新信息以增強(qiáng)這種世界觀的能力;以及對(duì)現(xiàn)有知識(shí)和新信息進(jìn)行有效推理、決定和解釋的能力。
這種理解觀點(diǎn)的先決條件是以下四種功能:
具備豐富的知識(shí);
獲取新的知識(shí);
能夠跨實(shí)體和關(guān)系連接知識(shí)實(shí)例;
對(duì)知識(shí)進(jìn)行推理。
理解不是二元屬性,而是因類型和程度而異。這一觀點(diǎn)的核心是知識(shí)的本質(zhì)及其表征——知識(shí)結(jié)構(gòu)和模型的表達(dá)能力可以促進(jìn)理解和推理能力快速發(fā)展。
想象所有的人[和機(jī)器]
正如阿爾伯特·愛因斯坦所觀察到的:“智能的真正標(biāo)志不是知識(shí),而是想象力。”要真正理解,機(jī)器智能必能超越數(shù)據(jù)、事實(shí)和故事。要重建,發(fā)現(xiàn)和創(chuàng)造一個(gè)可觀察屬性和事件背后的宇宙模型,想象力是必要的。從AI系統(tǒng)的角度來看,想象力是通過創(chuàng)造性推理實(shí)現(xiàn)的,也就是進(jìn)行歸納、演繹或溯因推理,并產(chǎn)生不受以往經(jīng)驗(yàn)和輸入輸出相關(guān)性嚴(yán)格規(guī)定的新穎結(jié)果。
知識(shí)表示和推理是AI的一個(gè)成熟領(lǐng)域,這個(gè)領(lǐng)域處理關(guān)于世界的信息表示,使計(jì)算機(jī)系統(tǒng)能夠解決復(fù)雜的任務(wù)。知識(shí)和推理不一定是截然不同的,而是代表了一個(gè)從已知到推斷的光譜。機(jī)器理解將通過構(gòu)建知識(shí)的能力輔以先進(jìn)的相關(guān)推理(例如,概率推理和似是而非推理、溯及推理、類比推理、默認(rèn)推理等)來得到實(shí)現(xiàn)。
建立在深度知識(shí)基礎(chǔ)上的神經(jīng)符號(hào)AI
在使AI更有效、更負(fù)責(zé)任和更高效地為人們提供支持的過程中,我們的目標(biāo)是使AI系統(tǒng)更強(qiáng)大,同時(shí)推動(dòng)AI達(dá)到更高的認(rèn)知和理解水平??茖W(xué)家已經(jīng)在處理數(shù)據(jù)、識(shí)別模式和尋找轉(zhuǎn)瞬即逝的相關(guān)性方面取得了巨大的進(jìn)展,但仍有必要思考哪些知識(shí)類型能賦予AI系統(tǒng)對(duì)世界建模和理解世界的能力。
當(dāng)我們對(duì)AI獲得更高層次的認(rèn)知所需要的知識(shí)結(jié)構(gòu)的類型有了更深的理解時(shí),我們就可以繼續(xù)在這個(gè)深度知識(shí)的基礎(chǔ)上進(jìn)行構(gòu)建,使機(jī)器能夠真正地理解世界。