一位海豚訓練員用手發(fā)出“一起”的信號,然后是“創(chuàng)造”。兩只訓練有素的海豚消失在水下,交換聲音然后浮出水面,仰面翻轉(zhuǎn)并抬起尾巴。他們設計了自己的新把戲,并按照要求一前一后地表演。“這并不能證明存在語言,”拉斯金(Aza Raskin )說。“但是,如果他們能夠使用一種豐富的、象征性的交流方式,那肯定會讓這項任務變得更容易。”
拉斯金是Earth Species Project (ESP) 的聯(lián)合創(chuàng)始人兼總裁,這是一家加州非營利組織,其雄心壯志是:使用稱為機器學習的AI形式對非人類通信進行解碼,并將公開所有可用的專有技術(shù),從而加深我們與其他生物物種的聯(lián)系,以助力對它們的保護。一張1970 年的鯨魚歌曲專輯激發(fā)了導致商業(yè)捕鯨被禁止的運動。動物王國的谷歌翻譯會產(chǎn)生什么?
該組織于2017年在LinkedIn聯(lián)合創(chuàng)始人Reid Hoffman等主要捐助者的幫助下成立,去年12月發(fā)表了第一篇科學論文。目標是在我們的有生之年開啟與動物的溝通。“我們正在努力的目標是,我們能否解碼動物交流,發(fā)現(xiàn)非人類語言的奧秘,”拉斯金說。“在此過程中,同樣重要的是,我們正在開發(fā)支持生物學家和動物保護的技術(shù)。”
長期以來,了解動物的發(fā)聲一直是令人類著迷并展開探究的主題。各種靈長類動物發(fā)出的警報聲因捕食者而異;海豚用標志性的口哨呼朋引伴;一些鳴禽可以從它們的叫聲中提取元素并重新排列它們以傳達不同的信息。但大多數(shù)專家都沒有將其稱為一種語言,因為沒有動物交流符合所有標準。
直到最近,解碼主要依賴于艱苦的觀察。但是,人們對應用機器學習來處理現(xiàn)在可以由現(xiàn)代動物交流傳感器收集的大量數(shù)據(jù)產(chǎn)生了濃厚的興趣。“人們開始使用它,”哥本哈根大學研究哺乳動物和鳥類聲音交流的副教授 Elodie Briefer 說。“但我們還不知道我們能做多少。”
Briefer 與他人共同開發(fā)了一種算法,可以分析豬的咕嚕聲,以判斷動物是否正在經(jīng)歷積極或消極的情緒。另一個名為 DeepSqueak 的方法是根據(jù)嚙齒動物的超聲波呼叫判斷嚙齒動物是否處于壓力狀態(tài)。另一個倡議——CETI 項目(代表鯨類翻譯倡議)——計劃使用機器學習來翻譯抹香鯨的交流。
今年早些時候,Elodie Briefer 及其同事發(fā)表了一項基于豬的發(fā)聲情緒的研究。在各種場景中從 411 頭豬身上收集了 7,414 種聲音。
然而 ESP 表示,它的方法不同,因為它不是專注于解碼一個物種的交流,而是所有這些。雖然拉斯金承認,社會動物(例如靈長類動物、鯨魚和海豚)之間進行豐富的象征性交流的可能性更高,但目標是開發(fā)可應用于整個動物王國的工具。“我們是物種不可知論者,”拉斯金說。“我們開發(fā)的工具……以便在所有生物學中發(fā)揮作用,從蠕蟲到鯨魚。”
Raskin 說,他對 ESP 的“激發(fā)直覺”的工作表明,機器學習可用于在不同的、有時是遙遠的人類語言之間進行翻譯——而不需要任何先驗知識。
這個過程始于開發(fā)一種在物理相空間中表示單詞的算法。在這種多維幾何表示中,點(詞)之間的距離和方向描述了它們?nèi)绾斡幸饬x地相互關(guān)聯(lián)(它們的語義關(guān)系)。例如,“國王”與“男人”的關(guān)系和“女人”與“女王”的距離和方向相同。(映射不是通過知道單詞的含義來完成的,而是通過查看它們彼此靠近的頻率。)
后來注意到,這些“形狀”對于不同的語言是相似的。然后,在 2017 年,兩組獨立工作的研究人員發(fā)現(xiàn)了一種技術(shù),可以通過對齊形狀來實現(xiàn)平移。要從英語到烏爾都語,請對齊它們的形狀并找到最接近英語單詞點的烏爾都語詞點。“這樣一來你可以很好地翻譯大多數(shù)單詞,”拉斯金說。
ESP 的愿望是創(chuàng)造這種動物交流的表現(xiàn)形式——同時在單個物種和許多物種上工作——然后探索諸如是否與普遍的人類交流“形狀”重疊等問題。Raskin 說,我們不知道動物是如何體驗這個世界的,但也有一些情緒,例如悲傷和喜悅,似乎有些動物會與我們分享,并且很可能會與它們物種中的伙伴交流。“我不知道哪個更令人難以置信——形狀重疊的部分,我們可以直接交流或翻譯,還是那些我們不能與其的部分。”
?海豚使用咔噠聲、口哨聲和其他聲音進行交流。但他們在說什么?
他補充說,動物不僅僅通過聲音交流。例如,蜜蜂通過“搖擺舞”讓其他人知道一朵花的位置。也需要跨不同的溝通模式進行翻譯。
目標是“就像去月球一樣”,拉斯金承認,但這個想法也不是一下子就能達到。相反,ESP 的路線圖涉及解決一系列小問題,以實現(xiàn)更大的圖景。這應該會看到通用工具的發(fā)展,這些工具可以幫助研究人員嘗試應用AI來解開所研究物種的秘密。
例如,ESP 最近發(fā)表了一篇關(guān)于動物交流中所謂的“雞尾酒會問題”的論文(并分享了其代碼),其中很難辨別一組相同動物中的哪個個體在嘈雜的社會環(huán)境中發(fā)聲.
“據(jù)我們所知,以前沒有人做過這種端到端的[動物聲音]解纏,”拉斯金說。ESP 開發(fā)的基于 AI 的模型在海豚標志性口哨、獼猴咕咕聲和蝙蝠發(fā)聲上進行了試驗,當呼叫來自模型訓練過的個體時效果最佳;但是對于更大的數(shù)據(jù)集,它能夠解開來自不在訓練隊列中的動物的混合呼叫。
另一個項目涉及使用AI產(chǎn)生新的動物叫聲,以座頭鯨作為測試物種。新穎的呼叫——通過將發(fā)聲分成微音素(持續(xù)百分之一秒的不同聲音單位)并使用語言模型“說出”類似鯨魚的東西——然后可以回放給動物看它們是如何回應。Raskin 解釋說,如果 AI 能夠識別出隨機變化與語義上有意義的變化的原因,它會讓我們更接近有意義的交流。“它將讓AI說這種語言,盡管我們還不知道它的含義。”
夏威夷烏鴉以使用工具而聞名,但也被認為有一套特別復雜的發(fā)聲。
另一個項目旨在開發(fā)一種算法,該算法通過應用自我監(jiān)督機器學習來確定一個物種有多少種呼叫類型,這不需要人類專家對數(shù)據(jù)進行任何標記來學習模式。在一個早期的測試案例中,它將挖掘由圣安德魯斯大學生物學教授 Christian Rutz 領導的團隊制作的錄音,以制作夏威夷烏鴉的聲音曲目清單——Rutz 發(fā)現(xiàn)了夏威夷烏鴉的聲音曲目,具有制造和使用覓食工具的能力,并且被認為具有比其他烏鴉物種更復雜的發(fā)聲集。
Rutz 對該項目的動物保護價值感到特別興奮。夏威夷烏鴉極度瀕臨滅絕,只存在于圈養(yǎng)環(huán)境中,在那里它被繁殖以重新引入野外。希望通過記錄不同時間的記錄,可以追蹤該物種的召喚曲目是否在圈養(yǎng)中受到侵蝕——例如,特定的警報呼叫可能已經(jīng)丟失——這可能對其重新引入產(chǎn)生影響;這種損失可以通過干預來解決。Rutz 說:“這可能會在我們幫助這些鳥類從危機中恢復過來的能力上產(chǎn)生一個進步,”他補充說,手動檢測和分類呼叫將是勞動密集型的,而且容易出錯。
與此同時,另一個項目試圖自動理解發(fā)聲的功能意義。加州大學圣克魯茲分校海洋科學教授 Ari Friedlaender 的實驗室正在研究它。該實驗室研究難以直接觀察的野生海洋哺乳動物如何在水下活動,并運行世界上最大的標記程序之一。附著在動物身上的小型電子“生物記錄”設備可以捕捉它們的位置、運動類型,甚至它們所看到的(這些設備可以包含攝像機)。該實驗室還擁有來自海洋中戰(zhàn)略性放置的錄音機的數(shù)據(jù)。
ESP 旨在首先將自我監(jiān)督機器學習應用于標簽數(shù)據(jù),以自動衡量動物正在做什么(例如它是否在進食、休息、旅行或社交),然后添加音頻數(shù)據(jù)以查看是否可以賦予功能意義與該行為相關(guān)的呼叫。(然后可以使用回放實驗來驗證任何發(fā)現(xiàn),以及之前已經(jīng)解碼的調(diào)用。)這項技術(shù)最初將應用于座頭鯨數(shù)據(jù)——實驗室已經(jīng)在同一組中標記了幾只動物,因此可以看到如何發(fā)出和接收信號。弗里德蘭德說,就目前可用的工具可以從數(shù)據(jù)中梳理出的內(nèi)容而言,他“達到了上限”。“我們希望 ESP 可以做的工作將提供新的見解,”他說。
?但并不是每個人都對AI實現(xiàn)如此宏偉目標的力量如此狂熱。Robert Seyfarth 是賓夕法尼亞大學心理學名譽教授,他在靈長類動物的自然棲息地中研究社會行為和聲音交流已有 40 多年。雖然他認為機器學習可以解決一些問題,例如識別動物的聲音曲目,但還有其他領域,包括發(fā)現(xiàn)發(fā)聲的意義和功能,他懷疑這會帶來很多問題。
他解釋說,問題在于,雖然許多動物可以擁有復雜的社會,但它們的聲音庫比人類要少得多。結(jié)果是,完全相同的聲音可以用于在不同的上下文中表示不同的事物,而這只能通過研究上下文——個人的呼喚是誰,他們與其他人的關(guān)系如何,他們在層次結(jié)構(gòu)中的位置,他們與誰互動——其意義才有希望被確立。“我只是認為這些AI方法是不夠的,”Seyfarth 說。“你必須出去看看動物。”
動物交流地圖需要包含非聲音現(xiàn)象,例如蜜蜂的“搖擺舞”。
對于這個概念本身——動物交流的形式將以有意義的方式與人類交流“形狀”重疊——也存在疑問。Seyfarth 說,將基于計算機的分析應用于我們非常熟悉的人類語言是一回事。但對其他物種這樣做可能“完全不同”。“這是一個令人興奮的想法,但它是一個很大的延伸,”華盛頓大學的神經(jīng)科學家 Kevin Coffey 說,他共同創(chuàng)建了 DeepSqueak 算法。
拉斯金承認,單靠AI可能不足以解鎖與其他物種的交流。但他提到的研究表明,許多物種的交流方式“比人類想象的更復雜”。絆腳石是我們收集足夠數(shù)據(jù)并進行大規(guī)模分析的能力,以及我們自己有限的認知。“這些是讓我們摘下人類眼鏡并了解整個物種交流系統(tǒng)的工具,”他說。