能夠準(zhǔn)確識(shí)別動(dòng)物的技術(shù)將幫助主人與丟失的寵物團(tuán)聚,農(nóng)民監(jiān)控飼養(yǎng)的牲畜,研究人員研究野生動(dòng)物?;谝陨系膽?yīng)用場(chǎng)景,微芯片是最流行的寵物識(shí)別方法。然則,植入芯片需要進(jìn)行侵入性手術(shù),同時(shí)需要專門的設(shè)備讀取芯片,還要防范小偷提取微芯片的風(fēng)險(xiǎn)。還有一種方法就是DNA分析,它雖說很精確,但也非常昂貴和耗時(shí)。今天要給大家介紹的是通過臉部識(shí)別的方式來識(shí)別動(dòng)物。
1.使用計(jì)算機(jī)視覺軟件進(jìn)行寵物臉部識(shí)別
由計(jì)算機(jī)視覺解決方案進(jìn)行寵物的臉部識(shí)別可以作為上述方案的替代品??v然它存在缺點(diǎn),但該技術(shù)可以在特定情況下展示出高度的準(zhǔn)確性。
那么,寵物人臉識(shí)別是如何運(yùn)作的呢?妨礙技術(shù)進(jìn)步的挑戰(zhàn)是什么?寵物人臉識(shí)別如何工作?
一般來說,寵物臉部識(shí)別解決方案主要分為三個(gè)步驟:
(1)圖像捕捉:動(dòng)物的照片由高分辨率相機(jī)拍攝。一些算法只適用于預(yù)定義的姿勢(shì),因此有必要選擇符合這些標(biāo)準(zhǔn)的圖像。
(2)特征提?。涸u(píng)估動(dòng)物的生物特征數(shù)據(jù)的適用性,并在需要時(shí)進(jìn)行預(yù)處理。然后算法提取識(shí)別所需的特征集。
(3)特征匹配:提取的特征以數(shù)學(xué)方式表示并與其他圖像匹配。比如,如果我們?cè)趤G失的寵物數(shù)據(jù)庫中尋找一只狗,我們會(huì)將狗的獨(dú)特特征與該數(shù)據(jù)庫中的所有動(dòng)物進(jìn)行匹配。
有幾種方法可以執(zhí)行匹配。一種方法是使用KNN和DBSCAN等算法進(jìn)行聚類,這將產(chǎn)生一組與我們的目標(biāo)圖像高度接近的圖像,用戶可以手動(dòng)選擇最合適的圖像。
另外,可以部署概率方法以將最終結(jié)果表示為置信水平。比如,識(shí)別目標(biāo)是貓,同時(shí)算法確定捕獲的圖像是貓,其置信度為90%;如果確定是狗,其置信度為10%。
寵物的臉部識(shí)別
2.寵物臉部識(shí)別示例
以下是如何在現(xiàn)實(shí)生活中使用寵物臉部識(shí)別的示例。其中一些系統(tǒng)是成功的、流行的,甚至是商業(yè)解決方案,還有一些是檢驗(yàn)假設(shè)的學(xué)術(shù)嘗試。
尋找丟失的動(dòng)物?
失去他們的寵物對(duì)主人來說是令人心碎的。根據(jù)統(tǒng)計(jì)數(shù)據(jù),此類事件比人們想象的要普遍。在美國,三分之一家庭飼養(yǎng)的所有寵物(狗/貓)一旦失蹤,有80% 都再也沒有找到。有幾個(gè)寵物臉部識(shí)別的計(jì)劃可以幫助主人找到他們失去的朋友。
ForPaws
ForPaws是一款A(yù)PP產(chǎn)品,它通過寵物識(shí)別的方式根據(jù)狗的鼻尖、膚色和毛皮類型來識(shí)別它們。主人必須上傳至少三張照片才能創(chuàng)建寵物的個(gè)人資料。目前,該解決方案可以識(shí)別130個(gè)犬種,準(zhǔn)確率達(dá)到90%。
PIP
這家寵物識(shí)別公司開發(fā)了一款應(yīng)用程序,允許寵物主人注冊(cè)和上傳動(dòng)物的照片。該系統(tǒng)分析寵物的面部特征。如果主人可以提供額外的信息,比如性別、大小和重量,PiP聲稱它將能夠識(shí)別每只丟失的貓和狗。
任何發(fā)現(xiàn)丟失寵物的人都可以使用該應(yīng)用程序?qū)ふ覍櫸锏闹魅?。PiP的解決方案還不斷掃描社交媒體上的動(dòng)物帖子,并向相關(guān)社區(qū)的居民發(fā)送丟失的寵物警報(bào)。
Love Lost
Petco的Love Lost是一個(gè)面向?qū)櫸镏魅撕蛣?dòng)物收容所的應(yīng)用程序。使用者可以創(chuàng)建動(dòng)物檔案,以便當(dāng)寵物失蹤時(shí),軟件可以開始將寵物的生物特征信息與收容所的新來者以及其他候選動(dòng)物進(jìn)行匹配。
識(shí)別特定的寵物?
訓(xùn)練算法可以用來識(shí)別一只特定的寵物。比如,寵物主人可以在準(zhǔn)確識(shí)別寵物的前提下進(jìn)行后續(xù)操作,譬如發(fā)送警報(bào)或打開門讓寵物進(jìn)入。
Aakaitz Garro前端工程師開發(fā)了寵物面部解決方案?
WeTransfer的前端工程師Arkaitz Garro開發(fā)了一種寵物臉部識(shí)別解決方案,該解決方案可以識(shí)別鄰居的貓,當(dāng)這個(gè)小家伙出現(xiàn)在門口時(shí)向Garro(也可以是指定的人) 發(fā)送警報(bào)。為了捕捉貓的照片,Garro使用了小型相機(jī)和帶有運(yùn)動(dòng)檢測(cè)軟件的Raspberry Pi。當(dāng)動(dòng)物接近相機(jī)時(shí),系統(tǒng)會(huì)拍攝照片并將其發(fā)送到AWS Recognition平臺(tái),該平臺(tái)將其與Garro上傳的這只貓的其他圖像進(jìn)行比較。如果匹配成功,工程師會(huì)收到通知。
微軟用于寵物識(shí)別的物聯(lián)網(wǎng)設(shè)備
同樣,微軟開發(fā)了一種物聯(lián)網(wǎng)設(shè)備,用戶可以將其安裝在家里寵物進(jìn)門的地方。當(dāng)識(shí)別到寵物后,設(shè)備會(huì)解鎖讓動(dòng)物進(jìn)門。
協(xié)助科學(xué)研究——海豚的臉部識(shí)別
除了識(shí)別家庭寵物外,臉部識(shí)別算法還可用于檢測(cè)其他物種。《海洋哺乳動(dòng)物科學(xué)雜志》上發(fā)表了一項(xiàng)研究,調(diào)查了識(shí)別海豚所需的一組特征。研究人員在12年內(nèi)追蹤和拍攝150只寬吻(bottlenose)海豚。該團(tuán)隊(duì)在海豚的生命周期中對(duì)其面部和背鰭進(jìn)行識(shí)別,并且評(píng)估這種方法的可行性。
使用這150名受試者,它歸結(jié)為只有31只具有全面輪廓(即面部左右兩側(cè)和背鰭的清晰照片)的海豚。這項(xiàng)研究依靠人類專家意見和統(tǒng)計(jì)方法來檢測(cè)同一海豚的不同圖像之間的相似性。
該實(shí)驗(yàn)的結(jié)果表明,海豚的面部特征伴隨時(shí)間的推移保持一致,可用于識(shí)別目的。這種技術(shù)可以識(shí)別成年后的小海豚,方便追蹤海豚成長(zhǎng)的過程,這極大地促進(jìn)了海豚研究。
同一只海豚在不同階段的特征
幫助農(nóng)民監(jiān)控牲畜?
識(shí)別農(nóng)場(chǎng)動(dòng)物是具有挑戰(zhàn)性的。北京優(yōu)瑞科技創(chuàng)始人趙金石,他多年從事農(nóng)業(yè)領(lǐng)域的軟件開發(fā),對(duì)于識(shí)別農(nóng)場(chǎng)動(dòng)物他有自己的看法:“對(duì)于豬來說,識(shí)別起來會(huì)比較困難。因?yàn)樨i看起來都一樣,但奶牛會(huì)相對(duì)容易一些。因?yàn)樗鼈冇忻黠@的特別,它們身上的花紋是黑白的,形狀不同。”
奶牛和他們的“互動(dòng)”
然則,當(dāng)涉及到奶牛識(shí)別時(shí),挑戰(zhàn)出現(xiàn)了——即確定安裝攝像頭的位置。奶牛是好奇心比較重的動(dòng)物,即使是最輕微的環(huán)境變化也會(huì)引起它們的注意。當(dāng)發(fā)現(xiàn)攝像頭時(shí),它們會(huì)通過舔舐的方式與之“互動(dòng)”。但拋開挑戰(zhàn)不談,建立可以識(shí)別個(gè)體奶牛的系統(tǒng)將極大地幫助飼養(yǎng)者。該解決方案可以將動(dòng)物的健康狀況、飲水、進(jìn)食模式與動(dòng)物的身份相匹配。借助AI,能夠檢測(cè)動(dòng)物的疾病跡象和異常行為,在緊急情況下通知飼養(yǎng)者。
3.臉部識(shí)別的挑戰(zhàn)
如果要實(shí)施寵物臉部識(shí)別解決方案需要主要考慮三個(gè)挑戰(zhàn):
確定最優(yōu)特征集
科學(xué)家們已經(jīng)指定了可用于人臉識(shí)別的特征向量。然則,同樣的方法不適用于寵物,因?yàn)槲覀儾恢佬枰褂媚男┕δ芤约叭绾谓忉屗鼈儭1热?,在與人打交道時(shí),科學(xué)家可以使用變分自動(dòng)編碼器 (VAE) 架構(gòu)從人臉中提取特征。在這種方法中,人的照片被壓縮為包含所需特征的向量,比如膚色和面部表情。但在寵物臉部識(shí)別方面,目前還沒有可靠的特征向量。
可靠的特征向量
解決可靠的特征向量將顯著推動(dòng)該領(lǐng)域的發(fā)展。開源示例DogFaceNet是一種基于深度學(xué)習(xí)對(duì)狗進(jìn)行識(shí)別的實(shí)現(xiàn)。它使用狗的眼睛和鼻子作為特征集。如果總體目標(biāo)是區(qū)分犬種,則此解決方案效果相當(dāng)好,但在區(qū)分雙胞胎動(dòng)物時(shí)其性能相當(dāng)差。
動(dòng)物姿勢(shì)?
另一個(gè)例子是使用局部二值模式直方圖 (LBPH) 算法,該算法將圖像轉(zhuǎn)換為像素,并通過比較不同圖像的像素值來進(jìn)行操作。這種方法取決于動(dòng)物的姿勢(shì),這使得它對(duì)姿勢(shì)變化很敏感。值得一提的是,這種方法已經(jīng)過時(shí)了。目前,工程師更傾向于使用更多的高級(jí)功能。
讓動(dòng)物對(duì)著鏡頭擺姿勢(shì)
對(duì)于人類來說,很容易采取特定的姿勢(shì)并靜坐不動(dòng)。然則,當(dāng)我們?cè)噲D讓貓或狗以特定姿勢(shì)拍照就不那么容易了。這需要應(yīng)用到“姿勢(shì)敏感”的臉部識(shí)別算法,比如依賴于像素相似度的算法。
提供全面的訓(xùn)練數(shù)據(jù)集
為了使訓(xùn)練有效,數(shù)據(jù)必須多樣化并涵蓋算法預(yù)期執(zhí)行的所有任務(wù)。比如,如果算法識(shí)別不同的狗品種,那么數(shù)據(jù)集應(yīng)該包含不同角度捕獲并正確標(biāo)記的信息源。這里會(huì)出現(xiàn)多種狀況,比如:有人可能會(huì)提交混合品種的圖像,有人可能會(huì)錯(cuò)誤地標(biāo)記圖像并分配錯(cuò)誤的品種名稱。為了避免此類問題,專家必須一張一張地審查數(shù)據(jù)集中的所有照片,以驗(yàn)證圖像的合法性和標(biāo)簽的準(zhǔn)確性。
4.結(jié)論
寵物人臉識(shí)別領(lǐng)域的進(jìn)展受到以下事實(shí)的妨礙:研究人員仍然無法指出可用于大規(guī)模準(zhǔn)確識(shí)別動(dòng)物的最佳特征組合??v然如此,還是有一些成功的應(yīng)用程序基于受限數(shù)據(jù)工作,比如識(shí)別特定的動(dòng)物或一小群家養(yǎng)/野生動(dòng)物。如果您正在構(gòu)建自己的寵物臉部識(shí)別系統(tǒng),請(qǐng)記住動(dòng)物是生物識(shí)別技術(shù)的非合作用戶。有些會(huì)堅(jiān)持舔相機(jī),有些會(huì)拒絕為照片擺姿勢(shì)。為了消除不必要的麻煩,可以設(shè)計(jì)姿勢(shì)和表情中立的算法。另一個(gè)需要考慮的問題是隱私法規(guī)。如果你想構(gòu)建一個(gè)尋找丟失寵物的應(yīng)用程序,是否需要主人顯示他們的位置?即使是主人家中寵物的照片,也可能暴露與主人相關(guān)的隱私信息。