機器如何識別手勢？

沃卡惠
行業(yè)資訊
2022-05-18 14:22:13
282

手勢識別是一種用戶界面，允許計算機捕捉和解釋非語言交流，包括面部表情、頭部運動、身體定位和手部動作作為命令。手勢是一種越來越普遍的計算機控制模式，用于識別手勢的傳感器類型也在不斷增加。

本文將簡要回顧了當(dāng)今手勢控制的實施方式，探討了手勢未來可能的應(yīng)用，最后對用于識別、解釋和響應(yīng)手勢的各種類型的非視頻傳感器進行了調(diào)查，包括電場感應(yīng)、激光雷達、先進的電容技術(shù)和觸覺。

最初，所有手勢識別都依賴于實時視頻源的解釋?；镜幕谝曨l的手勢識別仍然被廣泛使用。這是一個計算密集型過程，工作原理如下：

攝像頭將圖像數(shù)據(jù)與來自深度感應(yīng)設(shè)備（通常是紅外傳感器）的數(shù)據(jù)配對，輸入計算機，以捕捉三個維度的動態(tài)手勢。

手勢識別軟件將捕獲的圖像數(shù)據(jù)與手勢庫進行比較以找到匹配項。

然后，軟件將識別出的手勢與相應(yīng)的命令進行匹配。

一旦手勢被識別和解釋，計算機要么確認用戶想要的命令，要么簡單地執(zhí)行與該特定手勢相關(guān)的命令。

在復(fù)雜環(huán)境中，可以使用骨骼和面部跟蹤以及語音識別和其他輸入來增強基本視頻信息（圖1）。

圖1：基于攝像頭的手勢識別廣泛用于受益于非接觸式計算機控制的應(yīng)用。

(圖片來源:??3D Cloud by Marxent??)

汽車應(yīng)用

汽車內(nèi)飾是基于視頻的手勢識別系統(tǒng)新興用途的一個很好的例子。當(dāng)前的汽車手勢識別系統(tǒng)使駕駛員和乘客能夠控制信息娛樂系統(tǒng)或來電，而無需觸摸按鈕或屏幕。在這種環(huán)境下，手勢識別有望提高安全性，因為駕駛員可以使用簡單的手部動作代替復(fù)雜的菜單界面操作，使他們能夠更專注于駕駛車輛。

語音控制系統(tǒng)也可以使駕駛員能夠?qū)Ｗ⒂诘缆罚褂闷饋砀訌?fù)雜。大多數(shù)當(dāng)前的語音控制系統(tǒng)不使用自然語言，它們需要精確的語音命令，并且可能涉及長菜單鏈以達到所需的特定命令。由于其對用戶的簡單性，手勢識別的汽車應(yīng)用有望擴展到其他系統(tǒng)，例如加熱和冷卻、室內(nèi)照明控制、遠程信息處理系統(tǒng)，甚至與遠程智能家居系統(tǒng)的連接。系統(tǒng)結(jié)合了語音識別和手勢識別的最佳特性。

攝像頭安裝在基于攝像頭的汽車內(nèi)部手勢識別系統(tǒng)中，通常從天花板等高處獲得相關(guān)內(nèi)部空間的暢通無阻的視野。當(dāng)前系統(tǒng)只關(guān)注駕駛員。未來，隨著車內(nèi)攝像頭數(shù)量的增加和圖像質(zhì)量的提高，監(jiān)控空間的范圍有望擴大到包括乘客在內(nèi)。監(jiān)控區(qū)域由紅外LED或激光照亮，即使在低光照條件下也能提供最佳圖像質(zhì)量。如上所述，手勢是實時分析的，機器學(xué)習(xí)支持準(zhǔn)確性的不斷提高。BMW7系汽車識別的一些手勢如圖2所示。

圖2：BMW Series 7汽車中編程的手勢示例。(圖片來源:??Aptiv??)

電場手勢識別

電場接近感應(yīng)(EFPS)是基于輕微導(dǎo)電的附近物體對電場的擾動。EFPS的一個實施例是一種微電子設(shè)備，它可以檢測移動和靜止的物體，即使是非導(dǎo)電的固體材料。它通過感應(yīng)兩個天線電極產(chǎn)生的極低功率電磁場的微小變化來工作。它的可調(diào)范圍從幾厘米到4米，并且它的操作與對地阻抗無關(guān)。

EFPS和其他電場傳感器提供少量數(shù)據(jù)。與光學(xué)手勢識別系統(tǒng)相比，它們更小、重量更輕，并且需要更少的功率。在另一個實施例中，手勢感應(yīng)IC使用電極來感應(yīng)電場的變化并計算手指等物體的位置，提供三維位置數(shù)據(jù)并將運動模式實時分類為手勢（圖3）。通過使用電場感應(yīng)，該系統(tǒng)對光線、聲音和其他可能干擾其他3D手勢感應(yīng)技術(shù)操作的環(huán)境條件完全不敏感。

圖3：未失真的等電位電場線（左）與被人手指扭曲的相同等電位電場線（右）的比較。（圖片來源：??Microchip??）

這種特定的3D手勢感應(yīng)IC針對電池供電設(shè)備進行了優(yōu)化，感應(yīng)電極由低壓信號驅(qū)動，可選擇42、43、44、45和100kHz信號。由于電場傳感器可以穿透非導(dǎo)電材料，因此它們可以封裝在防風(fēng)雨外殼或建筑物的內(nèi)墻中。除了便攜式手勢感應(yīng)應(yīng)用外，EFPS系統(tǒng)目前還部署在各種感應(yīng)應(yīng)用中，包括：

可以確定被抓取物體屬性的機械手

汽車安全氣囊系統(tǒng)確定座位是否被占用

樓宇自動化系統(tǒng)可確定房間何時無人使用

使用激光雷達

光檢測和測距(LIDAR)被用于為消費和工業(yè)系統(tǒng)中的手勢識別帶來獨特的性能范圍。一個示例是基于940nm不可見光垂直腔面發(fā)射激光器(VCSEL)的LIDAR設(shè)備，該激光器具有集成驅(qū)動器和單光子雪崩二極管(SPAD)的接收陣列。該系統(tǒng)使用基于飛行時間(ToF)測量的多區(qū)域測距。它以集成6.4mmx3.0mmx1.5mm模塊的形式提供，其中包括VCSEL（垂直腔面發(fā)射激光器）發(fā)射器和帶有嵌入式SPAD和基于直方圖的ToF處理引擎的接收器（圖4）。

圖4：這個基于VCSEL的恢復(fù)識別模塊包括一個用于手勢識別的TOF處理引擎。（圖片來源：??意法半導(dǎo)體??）

這種基于LIDAR的模塊的緊湊尺寸和低功耗有望在一系列應(yīng)用中實現(xiàn)非觸摸手勢識別的集成，包括AR/AV耳機、平板電腦、手機和住宅產(chǎn)品，如廚房電器、恒溫器和其他智能家居控制，以及電梯控制、交互式標(biāo)牌和票務(wù)以及自動售貨機等設(shè)備。該傳感器可以在4×4（16區(qū)域）快速測距模式下提供高達每秒60幀的幀數(shù)。在高分辨率模式下，傳感器測量64個區(qū)域(8×8)。

縮小電容式手勢識別

基于微型碳納米管紙復(fù)合電容傳感器的電容式三維手勢傳感器已被開發(fā)用于集成游戲設(shè)備和其他消費電子產(chǎn)品。與上一代電容式手勢傳感器相比，碳納米管紙基設(shè)備的速度提高了10倍，體積縮小了100倍，并且可以在高達20厘米的更大范圍內(nèi)工作（圖5）。它們無需任何手持設(shè)備或其他設(shè)備即可識別3D手勢，并且比紅外傳感器更快、更準(zhǔn)確。此外，它們對環(huán)境因素（如膚色和照明條件）不敏感。

圖5：這種基于碳納米管紙的手勢識別設(shè)備比前幾代電容式傳感器快10倍，小100倍。（圖片來源：??Somalytics??）

相機+超聲波觸覺

專為VR/AR耳機設(shè)計的新系統(tǒng)將基于紅外攝像頭的手勢識別與觸覺反饋相結(jié)合。該系統(tǒng)使用IR LED照亮用戶的手，LED的脈沖與相機幀速率同步。相機通過每個脈沖將當(dāng)前位置信息發(fā)送到處理器。處理器中的手勢識別軟件對骨骼和關(guān)節(jié)以及手部運動進行建模。這使系統(tǒng)能夠準(zhǔn)確地知道拇指或手指的位置，即使它不在視線范圍內(nèi)。該系統(tǒng)可以通過編程識別各種手勢，包括抓取、滑動、捏合、推動等。該手勢識別系統(tǒng)有一個交互區(qū)域，范圍從10厘米到1米，典型視野為170°x170°。

除了識別手勢外，該系統(tǒng)還知道人的手在哪里，并且可以使用該信息來控制基于超聲波的觸覺反饋。超聲觸覺系統(tǒng)基于以特定時間差觸發(fā)的揚聲器矩陣，使聲波能夠聚焦在空間中的特定點，例如，人手的特定部分所在的位置（圖6）?？梢愿鶕?jù)應(yīng)用程序的需要實時更改3D焦點。超聲波在焦點處的組合振動產(chǎn)生了人體皮膚可以感覺到的壓力點。

圖6：聚焦超聲波可以為基于紅外攝像頭的手勢識別系統(tǒng)添加觸覺反饋。（圖片來源：??ultraleap??)

總結(jié)

基于視頻的手勢識別仍然是最廣泛使用的手勢識別形式。它用于各種應(yīng)用，包括醫(yī)療環(huán)境和汽車駕駛室。最近，手勢識別已應(yīng)用于AV/VR系統(tǒng)、樓宇自動化系統(tǒng)和機器人技術(shù)。新的手勢識別技術(shù)正在推動手勢識別的日益增長的應(yīng)用，包括電場感應(yīng)、基于VCSEL的LIDAR系統(tǒng)、碳納米管電容設(shè)備以及結(jié)合超聲觸覺反饋的紅外相機。

上一篇：車聯(lián)網(wǎng)場景中的MQTT協(xié)議

下一篇：工業(yè)自動化緣何在工業(yè)4.0時代聚焦全球目光