視聯(lián)網(wǎng)關(guān)鍵技術(shù)探索（一）

沃卡惠
行業(yè)資訊
2023-08-29 09:24:14
81

視聯(lián)網(wǎng)是什么

1、視聯(lián)網(wǎng)是什么？

2030年，全球帶攝像頭終端數(shù)量將達到130億臺，視頻流量將成為網(wǎng)絡(luò)流量中的主體，視頻物聯(lián)市場已成為新的增長引擎和競爭高地。隨著ChatGPT發(fā)布，AI技術(shù)出現(xiàn)革命性提升，視頻物聯(lián)在AI技術(shù)的加持下，全新的應(yīng)用場景將大量涌現(xiàn)，比如智慧家庭、城市大腦、車路協(xié)同等等，而視頻、物聯(lián)、AI的進一步跨域融通，也面臨一些挑戰(zhàn)：

算力協(xié)同，視頻數(shù)據(jù)處理需要大量算力支持，單點算力受摩爾定律制約，難以滿足快速增長的智能化應(yīng)用的計算需求，需要云網(wǎng)算力協(xié)同，比如車路協(xié)同場景，終端設(shè)備算力有限，需要將智能分析卸載到邊緣節(jié)點進行計算。

多媒體傳輸，在智能監(jiān)控、語音社交、視頻社交、游戲語音和互動直播等領(lǐng)域，對多媒體傳輸時延的要求越來越高，需要低時延、高速、安全、實時的多媒體傳輸，受互聯(lián)網(wǎng)環(huán)境限制，優(yōu)化提升空間有限。

泛在連接，人類社會傳播的文字、語音、圖像等信息從未像今天這樣呈指數(shù)級的增長，一方面信息大量過載，一方面因缺乏互通，使信息孤島問題日益嚴重。隨著數(shù)字化推進，需要強化多維感知、萬物智聯(lián)。

視聯(lián)網(wǎng)是在5G和寬帶網(wǎng)基礎(chǔ)上，通過云網(wǎng)融合能力升級，接入視頻、攝像頭實現(xiàn)物聯(lián)網(wǎng)可視化，打造以內(nèi)容密度更高、更易接受的視頻為主要信息載體的新型互聯(lián)網(wǎng)絡(luò)，支撐高速增長的視頻、物聯(lián)、AI需求。

中國移動智慧家庭運營中心經(jīng)多年技術(shù)積累，基于AIoTel物聯(lián)網(wǎng)多媒體通信能力、泛安防監(jiān)控能力、場景化AI能力3大核心能力，攻關(guān)視聯(lián)網(wǎng)關(guān)鍵技術(shù)，構(gòu)建視聯(lián)網(wǎng)能力平臺，孵化移動看家、和家智話2類全網(wǎng)業(yè)務(wù)，以和家親APP為智家服務(wù)入口，創(chuàng)新探索多類信息服務(wù)場景，打造1+2+3+X泛家庭信息服務(wù)體系（如圖1），支撐泛家庭市場高質(zhì)量發(fā)展。目前基于視聯(lián)網(wǎng)能力，接入智能終端數(shù)達千萬級規(guī)模，用戶規(guī)模、云存儲規(guī)模位居業(yè)界第一。

1+2+3+X泛家庭信息服務(wù)體系

圖1 1+2+3+X泛家庭信息服務(wù)體系

2、視聯(lián)網(wǎng)技術(shù)架構(gòu)

視聯(lián)網(wǎng)為了突破大規(guī)模視頻物聯(lián)在感知、傳輸、存儲、算力等方面的技術(shù)挑戰(zhàn)，視聯(lián)網(wǎng)的技術(shù)架構(gòu)一般包括基礎(chǔ)設(shè)施、平臺能力、平臺服務(wù)和能力開放。通過構(gòu)建包括端、管、云、智、安等環(huán)節(jié)的關(guān)鍵能力，對智能感知技術(shù)、音視頻編解碼、多媒體傳輸、云原生、云邊端協(xié)同、全鏈路安全保障等技術(shù)進行深度融合，向上為平臺服務(wù)提供能力支撐。平臺服務(wù)為客戶提供全面、豐富的視頻物聯(lián)服務(wù)，并通過能力開放服務(wù)對外輸出視聯(lián)網(wǎng)能力。技術(shù)架構(gòu)如圖2所示。

視聯(lián)網(wǎng)技術(shù)架構(gòu)圖

圖2 視聯(lián)網(wǎng)技術(shù)架構(gòu)圖

為支撐超大規(guī)模視頻物聯(lián)服務(wù)，視聯(lián)網(wǎng)的部署架構(gòu)（如圖3所示）通常采用“1+N+31+X”的四級部署架構(gòu)，第一級的業(yè)務(wù)中心，用于運行核心的業(yè)務(wù)系統(tǒng)，承載重要用戶數(shù)據(jù)，采用同城雙活和異地?zé)醾涞膬杉壢轂?zāi)模式，保障核心業(yè)務(wù)系統(tǒng)可靠運行；第二級的能力中心，用于終端接入、用戶接入的實時調(diào)度，采用分大區(qū)模式進行區(qū)域化管理；第三級的省級節(jié)點提供視頻轉(zhuǎn)發(fā)、直播、存儲、計算等服務(wù)，將全網(wǎng)業(yè)務(wù)劃分到每個省，實現(xiàn)數(shù)據(jù)不出省、降低跨省主干網(wǎng)帶寬消耗，同時可滿足視頻物聯(lián)專業(yè)項目的數(shù)據(jù)安全性要求；第四級的邊緣節(jié)點按需建設(shè)，將存儲、算力下沉到地市、縣區(qū)級別，提供邊緣推流、存儲、計算服務(wù)，能顯著降低視頻傳輸時延，提高存儲和視頻AI推理的效率。“1+N+31+X”部署架構(gòu)具備就近接入、二級容災(zāi)、存智一體的特點，為視聯(lián)網(wǎng)提供低時延、高速率、強安全、強計算的使用體驗。

視聯(lián)網(wǎng)部署架構(gòu)圖

圖3 視聯(lián)網(wǎng)部署架構(gòu)圖

3、視聯(lián)網(wǎng)關(guān)鍵技術(shù)之：智能感知

智能感知是視聯(lián)網(wǎng)在最末端（端側(cè)）的技術(shù)體系，圍繞智能、接入、多模態(tài)等方面關(guān)鍵技術(shù)進行攻關(guān)，實現(xiàn)一個多維融合、立體豐富的感知平面。

1?? 多傳感融合：煙感、氣感、門磁和攝像頭等各類智能終端都可視為傳感器，將多個傳感器的特征進行互聯(lián)，實現(xiàn)多模特征的時空融合，支撐上層應(yīng)用制定更精確的決策。通過提取多個視聯(lián)終端的特征數(shù)據(jù)（如圖4所示），在邊緣節(jié)點進行智能分析，進行特征級融合，通過云端聯(lián)動不同設(shè)備的事件，例如：在煙氣感觸發(fā)告警時，聯(lián)動監(jiān)控設(shè)備拍攝煙氣感的監(jiān)控范圍，進行精準監(jiān)控。

多傳感器融合原理圖

圖4 多傳感器融合原理圖

2?? 腦啟發(fā)編碼：基于人類大腦視桿、視錐細胞對2D信息的處理機制（如圖5所示），區(qū)別于傳統(tǒng)視頻編碼技術(shù)，對視頻圖像進行腦啟發(fā)編碼，提高像素編碼的壓縮上限。目前大規(guī)模設(shè)備的視頻采集具有極大的信息冗余，同時搭載算力芯片的智能設(shè)備具有一定的AI檢測識別能力，能夠?qū)?shù)據(jù)進行預(yù)處理提取關(guān)鍵信息，通過腦啟發(fā)編碼技術(shù)，大大降低傳輸帶寬并緩解了云端運算的壓力。

人腦處理機制示意圖

圖5 人腦處理機制示意圖

4、總結(jié)

以上我們介紹了視聯(lián)網(wǎng)的技術(shù)背景及其面臨的技術(shù)挑戰(zhàn)，視聯(lián)網(wǎng)技術(shù)架構(gòu)通過構(gòu)建端、管、云、智、安等環(huán)節(jié)的關(guān)鍵能力，向上支持平臺服務(wù)，并通過能力開放支撐高速增長的視頻、物聯(lián)、AI需求，中國移動智慧家庭運營中心基于視聯(lián)網(wǎng)能力，接入智能終端數(shù)達千萬級規(guī)模，用戶規(guī)模、云存儲規(guī)模位居業(yè)界第一，落地超大規(guī)模視聯(lián)網(wǎng)應(yīng)用。

上一篇：數(shù)據(jù)管理會成為人工智能革命的最大挑戰(zhàn)嗎？

下一篇：視聯(lián)網(wǎng)關(guān)鍵技術(shù)探索（二）