1、視聯(lián)網(wǎng)是什么?
2030年,全球帶攝像頭終端數(shù)量將達到130億臺,視頻流量將成為網(wǎng)絡(luò)流量中的主體,視頻物聯(lián)市場已成為新的增長引擎和競爭高地。隨著ChatGPT發(fā)布,AI技術(shù)出現(xiàn)革命性提升,視頻物聯(lián)在AI技術(shù)的加持下,全新的應(yīng)用場景將大量涌現(xiàn),比如智慧家庭、城市大腦、車路協(xié)同等等,而視頻、物聯(lián)、AI的進一步跨域融通,也面臨一些挑戰(zhàn):
算力協(xié)同,視頻數(shù)據(jù)處理需要大量算力支持,單點算力受摩爾定律制約,難以滿足快速增長的智能化應(yīng)用的計算需求,需要云網(wǎng)算力協(xié)同,比如車路協(xié)同場景,終端設(shè)備算力有限,需要將智能分析卸載到邊緣節(jié)點進行計算。
多媒體傳輸,在智能監(jiān)控、語音社交、視頻社交、游戲語音和互動直播等領(lǐng)域,對多媒體傳輸時延的要求越來越高,需要低時延、高速、安全、實時的多媒體傳輸,受互聯(lián)網(wǎng)環(huán)境限制,優(yōu)化提升空間有限。
泛在連接,人類社會傳播的文字、語音、圖像等信息從未像今天這樣呈指數(shù)級的增長,一方面信息大量過載,一方面因缺乏互通,使信息孤島問題日益嚴重。隨著數(shù)字化推進,需要強化多維感知、萬物智聯(lián)。
視聯(lián)網(wǎng)是在5G和寬帶網(wǎng)基礎(chǔ)上,通過云網(wǎng)融合能力升級,接入視頻、攝像頭實現(xiàn)物聯(lián)網(wǎng)可視化,打造以內(nèi)容密度更高、更易接受的視頻為主要信息載體的新型互聯(lián)網(wǎng)絡(luò),支撐高速增長的視頻、物聯(lián)、AI需求。
中國移動智慧家庭運營中心經(jīng)多年技術(shù)積累,基于AIoTel物聯(lián)網(wǎng)多媒體通信能力、泛安防監(jiān)控能力、場景化AI能力3大核心能力,攻關(guān)視聯(lián)網(wǎng)關(guān)鍵技術(shù),構(gòu)建視聯(lián)網(wǎng)能力平臺,孵化移動看家、和家智話2類全網(wǎng)業(yè)務(wù),以和家親APP為智家服務(wù)入口,創(chuàng)新探索多類信息服務(wù)場景,打造1+2+3+X泛家庭信息服務(wù)體系(如圖1),支撐泛家庭市場高質(zhì)量發(fā)展。目前基于視聯(lián)網(wǎng)能力,接入智能終端數(shù)達千萬級規(guī)模,用戶規(guī)模、云存儲規(guī)模位居業(yè)界第一。
圖1 1+2+3+X泛家庭信息服務(wù)體系
2、視聯(lián)網(wǎng)技術(shù)架構(gòu)
視聯(lián)網(wǎng)為了突破大規(guī)模視頻物聯(lián)在感知、傳輸、存儲、算力等方面的技術(shù)挑戰(zhàn),視聯(lián)網(wǎng)的技術(shù)架構(gòu)一般包括基礎(chǔ)設(shè)施、平臺能力、平臺服務(wù)和能力開放。通過構(gòu)建包括端、管、云、智、安等環(huán)節(jié)的關(guān)鍵能力,對智能感知技術(shù)、音視頻編解碼、多媒體傳輸、云原生、云邊端協(xié)同、全鏈路安全保障等技術(shù)進行深度融合,向上為平臺服務(wù)提供能力支撐。平臺服務(wù)為客戶提供全面、豐富的視頻物聯(lián)服務(wù),并通過能力開放服務(wù)對外輸出視聯(lián)網(wǎng)能力。技術(shù)架構(gòu)如圖2所示。
圖2 視聯(lián)網(wǎng)技術(shù)架構(gòu)圖
為支撐超大規(guī)模視頻物聯(lián)服務(wù),視聯(lián)網(wǎng)的部署架構(gòu)(如圖3所示)通常采用“1+N+31+X”的四級部署架構(gòu),第一級的業(yè)務(wù)中心,用于運行核心的業(yè)務(wù)系統(tǒng),承載重要用戶數(shù)據(jù),采用同城雙活和異地?zé)醾涞膬杉壢轂?zāi)模式,保障核心業(yè)務(wù)系統(tǒng)可靠運行;第二級的能力中心,用于終端接入、用戶接入的實時調(diào)度,采用分大區(qū)模式進行區(qū)域化管理;第三級的省級節(jié)點提供視頻轉(zhuǎn)發(fā)、直播、存儲、計算等服務(wù),將全網(wǎng)業(yè)務(wù)劃分到每個省,實現(xiàn)數(shù)據(jù)不出省、降低跨省主干網(wǎng)帶寬消耗,同時可滿足視頻物聯(lián)專業(yè)項目的數(shù)據(jù)安全性要求;第四級的邊緣節(jié)點按需建設(shè),將存儲、算力下沉到地市、縣區(qū)級別,提供邊緣推流、存儲、計算服務(wù),能顯著降低視頻傳輸時延,提高存儲和視頻AI推理的效率。“1+N+31+X”部署架構(gòu)具備就近接入、二級容災(zāi)、存智一體的特點,為視聯(lián)網(wǎng)提供低時延、高速率、強安全、強計算的使用體驗。
圖3 視聯(lián)網(wǎng)部署架構(gòu)圖
3、視聯(lián)網(wǎng)關(guān)鍵技術(shù)之:智能感知
智能感知是視聯(lián)網(wǎng)在最末端(端側(cè))的技術(shù)體系,圍繞智能、接入、多模態(tài)等方面關(guān)鍵技術(shù)進行攻關(guān),實現(xiàn)一個多維融合、立體豐富的感知平面。
1?? 多傳感融合:煙感、氣感、門磁和攝像頭等各類智能終端都可視為傳感器,將多個傳感器的特征進行互聯(lián),實現(xiàn)多模特征的時空融合,支撐上層應(yīng)用制定更精確的決策。通過提取多個視聯(lián)終端的特征數(shù)據(jù)(如圖4所示),在邊緣節(jié)點進行智能分析,進行特征級融合,通過云端聯(lián)動不同設(shè)備的事件,例如:在煙氣感觸發(fā)告警時,聯(lián)動監(jiān)控設(shè)備拍攝煙氣感的監(jiān)控范圍,進行精準監(jiān)控。
圖4 多傳感器融合原理圖
2?? 腦啟發(fā)編碼:基于人類大腦視桿、視錐細胞對2D信息的處理機制(如圖5所示),區(qū)別于傳統(tǒng)視頻編碼技術(shù),對視頻圖像進行腦啟發(fā)編碼,提高像素編碼的壓縮上限。目前大規(guī)模設(shè)備的視頻采集具有極大的信息冗余,同時搭載算力芯片的智能設(shè)備具有一定的AI檢測識別能力,能夠?qū)?shù)據(jù)進行預(yù)處理提取關(guān)鍵信息,通過腦啟發(fā)編碼技術(shù),大大降低傳輸帶寬并緩解了云端運算的壓力。
圖5 人腦處理機制示意圖
4、總結(jié)
以上我們介紹了視聯(lián)網(wǎng)的技術(shù)背景及其面臨的技術(shù)挑戰(zhàn),視聯(lián)網(wǎng)技術(shù)架構(gòu)通過構(gòu)建端、管、云、智、安等環(huán)節(jié)的關(guān)鍵能力,向上支持平臺服務(wù),并通過能力開放支撐高速增長的視頻、物聯(lián)、AI需求,中國移動智慧家庭運營中心基于視聯(lián)網(wǎng)能力,接入智能終端數(shù)達千萬級規(guī)模,用戶規(guī)模、云存儲規(guī)模位居業(yè)界第一,落地超大規(guī)模視聯(lián)網(wǎng)應(yīng)用。