人工智能曾經(jīng)過兩次繁榮,現(xiàn)在是它的第三次繁榮,主要原因有:一是以深度學(xué)習(xí)技術(shù)為代表的技術(shù)的迅速發(fā)展,尤其是在圖象領(lǐng)域取得了重大的突破;二是有強大的計算能力;三是數(shù)據(jù)越來越多。正因為有了數(shù)據(jù)計算能力和算法,可以在更多的方面解決更多商業(yè)問題。當(dāng)今在視覺智能實踐的探索體現(xiàn)在如下四個方面。
1、電商搜索
目前電商搜索是一個比較成熟的產(chǎn)品,現(xiàn)在已經(jīng)開始大規(guī)模的部署。目標(biāo)是希望在電商搜索上,提供除了文字之外的另外一種搜索,如探索視頻廣告和視覺診斷。因為有深度學(xué)習(xí)快速的發(fā)展,電商環(huán)境下的圖象搜索已經(jīng)取得了重大的突破,幾乎實現(xiàn)了所見即所得的效果,網(wǎng)上已經(jīng)能夠搜到相關(guān)的資料。
2、城市之眼
城市之眼的目標(biāo)是希望通過城市里面大量攝像頭的分析,為我們的交通、安全提供更好的智能決策。從計算上來說,對整個城市上萬個攝像頭進行分析,計算量非常大。但由于有當(dāng)今云、大批量計算平臺的支持,通過對視頻數(shù)據(jù)結(jié)構(gòu)化,可以實現(xiàn)對全網(wǎng)視頻數(shù)據(jù)的大范圍搜索。如通過車輛的屬性和車牌,在視頻數(shù)據(jù)中進行搜索,可以追查肇事車輛的逃逸。
3、視頻廣告
第一個方面的探索就是希望能夠在視頻中找到一個合適的位置,把廣告無縫嵌入進去,并且不影響大家的觀看體驗。
第二個方面希望通過對視頻內(nèi)容的分析,嵌入合適的符合這個場景的廣告。
第三個方面是智能廣告設(shè)計,通過機器學(xué)習(xí)的手段使得廣告海報的生成更加便捷。用戶能夠通過簡單的畫直線和方框,生成一幅跟人工幾乎可以相媲美的廣告海報。
4.視覺診斷
視覺診斷包含兩個部分,一個是診斷機器,一個是診斷生物。
傳統(tǒng)的工業(yè)診斷方法是人拿工具到現(xiàn)場檢查,診斷機器的目標(biāo)是通過視覺分析的手段能夠代替人工對機器的檢查。通過現(xiàn)場拍攝錄像,通過視覺分析的手段,能夠自動地診斷出機器的故障;診斷生物則是醫(yī)學(xué)影像智能診斷。