邻居一晚让我高潮3次正常吗,人妻丰满熟妇AV无码区动漫,乱LUN合集1第40部分阅读,精品无码国产一区二区三区51安

當(dāng)前位置:首頁 > 最新資訊 > 行業(yè)資訊

數(shù)據(jù)管理已成了AI發(fā)展的一大阻礙

對于基礎(chǔ)設(shè)施而言,真正偉大的標(biāo)志是它容易被忽視。其表現(xiàn)得愈好,我們考慮的就愈少。比如,移動基礎(chǔ)設(shè)施只有在我們發(fā)現(xiàn)自己難以連接時,它的重要性才會浮現(xiàn)在我們的腦海中。就像是我們在一條嶄新的、剛鋪好路面的高速公路上行駛時,我們極少考慮路面,原因是它靜靜地從我們的車輪下駛過。另一方面,一條養(yǎng)護(hù)不善的公路,我們遇到的每一個坑洼、草皮和崎嶇不平的路面,都會讓我們想起它的存在。

基礎(chǔ)設(shè)施只有在缺失、不足或損壞時才需要我們的關(guān)注。而在計算機(jī)視覺領(lǐng)域,基礎(chǔ)設(shè)施——或者更確切地說,它所缺少的東西——是現(xiàn)下很多人所在意的。

計算設(shè)定了基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)

支撐每個人工智能/機(jī)器學(xué)習(xí)項目(囊括計算機(jī)視覺)的是三個基本的開發(fā)支柱——數(shù)據(jù)、算法/模型和計算。在這三大支柱中,計算是至今為止擁有最強(qiáng)大和最牢固基礎(chǔ)設(shè)施的一個。憑借數(shù)十年的專注企業(yè)投資和開發(fā),云計算已成了整個企業(yè)IT環(huán)境中IT基礎(chǔ)設(shè)施的黃金標(biāo)準(zhǔn)——計算機(jī)視覺也不例外。

在“基礎(chǔ)設(shè)施即服務(wù)”模式下,近20年來,開發(fā)人員一直享受按需、即付即用的方式訪問不斷擴(kuò)大的計算能力管道。在此期間,它通過顯著提高敏捷性、成本效率、可擴(kuò)展性等,徹底改變了企業(yè)IT。伴隨專用機(jī)器學(xué)習(xí)GPU的出現(xiàn),可以肯定地說,計算機(jī)視覺基礎(chǔ)設(shè)施堆棧的這一部分是生機(jī)勃勃的。假如我們希望看到計算機(jī)視覺和人工智能充分發(fā)揮其潛力,明智的做法是使用計算作為CV基礎(chǔ)設(shè)施堆棧其余部分所基于的模型。

模型驅(qū)動開發(fā)的沿襲和局限性

直到現(xiàn)在,算法和模型開發(fā)一直是計算機(jī)視覺和AI發(fā)展的驅(qū)動力。在研究和商業(yè)開發(fā)方面,團(tuán)隊辛勤工作多年,測試、修補(bǔ)和逐步改進(jìn)人工智能/機(jī)器學(xué)習(xí)模型,并在Kaggle等開源社區(qū)分享他們的進(jìn)步。通過集中精力在算法開發(fā)和建模上,計算機(jī)視覺和AI領(lǐng)域在新千年的前二十年取得了長足的進(jìn)步。

然則,近年來,這種進(jìn)展已經(jīng)放緩,原因是以模型為中心的優(yōu)化違背了收益遞減規(guī)律。另外,以模型為中心的方法有幾個限制。比如,你不能使用相同的數(shù)據(jù)進(jìn)行訓(xùn)練,然后再對模型進(jìn)行訓(xùn)練。在數(shù)據(jù)清理、模型驗證和訓(xùn)練方面,以模型為中心的方法還需要更多的體力勞動,這可能會占用寶貴的時間和資源來完成更具創(chuàng)新性的創(chuàng)收任務(wù)。

如今,通過Hugging Face等社區(qū),CV機(jī)器學(xué)習(xí)團(tuán)隊可以免費和開放地訪問大量復(fù)雜的大型算法、模型和架構(gòu),每個都支持不同的核心機(jī)器學(xué)習(xí)CV機(jī)器學(xué)習(xí)能力——從對象識別和面部地標(biāo)識別到姿勢估計和特征匹配。這些資產(chǎn)已經(jīng)變得與人們想象的一樣接近“現(xiàn)成”的解決方案——為計算機(jī)視覺和AI團(tuán)隊提供現(xiàn)成的白板,以針對任何數(shù)量的專業(yè)任務(wù)和用例進(jìn)行訓(xùn)練。

就像手眼協(xié)調(diào)這樣的基本人類能力可以應(yīng)用于各種不同的技能并進(jìn)行訓(xùn)練——從打乒乓球到投球——這些現(xiàn)代機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法也可以被訓(xùn)練來執(zhí)行一個范圍的具體應(yīng)用。然則,雖說人類通過多年的實踐和汗水變得專業(yè)化,但機(jī)器通過數(shù)據(jù)訓(xùn)練做到了這一點。

以數(shù)據(jù)為中心的AI和大數(shù)據(jù)阻礙

這促使很多AI領(lǐng)域的領(lǐng)軍人物呼吁進(jìn)入深度學(xué)習(xí)發(fā)展的新時代——在這個時代,進(jìn)步的主要引擎是數(shù)據(jù)。就在幾年前,吳恩達(dá)(Andrew Ng)等人宣布以數(shù)據(jù)為中心是人工智能發(fā)展的方向。在這短暫的時間里,該行業(yè)蓬勃發(fā)展。在短短幾年時間里,涌現(xiàn)了大量計算機(jī)視覺的新穎商業(yè)應(yīng)用和用例,涵蓋了廣泛的行業(yè)——從機(jī)器人和AR/VR,到汽車制造和家庭安全。

近期,我們使用以數(shù)據(jù)為中心的方法對汽車上的手握方向盤檢測進(jìn)行了研究。我們的實驗表明,通過使用這種方法和合成數(shù)據(jù),我們能夠識別并生成訓(xùn)練數(shù)據(jù)集中缺乏的特定邊緣情況。

數(shù)據(jù)管理已成了AI發(fā)展的一大阻礙

Datagen機(jī)器學(xué)習(xí)為手握方向盤測試生成合成的圖像(圖片由來源:Datagen機(jī)器學(xué)習(xí)提供)

雖說計算機(jī)視覺行業(yè)對數(shù)據(jù)議論紛紛,但并不是所有的議論都是狂熱的。盡管該領(lǐng)域已經(jīng)確定了數(shù)據(jù)是前進(jìn)的道路,但在前進(jìn)的道路上還有很多障礙和陷阱,其中很多已經(jīng)讓CV團(tuán)隊步履蹣跚。近期一項針對美國計算機(jī)視覺專業(yè)人士的調(diào)查顯示,這一領(lǐng)域飽受長時間項目延誤、非標(biāo)準(zhǔn)化流程和資源短缺的困擾——所有這些都源于數(shù)據(jù)。在同一項調(diào)查中,99%機(jī)器學(xué)習(xí)的受訪者表示,至少有一個CV項目由于訓(xùn)練數(shù)據(jù)不足而被無限期取消。

即使是至今為止避免了項目被取消的1%的幸運(yùn)兒,也無法避免項目延遲。在調(diào)查中,每個受訪者都報告說,由于訓(xùn)練數(shù)據(jù)不充分或不足,他們經(jīng)歷了重大的項目延誤,其中80%的人報告延誤持續(xù)了3個月或更長時間。最終,基礎(chǔ)設(shè)施的目的是一種效用——促進(jìn)、加速或傳達(dá)。在一個嚴(yán)重延誤只是做生意的一部分的世界里,很明顯缺少一些重要的基礎(chǔ)設(shè)施。

傳統(tǒng)訓(xùn)練數(shù)據(jù)挑戰(zhàn)基礎(chǔ)設(shè)施

然則,與計算和算法不同,人工智能/機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)開發(fā)的第三個支柱并不適合基礎(chǔ)設(shè)施化——尤其是在計算機(jī)視覺領(lǐng)域,在該領(lǐng)域,數(shù)據(jù)量大、雜亂無章,而且收集和管理時間和資源都非常密集。雖說有很多標(biāo)記的、可在線免費獲得的視覺訓(xùn)練數(shù)據(jù)數(shù)據(jù)庫(比如現(xiàn)在著名的機(jī)器學(xué)習(xí)ImageNet機(jī)器學(xué)習(xí)數(shù)據(jù)庫),但事實證明,它們本身不足以作為商業(yè)機(jī)器學(xué)習(xí)CV機(jī)器學(xué)習(xí)開發(fā)中訓(xùn)練數(shù)據(jù)的來源。

這是因為,與通過設(shè)計概括的模型不同,訓(xùn)練數(shù)據(jù)就其本質(zhì)而言是特定于應(yīng)用的。數(shù)據(jù)是將給定模型的一個應(yīng)用與另一個應(yīng)用區(qū)分開來的東西,故此不僅對于特定任務(wù),而且對于執(zhí)行該任務(wù)的環(huán)境或上下文必須是唯一的。與可以以光速生成和訪問的計算能力不同,傳統(tǒng)的視覺數(shù)據(jù)必須由人類創(chuàng)建或收集(通過在現(xiàn)場拍攝照片或在互聯(lián)網(wǎng)上搜索合適的圖像),然后經(jīng)過精心清理和由人工標(biāo)記(這是一個容易出現(xiàn)人為錯誤、不一致和偏見的過程)。

這就提出了一個問題,“我們怎樣才能制作既適用于特定應(yīng)用又易于商品化(即快速、廉價和多功能)的可視化數(shù)據(jù)?”盡管這兩種品質(zhì)似乎相互矛盾,但潛在的解決方案已經(jīng)出現(xiàn);作為調(diào)和這兩種基本但看似不相容的品質(zhì)的一種方式,它顯示出巨大的希望。

合成數(shù)據(jù)和完整機(jī)器學(xué)習(xí)CV機(jī)器學(xué)習(xí)堆棧的路徑

數(shù)據(jù)管理已成了AI發(fā)展的一大阻礙

計算機(jī)視覺(CV)是現(xiàn)代AI的領(lǐng)先領(lǐng)域之一

制作具有特定應(yīng)用且大規(guī)模節(jié)省時間和資源的可視化訓(xùn)練數(shù)據(jù)的唯一方法是使用合成數(shù)據(jù)。對于那些不熟悉這個概念的人來說,合成數(shù)據(jù)是人為生成的信息,意在忠實地代表一些現(xiàn)實世界的對等物。就視覺合成數(shù)據(jù)而言,這意味著以靜態(tài)圖像或視頻形式的逼真的計算機(jī)生成的3D圖像(CGI)。

為了應(yīng)對數(shù)據(jù)中心時代出現(xiàn)的很多問題,一個新興的行業(yè)已經(jīng)開始圍繞合成數(shù)據(jù)生成形成——一個不斷壯大的生態(tài)系統(tǒng),由中小型初創(chuàng)企業(yè)提供各種解決方案,利用合成數(shù)據(jù)來解決上面列出的一系列痛點。

這些解決方案中最有前途的解決方案使用機(jī)器學(xué)習(xí)人工智能/機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法生成逼真的機(jī)器學(xué)習(xí)3D機(jī)器學(xué)習(xí)圖像,并為每個數(shù)據(jù)點自動生成相關(guān)的地面實況(即元數(shù)據(jù))。故此,合成數(shù)據(jù)消除了通常長達(dá)數(shù)月的手動標(biāo)記和注釋過程,同時也消除了人為錯誤和偏見的可能性。

在我們的論文(在機(jī)器學(xué)習(xí)NeurIPS 2021機(jī)器學(xué)習(xí)上發(fā)表)中,使用合成數(shù)據(jù)發(fā)現(xiàn)面部地標(biāo)檢測中的群體偏差,我們發(fā)現(xiàn)要分析經(jīng)過訓(xùn)練的模型性能并確定其弱點,必須留出一部分?jǐn)?shù)據(jù)進(jìn)行測試。測試集必須足夠大,以檢測有關(guān)目標(biāo)人群中所有相關(guān)子組的統(tǒng)計顯著偏差。這一要求可能難以滿足,尤其是在數(shù)據(jù)密集型應(yīng)用中。

我們建議通過生成合成測試集來克服這一困難。我們使用人臉標(biāo)志檢測任務(wù)來驗證我們的提議,方法是顯示在真實數(shù)據(jù)集上觀察到的所有偏差也可以在精心設(shè)計的合成數(shù)據(jù)集上看到。這表明合成測試集可以有效地檢測模型的弱點并克服真實測試集在數(shù)量或多樣性方面的限制。

如今,初創(chuàng)企業(yè)正在向企業(yè)機(jī)器學(xué)習(xí)CV機(jī)器學(xué)習(xí)團(tuán)隊提供成熟的自助合成數(shù)據(jù)生成平臺,以減輕偏見并允許擴(kuò)展數(shù)據(jù)采集。這些平臺允許企業(yè)機(jī)器學(xué)習(xí)CV機(jī)器學(xué)習(xí)團(tuán)隊在計量、按需的基礎(chǔ)上生成特定于用例的訓(xùn)練數(shù)據(jù)——彌合使傳統(tǒng)數(shù)據(jù)不適用于基礎(chǔ)設(shè)施化的特異性和規(guī)模之間的差距。

計算機(jī)視覺所謂的“數(shù)據(jù)管理員”的新希望

不可否認(rèn),這對于計算機(jī)視覺領(lǐng)域來說是一個激動人心的時刻。不過,就像任何其他不斷變化的領(lǐng)域一樣,這也是一個充滿挑戰(zhàn)的時代。杰出的人才和才華橫溢的頭腦涌入充滿想法和熱情的領(lǐng)域,卻發(fā)現(xiàn)自己因缺乏足夠的數(shù)據(jù)管道而受阻。該領(lǐng)域深陷低效率的泥潭,以至于今天的數(shù)據(jù)科學(xué)家被稱為三分之一的組織已經(jīng)在與技能差距作斗爭的領(lǐng)域,我們不能浪費寶貴的HR。

合成數(shù)據(jù)為真正的訓(xùn)練數(shù)據(jù)基礎(chǔ)設(shè)施打開了大門——有一天,它可能只需要打開水龍頭喝一杯水或提供計算就可以了。對于世界上的數(shù)據(jù)管理員來說,這肯定是一種受歡迎的茶點。

猜你喜歡