通常與人工智能 (AI) 和機(jī)器學(xué)習(xí)(ML) 相關(guān)聯(lián),數(shù)據(jù)結(jié)構(gòu)是將原始數(shù)據(jù)轉(zhuǎn)換為商業(yè)智能的主要工具之一。
但究竟什么是數(shù)據(jù)結(jié)構(gòu)?
數(shù)據(jù)結(jié)構(gòu)是一種架構(gòu)和軟件,可在企業(yè)內(nèi)提供統(tǒng)一的數(shù)據(jù)資產(chǎn)、數(shù)據(jù)庫和數(shù)據(jù)庫架構(gòu)集合。它通過使用智能和自動(dòng)化系統(tǒng)促進(jìn)各種數(shù)據(jù)管道和云環(huán)境的端到端集成。
隨著混合云、物聯(lián)網(wǎng) (IoT)、人工智能和邊緣計(jì)算的重大發(fā)展繼續(xù)發(fā)生,數(shù)據(jù)結(jié)構(gòu)變得更加重要。這導(dǎo)致大數(shù)據(jù)的大量增加,這意味著組織需要管理的內(nèi)容更多。
為了應(yīng)對(duì)這些大數(shù)據(jù),企業(yè)必須關(guān)注數(shù)據(jù)環(huán)境的統(tǒng)一和治理,這帶來了數(shù)據(jù)孤島、安全風(fēng)險(xiǎn)和決策瓶頸等挑戰(zhàn)。這些挑戰(zhàn)導(dǎo)致數(shù)據(jù)管理團(tuán)隊(duì)采用 Data Fabric 解決方案,這些解決方案有助于統(tǒng)一數(shù)據(jù)系統(tǒng)、加強(qiáng)隱私和安全性、改善治理并為員工提供更多數(shù)據(jù)可訪問性。
數(shù)據(jù)集成導(dǎo)致更多的數(shù)據(jù)驅(qū)動(dòng)決策,雖然企業(yè)歷來針對(duì)業(yè)務(wù)的特定方面使用不同的數(shù)據(jù)平臺(tái),但數(shù)據(jù)結(jié)構(gòu)使數(shù)據(jù)能夠更緊密地查看。所有這些都有助于更好地了解客戶生命周期,并有助于建立數(shù)據(jù)之間的聯(lián)系。
數(shù)據(jù)結(jié)構(gòu)的目的是什么?
數(shù)據(jù)結(jié)構(gòu)用于建立關(guān)聯(lián)數(shù)據(jù)的統(tǒng)一視圖,這有助于訪問信息,無論其位置、數(shù)據(jù)庫關(guān)聯(lián)或結(jié)構(gòu)如何。數(shù)據(jù)結(jié)構(gòu)還通過人工智能和機(jī)器學(xué)習(xí)簡化了分析。
數(shù)據(jù)結(jié)構(gòu)的另一個(gè)目的是促進(jìn)應(yīng)用程序開發(fā),因?yàn)樗鼊?chuàng)建了一個(gè)用于訪問與傳統(tǒng)應(yīng)用程序和數(shù)據(jù)庫孤島分開的信息的通用模型。這些模型提供了更好的信息訪問,但它們還通過建立一個(gè)可以跨所有資源管理數(shù)據(jù)訪問的單一層來提高效率。
雖然數(shù)據(jù)結(jié)構(gòu)沒有單一的數(shù)據(jù)架構(gòu),但人們常說這種類型的數(shù)據(jù)框架有六個(gè)基本組件:
數(shù)據(jù)管理:負(fù)責(zé)數(shù)據(jù)治理和數(shù)據(jù)安全。
數(shù)據(jù)攝?。?/strong>將云數(shù)據(jù)整合在一起并識(shí)別結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)之間的連接。
數(shù)據(jù)處理:優(yōu)化數(shù)據(jù)以確保僅顯示相關(guān)數(shù)據(jù)以進(jìn)行數(shù)據(jù)提取。
數(shù)據(jù)編排:框架的一個(gè)非常重要的層,負(fù)責(zé)轉(zhuǎn)換、集成和清理數(shù)據(jù),以便可以在整個(gè)業(yè)務(wù)中使用。
數(shù)據(jù)發(fā)現(xiàn):展示集成數(shù)據(jù)源的新方法。
數(shù)據(jù)訪問:支持?jǐn)?shù)據(jù)消費(fèi),確保某些團(tuán)隊(duì)遵守法規(guī)的正確權(quán)限,并通過使用儀表板和其他數(shù)據(jù)可視化工具幫助顯示相關(guān)數(shù)據(jù)。
數(shù)據(jù)結(jié)構(gòu)的好處
數(shù)據(jù)結(jié)構(gòu)有許多業(yè)務(wù)和技術(shù)優(yōu)勢(shì),例如:
打破數(shù)據(jù)孤島:現(xiàn)代企業(yè)經(jīng)常遭受數(shù)據(jù)孤島的困擾,因?yàn)楝F(xiàn)代數(shù)據(jù)庫與應(yīng)用程序組相關(guān)聯(lián),并且隨著新應(yīng)用程序添加到企業(yè)中而不斷增長。數(shù)據(jù)孤島保存不同結(jié)構(gòu)和格式的數(shù)據(jù),但數(shù)據(jù)結(jié)構(gòu)可以改善對(duì)企業(yè)信息的訪問并使用收集的數(shù)據(jù)來提高運(yùn)營效率。
統(tǒng)一數(shù)據(jù)庫:數(shù)據(jù)結(jié)構(gòu)還可以幫助公司統(tǒng)一分布在大范圍內(nèi)的數(shù)據(jù)庫。他們確保位置差異不會(huì)導(dǎo)致訪問障礙。數(shù)據(jù)結(jié)構(gòu)簡化了應(yīng)用程序開發(fā),可用于優(yōu)化特定應(yīng)用程序數(shù)據(jù)的使用,而不會(huì)使其他應(yīng)用程序無法訪問數(shù)據(jù)。他們還可以統(tǒng)一已經(jīng)轉(zhuǎn)移到孤島中的數(shù)據(jù)。
訪問信息的單一方式:數(shù)據(jù)結(jié)構(gòu)提高了應(yīng)用程序的可移植性,并作為訪問云和數(shù)據(jù)中心信息的單一方式。
以更快的速度生成洞察:Data Fabric 解決方案可以輕松處理復(fù)雜的數(shù)據(jù)集,從而加快獲得洞察的時(shí)間。他們的架構(gòu)使預(yù)先構(gòu)建的分析模型和認(rèn)知算法能夠以規(guī)模和速度處理數(shù)據(jù)。
由技術(shù)和非技術(shù)用戶使用:數(shù)據(jù)結(jié)構(gòu)不僅針對(duì)技術(shù)用戶。該架構(gòu)非常靈活,可以與廣泛的用戶界面一起使用。他們可以幫助構(gòu)建業(yè)務(wù)主管可以理解的儀表板,或者他們的復(fù)雜工具可以用于數(shù)據(jù)科學(xué)家的數(shù)據(jù)探索。
實(shí)施 Data Fabrics 的最佳實(shí)踐
全球數(shù)據(jù)市場不斷擴(kuò)大,空間需求旺盛。許多公司希望實(shí)施數(shù)據(jù)架構(gòu)來優(yōu)化他們的企業(yè)數(shù)據(jù),并且他們遵循一些常見的最佳實(shí)踐。
一種這樣的做法是采用 DataOps 流程模型。Data Fabric 和 DataOps 并不相同,但根據(jù) DataOps 模型,數(shù)據(jù)流程、工具和用戶之間存在緊密的連接。通過讓用戶依賴數(shù)據(jù),他們可以利用這些工具并應(yīng)用洞察力。如果沒有 DataOps 模型,用戶可能很難從數(shù)據(jù)結(jié)構(gòu)中提取足夠的數(shù)據(jù)。
另一個(gè)最佳實(shí)踐是避免將數(shù)據(jù)結(jié)構(gòu)變成另一個(gè)數(shù)據(jù)湖,這種情況很常見。例如,如果您擁有所有架構(gòu)組件(例如數(shù)據(jù)源和分析),但沒有 API 和 SDK,則無法實(shí)現(xiàn)真正??的數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)結(jié)構(gòu)是指架構(gòu)設(shè)計(jì),而不是單一的技術(shù)。架構(gòu)的一些定義特征是組件之間的互操作性和集成就緒性。
組織了解其合規(guī)性和監(jiān)管要求也很重要。數(shù)據(jù)結(jié)構(gòu)架構(gòu)可以提高安全性、治理和法規(guī)遵從性。
由于數(shù)據(jù)不會(huì)分散在系統(tǒng)中,因此敏感數(shù)據(jù)暴露的威脅較小。話雖如此,在實(shí)施數(shù)據(jù)結(jié)構(gòu)之前了解合規(guī)性和法規(guī)要求非常重要。不同的數(shù)據(jù)類型可能屬于不同的監(jiān)管管轄范圍。一種解決方案是使用自動(dòng)化合規(guī)策略來確保數(shù)據(jù)轉(zhuǎn)換符合法律。
數(shù)據(jù)結(jié)構(gòu)用例
數(shù)據(jù)結(jié)構(gòu)有許多不同的用途,但有一些非常常見。一個(gè)這樣的常見示例是地理上不同的數(shù)據(jù)資產(chǎn)的虛擬/邏輯集合,以促進(jìn)訪問和分析。在這種情況下,數(shù)據(jù)結(jié)構(gòu)通常用于集中式業(yè)務(wù)管理。由于通過傳統(tǒng)應(yīng)用程序和數(shù)據(jù)訪問/查詢接口支持收集和使用數(shù)據(jù)的分布式線路操作,因此對(duì)其活動(dòng)進(jìn)行區(qū)域或國家分割的組織可以獲得很多。這些組織通常需要集中管理和協(xié)調(diào)。
數(shù)據(jù)結(jié)構(gòu)的另一個(gè)主要用例是在合并或收購之后建立統(tǒng)一的數(shù)據(jù)模型。當(dāng)這些發(fā)生時(shí),以前獨(dú)立組織的數(shù)據(jù)庫和數(shù)據(jù)管理策略經(jīng)常發(fā)生變化,這意味著跨組織邊界收集信息變得更加困難。數(shù)據(jù)結(jié)構(gòu)可以通過創(chuàng)建統(tǒng)一的數(shù)據(jù)視圖來克服這一問題,從而使組合實(shí)體能夠在單個(gè)數(shù)據(jù)模型上進(jìn)行協(xié)調(diào)。