如今,企業(yè)產(chǎn)生和收集的數(shù)據(jù)80%是非結(jié)構(gòu)化數(shù)據(jù),而且這一比例將繼續(xù)增長(zhǎng)。非結(jié)構(gòu)化數(shù)據(jù)的數(shù)量正以每年55%到65%的速度快速攀升。如果沒有合適的工具來分析這些數(shù)據(jù),企業(yè)就會(huì)錯(cuò)過大量為商業(yè)智能提供的信息。但是,重要的是要知道如何利用非結(jié)構(gòu)化數(shù)據(jù)來服務(wù)于企業(yè)更廣泛的目標(biāo)。
什么是非結(jié)構(gòu)化數(shù)據(jù)?
非結(jié)構(gòu)化數(shù)據(jù)是高度可變且不遵循任何明確模式的信息。因此,非結(jié)構(gòu)化數(shù)據(jù)難以標(biāo)記、組織、搜索和最終分析。
非結(jié)構(gòu)化數(shù)據(jù)的示例包括:
分析師報(bào)告
音頻文件
事件日志
地理空間數(shù)據(jù)
圖像
會(huì)議記錄
多媒體數(shù)據(jù)
社交媒體帖子
視頻文件
用戶交互數(shù)據(jù)
非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)有什么區(qū)別?
非結(jié)構(gòu)化數(shù)據(jù)在幾個(gè)關(guān)鍵方面不同于結(jié)構(gòu)化數(shù)據(jù)。雖然非結(jié)構(gòu)化數(shù)據(jù)是可變的,但結(jié)構(gòu)化數(shù)據(jù)由明確定義、一致且可預(yù)測(cè)的數(shù)據(jù)組成,這使得結(jié)構(gòu)化數(shù)據(jù)更易于搜索和獲取信息。
結(jié)構(gòu)化數(shù)據(jù)的示例包括電話號(hào)碼、日期或姓名,可用于餐廳、航空公司和其他可預(yù)訂服務(wù)的銷售交易和在線預(yù)訂系統(tǒng)。
此外,非結(jié)構(gòu)化數(shù)據(jù)位于應(yīng)用程序或NoSQL數(shù)據(jù)庫中,而結(jié)構(gòu)化數(shù)據(jù)位于關(guān)系數(shù)據(jù)庫中。例如,會(huì)議記錄形式的非結(jié)構(gòu)化數(shù)據(jù)可以在Notes或MicrosoftWord等應(yīng)用程序中找到,或者在Instagram中發(fā)布社交媒體帖子中。例如,客戶姓名和交易日期是存在于客戶關(guān)系管理(CRM)系統(tǒng)的關(guān)系數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)。
企業(yè)并不是只選擇一種格式而不選另一種格式的數(shù)據(jù),而是通過將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)一起利用以獲得最佳商業(yè)智能來獲得最大收益。
誰從非結(jié)構(gòu)化數(shù)據(jù)中受益?如何受益?
使用非結(jié)構(gòu)化數(shù)據(jù)的好處包括:
多種信息來源可供借鑒
快速積累豐富的數(shù)據(jù)集
數(shù)據(jù)湖中的巨大存儲(chǔ)容量
更準(zhǔn)確的數(shù)據(jù)可提供更好的商業(yè)智能,因?yàn)榉墙Y(jié)構(gòu)化數(shù)據(jù)占企業(yè)數(shù)據(jù)的四分之三以上
Crux公司首席執(zhí)行官WillFreiburg表示,“企業(yè)的各個(gè)層面都可以從對(duì)非結(jié)構(gòu)化數(shù)據(jù)的適當(dāng)管理中受益,因?yàn)樗S富的洞察力,可以使各種內(nèi)部消費(fèi)者受益。”
例如,F(xiàn)reiburg解釋說,非結(jié)構(gòu)化數(shù)據(jù)可以更好地了解供應(yīng)鏈風(fēng)險(xiǎn)的來源,衡量消費(fèi)者情緒和購買行為,并改進(jìn)運(yùn)營(yíng)流程。
盡管非結(jié)構(gòu)化數(shù)據(jù)對(duì)企業(yè)的各個(gè)部分都具有相關(guān)性和優(yōu)勢(shì),但業(yè)務(wù)領(lǐng)導(dǎo)者不需要在企業(yè)中整體或均勻地使用它。與其相反,他們應(yīng)該以符合業(yè)務(wù)戰(zhàn)略目標(biāo)的有針對(duì)性的方式處理非結(jié)構(gòu)化數(shù)據(jù)。
非結(jié)構(gòu)化數(shù)據(jù)的用例
非結(jié)構(gòu)化數(shù)據(jù)用例適用于銷售和營(yíng)銷、產(chǎn)品開發(fā)和客戶服務(wù)。
(1)銷售和營(yíng)銷
企業(yè)使用非結(jié)構(gòu)化數(shù)據(jù)來識(shí)別客戶購買模式和對(duì)品牌的看法。情感分析是非結(jié)構(gòu)化數(shù)據(jù)獨(dú)有的主要優(yōu)勢(shì)。分析社交媒體帖子、論壇討論和其他媒體可為企業(yè)的銷售和營(yíng)銷業(yè)績(jī)提供背景信息。
非結(jié)構(gòu)化數(shù)據(jù)還為CRM平臺(tái)中的算法提供信息。預(yù)測(cè)分析產(chǎn)生洞察,告知企業(yè)如何預(yù)測(cè)客戶需求。例如,銷售團(tuán)隊(duì)可以根據(jù)洞察力采取行動(dòng),為新客戶提供更好的產(chǎn)品或服務(wù)推薦,或者了解向現(xiàn)有客戶追加銷售的合適時(shí)間。
(2)產(chǎn)品開發(fā)
通過對(duì)客戶論壇、客戶服務(wù)電話和社交媒體的情緒分析,非結(jié)構(gòu)化數(shù)據(jù)可以告知企業(yè)如何改進(jìn)其產(chǎn)品或服務(wù)。
(3)客戶服務(wù)
自動(dòng)聊天機(jī)器人通過將客戶關(guān)注的問題傳遞給可以解決問題的適當(dāng)人員來增強(qiáng)客戶服務(wù)代表。反過來,該信息為上述情緒分析提供信息。
然而,更重要的是,投訴和故障排除對(duì)話為研發(fā)團(tuán)隊(duì)提供了有關(guān)哪些功能運(yùn)行良好、哪些功能運(yùn)行不佳的有用信息。該數(shù)據(jù)為產(chǎn)品開發(fā)提供有關(guān)如何改進(jìn)產(chǎn)品或服務(wù)的信息。
利用非結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)商業(yè)智能的三個(gè)步驟
Crux公司的Freiburg提出了三個(gè)步驟,開始利用非結(jié)構(gòu)化數(shù)據(jù)來獲得更好的商業(yè)智能。
(1)確定非結(jié)構(gòu)化數(shù)據(jù)的具體用途
Freiburg建議管理層“清楚企業(yè)試圖用外部數(shù)據(jù)回答什么問題”。
了解企業(yè)希望如何使用非結(jié)構(gòu)化數(shù)據(jù)是確定使用何種數(shù)據(jù)的第一步。
首先要收集的非結(jié)構(gòu)化數(shù)據(jù)。這反過來將告知要實(shí)施什么樣的大數(shù)據(jù)業(yè)務(wù)解決方案。
(2)簡(jiǎn)化數(shù)據(jù)源
Freiburg建議建立一個(gè)“通用數(shù)據(jù)模型”,以便在數(shù)據(jù)中建立一組真實(shí)性。
由于非結(jié)構(gòu)化數(shù)據(jù)來自各種來源和多種格式,弗萊堡強(qiáng)調(diào)需要“建立高質(zhì)量的數(shù)據(jù)管道,以確保數(shù)據(jù)交付的一致性和及時(shí)性保持不變,無論來源如何。”
(3)為數(shù)據(jù)程序制定路線圖和解決方案
與專門提供高性能質(zhì)量數(shù)據(jù)集成工具和服務(wù)的供應(yīng)商合作。例如,Crux公司擁有數(shù)千個(gè)數(shù)據(jù)集,可以將這些數(shù)據(jù)集集成到其在步驟2中創(chuàng)建的數(shù)據(jù)管道中并發(fā)揮其優(yōu)勢(shì)。
一旦業(yè)務(wù)領(lǐng)導(dǎo)者和數(shù)據(jù)分析師確定了后端,也就是他們?cè)噲D回答的問題以及他們將如何集成數(shù)據(jù)源,他們就需要在前端工作。這意味著他們需要以一種允許通過日常應(yīng)用程序可視化和查詢數(shù)據(jù)的方式嵌入分析。
非結(jié)構(gòu)化數(shù)據(jù)工具提供商
從非結(jié)構(gòu)化數(shù)據(jù)中產(chǎn)生的洞察力不僅僅是神奇地出現(xiàn)。與其相反,它需要特殊的工具來處理數(shù)據(jù),然后才能產(chǎn)生任何有意義的知識(shí)。市場(chǎng)上流行的非結(jié)構(gòu)化數(shù)據(jù)工具提供商包括:
Accenture
Azure
Crux
DynamoDB
Hadoop
MongoDB
為什么非結(jié)構(gòu)化數(shù)據(jù)對(duì)商業(yè)智能很重要?
結(jié)構(gòu)化數(shù)據(jù)只講述了企業(yè)試圖理解的問題的一小部分,準(zhǔn)確地說只有20%。
另一方面,非結(jié)構(gòu)化數(shù)據(jù)占企業(yè)數(shù)據(jù)的80%,并且來自多種不同格式的各種來源。因此,它為企業(yè)描繪了一幅更全面的圖景,以幫助他們更好地理解和解決他們的挑戰(zhàn)。
非結(jié)構(gòu)化數(shù)據(jù)確實(shí)更難分析。然而,企業(yè)通過這樣做獲得的大量信息使得非結(jié)構(gòu)化數(shù)據(jù)分析工具非常值得投資。
因此,企業(yè)必須通過非結(jié)構(gòu)化數(shù)據(jù)來定義他們尋求回答的問題或挑戰(zhàn),集成和簡(jiǎn)化各種數(shù)據(jù)源,并使用正確的工具來幫助分析和可視化它以獲得更好的商業(yè)智能。