自從OpenAI公司研發(fā)的機(jī)器人聊天程序ChatGPT在2022年11月30日發(fā)布以來,在全世界迅速帶起了熱潮。ChatGPT是AI大模型驅(qū)動的自然語言處理工具,能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計規(guī)律,來生成回答,還能根據(jù)聊天的上下文進(jìn)行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務(wù)。
目前,ChatGPT背后的大模型及其應(yīng)用已成為AI研究和應(yīng)用的熱點。部分專家和學(xué)者提出,數(shù)字化的下一階段是智能化,而AI大模型及其應(yīng)用是推動數(shù)字化轉(zhuǎn)型持續(xù)深化的引擎。
AI大模型在數(shù)字化轉(zhuǎn)型中的地位和作用還處于持續(xù)的探索之中。筆者在之前的文章中,已經(jīng)描述了數(shù)字化轉(zhuǎn)型的基本概念和方法論。那么,在我們建立的知識體系當(dāng)中,AI大模型應(yīng)當(dāng)處于什么位置,當(dāng)前和未來將會發(fā)揮什么作用呢?
1.AI大模型與“以數(shù)據(jù)為中心的業(yè)務(wù)變革”
一直以來,我們提到,數(shù)字化轉(zhuǎn)型分為“業(yè)務(wù)活動步驟化”、“步驟環(huán)節(jié)要素化”、“要素數(shù)據(jù)規(guī)格化”和“以數(shù)據(jù)為中心的業(yè)務(wù)變革”四個階段。業(yè)務(wù)活動經(jīng)過前三階段,逐步形成了規(guī)范化的業(yè)務(wù)運行數(shù)據(jù)。對于以數(shù)據(jù)為中心的AI大模型而言,其在數(shù)字化轉(zhuǎn)型中的應(yīng)用理所應(yīng)當(dāng)處于“以數(shù)據(jù)為中心的業(yè)務(wù)變革”階段,屬于《“以數(shù)據(jù)為中心的業(yè)務(wù)變革”之三種范式》中的第三種范式“系統(tǒng)數(shù)字化、規(guī)則數(shù)字化、模型和業(yè)務(wù)相互驅(qū)動”:適合無明確的現(xiàn)有規(guī)則或僅依靠現(xiàn)有規(guī)則不足以支撐業(yè)務(wù)運行、主觀性強(qiáng)、容錯性高的應(yīng)用場景,由于其技術(shù)特點,暫無法滿足業(yè)務(wù)規(guī)則專業(yè)型強(qiáng)、復(fù)雜度高的場景。
對于AI大模型在復(fù)雜專業(yè)領(lǐng)域的應(yīng)用,在此舉個栗子:
數(shù)學(xué)家陶哲軒認(rèn)為ChatGPT是“數(shù)學(xué)菜雞”,但在開展研究工作時,仍然很好地利用ChatGPT作為研究助理,包括以下三個步驟:1.明確GPT4的身份是“一個擅長給技巧性建議的數(shù)學(xué)合作專家”,目標(biāo)是“提出一些建議”而非解決問題;2.使用Markdown輕量級標(biāo)記語言而非數(shù)學(xué)算式來描述數(shù)學(xué)問題,便于GPT4理解;3.將問題描述中,涉及需要GPT-4自己查找資料的部分轉(zhuǎn)變?yōu)橐米⑨?,并在結(jié)尾給出網(wǎng)址。相比讓GPT-4直接化身數(shù)學(xué)家去“解決問題”,陶哲軒把它當(dāng)做一個提供靈感來源的“專家”,給自己提供研究方向的建議,很大程度提高了數(shù)學(xué)家研究工作的效率。
陶哲軒使用GPT-4的經(jīng)驗是:1.不要讓AI直接回答問題,因為這幾乎肯定會得到一些看起來專業(yè)的廢話;2.AI大模型擅長半成品的語義搜索工作,在巧妙的問題內(nèi)容和格式設(shè)計下,可以成為科學(xué)家的合作者,提供有價值的策略建議。
在現(xiàn)實中,部分企業(yè)領(lǐng)導(dǎo)在缺乏對業(yè)務(wù)生產(chǎn)線深入調(diào)研和理解,并且同樣缺乏對大模型技術(shù)特點和應(yīng)用場景理解的基礎(chǔ)上,僅被PPT忽悠,就認(rèn)為AI大模型具有完全替代專業(yè)領(lǐng)域工作人員的能力,盲目推動一些高投入的項目上馬,其前景可想而知。
2.AI大模型與知識管理
上一節(jié)提到,AI大模型擅長半成品的語義搜索工作,在巧妙的問題內(nèi)容和格式設(shè)計下,可以成為業(yè)務(wù)人員的合作者,提供有價值的策略建議,從而為業(yè)務(wù)活動創(chuàng)造便利,達(dá)到“降本增效”的效果。
看到這一點,不知道一直關(guān)注本號的讀者有沒有聯(lián)想到什么?對了,就是“知識管理”。在《數(shù)字化轉(zhuǎn)型企業(yè)需要什么樣的知識管理》中,我們提到:業(yè)務(wù)“數(shù)字化”后其運行規(guī)則發(fā)生的變化稱為知識數(shù)字化。知識數(shù)字化作為業(yè)務(wù)規(guī)則與業(yè)務(wù)“數(shù)字化”之間的橋梁,是數(shù)字化轉(zhuǎn)型企業(yè)的業(yè)務(wù)引擎。知識數(shù)字化依賴有效的知識管理來實現(xiàn),知識管理的目標(biāo)是:1.通過實施管理活動,將企業(yè)運行過程中積累的智力成果有效轉(zhuǎn)化為業(yè)務(wù)運行規(guī)則并動態(tài)更新;2.將業(yè)務(wù)規(guī)則與業(yè)務(wù)活動本身緊密耦合,以便在業(yè)務(wù)活動的任何環(huán)節(jié)和階段有效運用規(guī)則。這其中涉及兩方面內(nèi)容,一是對業(yè)務(wù)運行規(guī)則也就是知識的積累和管理;二是對知識的應(yīng)用。
而AI大模型作為業(yè)務(wù)人員的合作者,擁有大量模型參數(shù),在海量業(yè)務(wù)數(shù)據(jù)的訓(xùn)練下,一方面可以自動化實現(xiàn)業(yè)務(wù)運行規(guī)則的有效積累、集成和管理,另一方面在知識數(shù)字化、范式化、模板化、模型化的基礎(chǔ)上,還實現(xiàn)了知識的按需提供、集成化展示和智能推薦。
從知識管理的角度,AI大模型在數(shù)字化轉(zhuǎn)型企業(yè)知識數(shù)字化、范式化、模板化、模型化的基礎(chǔ)上,實現(xiàn)了知識管理的自動化和知識應(yīng)用的智能化。
3.AI大模型與數(shù)據(jù)安全
筆者認(rèn)為,企業(yè)在準(zhǔn)備深度應(yīng)用AI大模型之前,首先要考慮清楚一個問題——數(shù)據(jù)安全。這里讀者可能會有疑問:數(shù)據(jù)安全只是數(shù)據(jù)治理工作的一部分,在這一場景下為什么要首先考慮?在此先給出結(jié)論:企業(yè)對自身業(yè)務(wù)數(shù)據(jù)安全的考慮,將對AI大模型的建設(shè)和應(yīng)用模式產(chǎn)生決定性影響。
從技術(shù)上講,AI大模型本質(zhì)上是一個使用海量數(shù)據(jù)訓(xùn)練而成的深度神經(jīng)網(wǎng)絡(luò)模型。其巨大的數(shù)據(jù)和參數(shù)規(guī)模,實現(xiàn)了智能的涌現(xiàn),展現(xiàn)出類似人類的智能。AI大模型在理解能力、推理能力、創(chuàng)作能力上的突破,建立在大量級、高質(zhì)量的訓(xùn)練數(shù)據(jù)基礎(chǔ)上。據(jù)稱GPT-3模型使用了不少于45TB的原始數(shù)據(jù)和570GB的預(yù)處理數(shù)據(jù),GPT-4模型使用的數(shù)據(jù)則更多。而企業(yè)所需要的垂直領(lǐng)域AI大模型,在多領(lǐng)域、多行業(yè)及多樣性的海量數(shù)據(jù)基礎(chǔ)上,還要將更多的垂直領(lǐng)域知識、業(yè)務(wù)規(guī)則加入模型的訓(xùn)練數(shù)據(jù)集,并需要業(yè)務(wù)領(lǐng)域?qū)<业纳疃葏⑴c。
而用戶在使用AI大模型過程中,需要向大模型提供輸入以獲得期望的輸出。這些持續(xù)不斷的輸入反過來為大模型的改進(jìn)和完善提供了矯正數(shù)據(jù)和反饋信息,從某種程度上講需要提供部分企業(yè)業(yè)務(wù)運行的敏感數(shù)據(jù)、流程和規(guī)則信息。如果企業(yè)完全不能接受這些信息的外泄,就必須自建AI大模型及其應(yīng)用,而這需要較高的資源投入。
一方面,如果企業(yè)能夠接受員工在使用公共AI大模型過程中,向大模型提供企業(yè)運行的部分敏感數(shù)據(jù),也需要進(jìn)一步評估提供數(shù)據(jù)的邊界和方式,并在此基礎(chǔ)上制定相應(yīng)的數(shù)據(jù)安全策略、制度和操作規(guī)程,而這些都是全新的領(lǐng)域。
另一方面,如果企業(yè)自建AI大模型,需要重點解決的是數(shù)據(jù)訪問的權(quán)限問題。簡單的說,就是在各崗位職工普遍使用AI大模型作為業(yè)務(wù)助手的情況下,需要根據(jù)崗位的知悉范圍,對其能夠從企業(yè)自建AI大模型中獲取的數(shù)據(jù)邊界進(jìn)行限制,而這對于大模型提出了更高的技術(shù)和使用管理要求。
4.總結(jié)
在目前AI大模型的行業(yè)應(yīng)用剛剛起步階段,部分企業(yè)領(lǐng)導(dǎo)寄希望大模型能夠一招定勝負(fù),解決企業(yè)發(fā)展的數(shù)字化轉(zhuǎn)型問題的想法是不切實際的。目前,由于數(shù)據(jù)智能的技術(shù)局限性,AI大模型在數(shù)字化轉(zhuǎn)型中的作用尚未突破《“以數(shù)據(jù)為中心的業(yè)務(wù)變革”之三種范式》中第三種范式的邊界。但AI大模型在企業(yè)知識管理領(lǐng)域,可以在知識數(shù)字化、范式化、模板化、模型化的基礎(chǔ)上進(jìn)一步實現(xiàn)知識管理的自動化和知識應(yīng)用的智能化,進(jìn)一步促進(jìn)“降本增效”。而作為數(shù)據(jù)密集型的應(yīng)用,AI大模型為傳統(tǒng)的數(shù)據(jù)安全和數(shù)據(jù)治理也帶來了新的課題和挑戰(zhàn)。