在開始正文之前,首先來介紹一下九章云極DataCanvas。
九章云極DataCanvas主要致力于人工智能基礎(chǔ)軟件的研發(fā),為企業(yè)的AI建設(shè)提供平臺(tái)產(chǎn)品和配套的解決方案,幫助企業(yè)完成數(shù)智化轉(zhuǎn)型。目前在政府、金融、通信、制造、能源、交通、航空等多個(gè)領(lǐng)域都有著非常多的成功案例。
一、AIGC用于結(jié)構(gòu)化數(shù)據(jù)合成
依賴于大模型的參數(shù)量的增長(zhǎng),自去年11 月份ChatGPT發(fā)布以來,大語言模型涌現(xiàn)出了非常優(yōu)秀的能力,包括對(duì)文本語義的理解、語義的搜索和語言組織的能力。并且開放給終端用戶,為大眾提供了更多AI發(fā)展的想象空間。
ChatGPT 在AIGC里面更多是以文本的內(nèi)容生成為主,這兩年我們實(shí)驗(yàn)室主要是在因果推斷方面投入了大量的精力進(jìn)行研究和落地。
因果推斷主要指如何去科學(xué)地識(shí)別變量之間的因果關(guān)系,以及量化變量之間的因果影響。目前主流的研究方向一是潛在結(jié)果框架,二是結(jié)構(gòu)因果模型。
AIGC目前主要是面向于非結(jié)構(gòu)化內(nèi)容生成,包括文本、圖片、音頻、視頻等。如何將因果學(xué)習(xí)和AIGC連接起來是一個(gè)值得思考的問題。我們發(fā)現(xiàn)可以借助數(shù)據(jù)合成這一橋梁,讓 AIGC 的能力拓展到結(jié)構(gòu)化數(shù)據(jù)合成,從而實(shí)現(xiàn)因果推斷和AIGC兩個(gè)方向研究的相互助力。
Gartner 提出了合成數(shù)據(jù)的趨勢(shì)報(bào)告,預(yù)計(jì)到2030 年,在 AI、機(jī)器學(xué)習(xí)領(lǐng)域,合成數(shù)據(jù)將會(huì)完全超越真實(shí)數(shù)據(jù)。圖表中可以看到,未來合成數(shù)據(jù)將會(huì)呈指數(shù)級(jí)增長(zhǎng),成為一個(gè)大的發(fā)展方向。
對(duì)于企業(yè)來說,數(shù)據(jù)是智能化建設(shè)的生命線,企業(yè)獲取高質(zhì)量的數(shù)據(jù)往往存在比較大的挑戰(zhàn)。比如部分業(yè)務(wù)場(chǎng)景受限于成本的約束,很多數(shù)據(jù)無法收集;在金融、醫(yī)療領(lǐng)域,出于隱私保護(hù)的要求,很多數(shù)據(jù)也是受限使用的;在計(jì)算機(jī)視覺中,正樣本比較少,往往需要通過數(shù)據(jù)增強(qiáng)補(bǔ)充樣本;新興AI 用例產(chǎn)生時(shí)沒有歷史數(shù)據(jù)積累,這時(shí)如何進(jìn)行場(chǎng)景的驗(yàn)證也是一大挑戰(zhàn)。針對(duì)這些挑戰(zhàn),合成數(shù)據(jù)在企業(yè)的AI 能力建設(shè)當(dāng)中,會(huì)發(fā)揮非常大的補(bǔ)充作用和優(yōu)勢(shì)。
合成數(shù)據(jù)主要有兩類方法,一類是以數(shù)據(jù)驅(qū)動(dòng)為主,包括對(duì)抗生成網(wǎng)絡(luò)、VAE方法、貝葉斯網(wǎng)絡(luò)、ML-base等;另外一類是以過程驅(qū)動(dòng),包括Agent-based modeling、離散事件模擬、數(shù)值模擬和蒙特卡羅方法等。其中Agent-based modeling非常適合作為橋梁,幫助我們完成AIGC向結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)化。
ABM是一種用來模擬具有自主意識(shí)的智能體的行動(dòng)和相互作用的計(jì)算模型,評(píng)估智能體在系統(tǒng)當(dāng)中的作用。它的任務(wù)主要有兩種,一種是分析宏觀發(fā)生的現(xiàn)象的原因;一種是推演,基于微觀干預(yù)的手段預(yù)期表現(xiàn)的基礎(chǔ)上,推演未來宏觀方面的表現(xiàn)。ABM有不少別名,比如 IBM、MAS都屬于ABM 的范式,只是在不同時(shí)間點(diǎn)和領(lǐng)域的不同名稱。
ABM建模范式首先是對(duì)系統(tǒng)組件、操作、交互和環(huán)境的抽象,形成仿真系統(tǒng),其中agent 智能體是核心組成單元。比如在金融行業(yè)agent仿真系統(tǒng),對(duì)公對(duì)私客戶都可以作為agent 的單元。第二個(gè)抽象是大環(huán)境,可以想象在金融環(huán)境的整體下,總的市場(chǎng)規(guī)??蛻?、人均收入水平,都可以視為環(huán)境內(nèi)部實(shí)際要素。另外一個(gè)關(guān)鍵點(diǎn)是在個(gè)體之間有相應(yīng)的連接和交互,譬如有個(gè)體和個(gè)體之間的交互,也有個(gè)體和環(huán)境之間的交互,也是 ABM 研究的關(guān)鍵步驟之一。
ABM很多優(yōu)秀特性,這里只列出了最重要的三點(diǎn)。
首先是強(qiáng)大的仿真性,不管是社會(huì)、生態(tài)還是組織都是非常復(fù)雜的,ABM可以承載復(fù)雜的表達(dá),曾有學(xué)者提出ABM可以仿真一座完整城市,它為整個(gè)數(shù)據(jù)基礎(chǔ)和研究提供了非常好的可靠性空間。
第二ABM具有涌現(xiàn)屬性,其主要目的是解釋涌現(xiàn)現(xiàn)象的原因,比如搶購效應(yīng)會(huì)加劇客戶購買意愿,這就屬于ABM的研究范式和目標(biāo)場(chǎng)景。
第三個(gè)重要的特性就是解釋性。在機(jī)器學(xué)習(xí)、因果學(xué)習(xí)中,很多專家都非常關(guān)注解釋性,ABM 研究范式是從業(yè)務(wù)經(jīng)驗(yàn)假設(shè)基礎(chǔ)出發(fā),所以解釋性非常強(qiáng)。
綜上來看,ABM適合作為AI 載體,實(shí)現(xiàn) AIGC 對(duì)結(jié)構(gòu)化數(shù)據(jù)生成的拓展。接下來將介紹我們已經(jīng)做的一些嘗試和探索。
二、結(jié)構(gòu)化數(shù)據(jù)合成助力因果推斷
回顧因果推斷的常見任務(wù),主要包括因果發(fā)現(xiàn)、因果量的識(shí)別、因果效應(yīng)估計(jì)、反事實(shí)推斷以及策略學(xué)習(xí)等方面。在企業(yè)宏觀經(jīng)濟(jì)分析當(dāng)中,有很多實(shí)際案例,比如電商領(lǐng)域異質(zhì)化產(chǎn)品推薦,就是因果效應(yīng)估計(jì)的一種常見場(chǎng)景。工業(yè)界落地比較有代表性的算法包括 Meta Learner 、DML ,以及 Causal Forest 等算法。另外一個(gè)比較大的研究方向是因果發(fā)現(xiàn),主要思想是尋找發(fā)生結(jié)果的原因,目前該方向更偏向于因果定性的研究范式。合成數(shù)據(jù)可以應(yīng)用在上面提到的所有任務(wù)當(dāng)中,并且有更廣泛的應(yīng)用方向,后面將著重介紹幾個(gè)在因果發(fā)現(xiàn)和因果效應(yīng)估計(jì)方面增強(qiáng)驗(yàn)證上的示例。
在因果推斷任務(wù)里比較大的一項(xiàng)挑戰(zhàn)是反事實(shí)問題。干預(yù)策略實(shí)施后,我們僅能觀測(cè)到實(shí)施狀態(tài)下的結(jié)果,未干預(yù)狀態(tài)下的潛在結(jié)果是無法觀測(cè)的,無法觀測(cè)到的潛在結(jié)果,通常稱為反事實(shí)結(jié)果。比如商店給客戶發(fā)優(yōu)惠券的場(chǎng)景,假如給一位用戶發(fā)了優(yōu)惠券,我們只能知道他收到優(yōu)惠券之后的反應(yīng),沒有辦法再去知道他沒有收到優(yōu)惠券的反應(yīng),這就是反事實(shí)不可觀測(cè)問題,該問題為因果效應(yīng)的度量帶來了一定的影響。應(yīng)對(duì)該問題,目前主要手段是隨機(jī)實(shí)驗(yàn)AB-test;另外,在觀測(cè)樣本上,受限于沒法看到反事實(shí)的真實(shí)值,因此對(duì)于因果效應(yīng)的估計(jì)目標(biāo),潛在結(jié)果和現(xiàn)在真實(shí)結(jié)果之間的差值是沒有辦法獲得的,導(dǎo)致我們通常用的MSE 指標(biāo)沒有辦法應(yīng)用在這種任務(wù)上,因此會(huì)采用AUUC指標(biāo)去替代因果效應(yīng)度量,但會(huì)有一定的局限性。
這里可以思考兩個(gè)問題,第一個(gè)問題,是否可以獲取反事實(shí)樣本,第二個(gè)問題,如果可以獲取反事實(shí)樣本,我們可以做些什么。ABM 多智能體系統(tǒng)建模中,它的運(yùn)行模式就是在不同參數(shù)組合下去進(jìn)行仿真運(yùn)行,運(yùn)行過程當(dāng)中就可以輸出數(shù)據(jù)。比如外呼團(tuán)隊(duì) ABM 系統(tǒng),它可以輸出類似于外呼記錄、成交記錄、TSR 屬性、客戶屬性等等各種業(yè)務(wù)上的記錄表,這些數(shù)據(jù)可以存儲(chǔ)下來形成數(shù)據(jù)集,甚至可以按照數(shù)倉模式去構(gòu)建完整的數(shù)據(jù)體系。另外,ABM在不同參數(shù)組合下運(yùn)行時(shí),本身是一種反事實(shí)運(yùn)行模式,因此可以將反事實(shí)運(yùn)行模式結(jié)果保存下來。
從圖中可以看到,通過系統(tǒng)以及產(chǎn)出數(shù)據(jù),首先,可以獲取反事實(shí)數(shù)據(jù);其次,可以從系統(tǒng)里面拿到完整的預(yù)置因果關(guān)系;再次,可以獲取全部因子特征;最后,還可以獲得時(shí)序類反事實(shí)數(shù)據(jù),比如模擬業(yè)務(wù)運(yùn)行一兩年后的因果效應(yīng)影響。
綜上所述,ABM具有很多優(yōu)質(zhì)特性,最重要的三點(diǎn)就是反事實(shí)可獲取、仿真性和特征完整性。同時(shí)它的可控制性也比較強(qiáng),可以有一些宏觀干預(yù)和微觀干預(yù),比如為所有用戶提供折扣,或者為某些客戶提供折扣。也可以支持在這個(gè)環(huán)境下去模擬A/B test的運(yùn)行。因此,ABM可以提供非常優(yōu)質(zhì)的數(shù)據(jù)基礎(chǔ),為因果推斷研究起到助力作用。
上圖是我們目前在做的相關(guān)研究。這是一個(gè) ABM 范式的金融系統(tǒng),左圖是系統(tǒng)整體的抽象,右圖是運(yùn)行狀態(tài)。左邊系統(tǒng)內(nèi)將銀行、儲(chǔ)戶、企業(yè)抽象成為智能體代理。環(huán)境主要包括銀行數(shù)量、人口數(shù)量、企業(yè)數(shù)量以及監(jiān)管管控策略。宏觀監(jiān)管參數(shù)包括最低準(zhǔn)備金率、無風(fēng)險(xiǎn)收益率、杠桿率來限制銀行經(jīng)營(yíng)指標(biāo)。交互行為主要是儲(chǔ)戶和銀行之間的存款與取款行為,以及企業(yè)和銀行之間的貸款行為。
右圖是系統(tǒng)的運(yùn)行態(tài),首先它可以在不同宏觀參數(shù)情況下去運(yùn)行和仿真模擬,ABM的一種研究范式是做涌現(xiàn)分析,比如最下邊是我們驗(yàn)證的一組參數(shù),在資本充足率要求比較低的情況下,很容易會(huì)涌現(xiàn)系統(tǒng)性金融風(fēng)險(xiǎn),比如銀行擠兌。當(dāng)然,這屬于負(fù)向的涌現(xiàn)分析,實(shí)際業(yè)務(wù)中更常見的是正向的涌現(xiàn)分析。
另外一種研究模式是校準(zhǔn),如何去通過找出相應(yīng)因子或因子范圍,能還原更真實(shí)的業(yè)務(wù)場(chǎng)景。并在這種參數(shù)情況下去進(jìn)行干預(yù)和推演,形成本身的研究范式??梢钥吹?,所有數(shù)據(jù)都可以存下來,可實(shí)現(xiàn)上面提到的反事實(shí)數(shù)據(jù)獲取、特征完整性等特性。
下面來介紹一些數(shù)據(jù)合成與因果學(xué)習(xí)結(jié)合的應(yīng)用場(chǎng)景。
第一個(gè)場(chǎng)景是因果發(fā)現(xiàn)方向。上圖中左邊部分是從系統(tǒng)里面獲取預(yù)置因果關(guān)系,右邊是結(jié)合了三種因果發(fā)現(xiàn)算法。我們能夠直觀感覺到這兩者有一定差異。因此當(dāng)前因果發(fā)現(xiàn)算法,還有一定提升空間。從數(shù)據(jù)中,我們觀測(cè)到幾點(diǎn),首先,在業(yè)務(wù)上有些事情不會(huì)發(fā)生,它會(huì)一直處于一個(gè)狀態(tài)即常量值,對(duì)于常量值目前沒辦法去學(xué)習(xí)其間的因果關(guān)系;其次,算法識(shí)別的因果關(guān)系,會(huì)出現(xiàn)一些因果關(guān)系的缺失或因果反向或錯(cuò)誤因果關(guān)系等情況,如果采用單一算法去做因果發(fā)現(xiàn)的話,有一定局限性,因此建議采用多種因果發(fā)現(xiàn)算法相融合,才能最大限度地學(xué)到真實(shí)的因果關(guān)系。
應(yīng)用多智能體建模數(shù)據(jù)合成的優(yōu)勢(shì)在于,首先成本可控,可以獲取預(yù)置因果關(guān)系,同時(shí)也可以獲取完整特征,不存在不可觀測(cè)的特征。在應(yīng)用領(lǐng)域上可以驗(yàn)證各種算法精度,可以論證算法融合的最佳模式,并在未來應(yīng)用在真實(shí)場(chǎng)景上。綜上,合成數(shù)據(jù)可以為因果發(fā)現(xiàn)提供非常好的研究數(shù)據(jù)基礎(chǔ)。
第二個(gè)方向是因果效應(yīng)估計(jì)方向研究。在沒有反事實(shí)情況下,我們往往用一些替代方法去評(píng)價(jià)因果效應(yīng)精度,比如A/B test。但實(shí)際業(yè)務(wù),并不允許所有場(chǎng)景企業(yè)都會(huì)去做 A/B test,一方面原因是A/B test有一定的現(xiàn)實(shí)成本問題,某些場(chǎng)景甚至是倫理問題;另一方面,A/B test僅能評(píng)估群體效應(yīng),無法評(píng)估個(gè)體效應(yīng),具有較強(qiáng)的局限性。
通過ABM可以獲取反事實(shí)樣本,基于反事實(shí)樣本的評(píng)價(jià)指標(biāo)具有以下優(yōu)勢(shì):
可以采用 MSE等常見指標(biāo)來論證算法有效性。
可以突破性地去驗(yàn)證個(gè)體治療效果。
可以論證 A/B test、AUUC、Qini等方法的有效性。
同時(shí),在環(huán)境中也具有比較高的可控性,甚至可以去仿真模擬一些有偏無偏的數(shù)據(jù)場(chǎng)景。
我們?cè)趲в蟹词聦?shí)的公開數(shù)據(jù)集上去做了一些驗(yàn)證,主要是評(píng)估AUUC 、Qini以及 RLoss三個(gè)指標(biāo)的有效性。發(fā)現(xiàn)在連續(xù)型 outcome 場(chǎng)景下, RLoss指標(biāo)有更高的穩(wěn)定性。多智能體系統(tǒng)產(chǎn)生的反事實(shí)數(shù)據(jù)可以指導(dǎo)因果推斷的研究,也可以助力場(chǎng)景落地。
在算法應(yīng)用和研發(fā)當(dāng)中,獲取到這些智能體合成數(shù)據(jù)后,該如何去應(yīng)用呢?以因果效應(yīng)估計(jì)場(chǎng)景為例。圖中第一行,是常見模式(沒有考慮拆驗(yàn)證集),在訓(xùn)練階段用 train data 做訓(xùn)練,在評(píng)估階段用test data去做評(píng)估驗(yàn)證。沒有反事實(shí)樣本情況下,對(duì)于因果效應(yīng)估計(jì)的評(píng)估方法只能才用AUUC、Qini、RLoss 等指標(biāo);第二行,是一個(gè)有反事實(shí)樣本的例子,首先在評(píng)估階段,可以加入反事實(shí)樣本,評(píng)價(jià)指標(biāo)可以擴(kuò)展到MSE、RMSE等常用評(píng)價(jià)指標(biāo);第三行,甚至可以在訓(xùn)練階段加入反事實(shí)樣本,這對(duì)整個(gè)因果方法研發(fā),提供了幾乎完美的數(shù)據(jù)基礎(chǔ)。ABM提供的數(shù)據(jù)資產(chǎn),不僅在因果推斷領(lǐng)域,在其他領(lǐng)域研究也同樣具有適用性,包括深度學(xué)習(xí)、機(jī)器學(xué)習(xí),還有譬如因果里面的IV方法。
三、如何利用因果推斷幫助Agent-Based Modeling
利用因果推斷去幫助 Agent-based modeling多智能體建模有著比較廣泛的應(yīng)用領(lǐng)域,這里列出了其中幾個(gè)常見的場(chǎng)景。比如內(nèi)部數(shù)據(jù)使用有限制,歷史數(shù)據(jù)缺乏等情況,可以進(jìn)行數(shù)據(jù)補(bǔ)充和增強(qiáng);可以進(jìn)行宏觀涌現(xiàn)的原因分析,以銀行或者保險(xiǎn)外呼團(tuán)隊(duì)場(chǎng)景為例,希望分析譬如團(tuán)隊(duì)規(guī)模、小組人數(shù)、員工流失情況,對(duì)于整個(gè)業(yè)務(wù)部門指標(biāo)的影響,進(jìn)而形成對(duì)應(yīng)薄弱環(huán)節(jié)的改進(jìn)建議。這些都是 ABM 研究范式在業(yè)務(wù)場(chǎng)景落地的模式。
在任務(wù)目標(biāo)上,分析任務(wù)和推演任務(wù)是ABM兩大主要方向。從層次上來說,它既能涵蓋微觀,也能涵蓋宏觀。比如,外呼團(tuán)隊(duì)場(chǎng)景,微觀層面包含了客戶、外呼員,以及他們之間的交互行為(之間的通話)。宏觀層面拆分,有多個(gè) agent 組成小組存在,宏觀層面也有相應(yīng)的參數(shù)和指標(biāo),更注重解釋涌現(xiàn)發(fā)生的原因。ABM既支持宏觀分析,也支持微觀分析。從宏觀視角來看,進(jìn)行一些干預(yù),比如按照小組模式去整體采取不同名單分派策略,看一下外呼團(tuán)隊(duì)整體業(yè)績(jī)效益;從微觀視角來看,比如做一些差異化激勵(lì)政策,推演團(tuán)隊(duì)整體業(yè)績(jī)效益。
應(yīng)用因果發(fā)現(xiàn)方法,助力ABM涌現(xiàn)分析任務(wù)。上圖展示了ABM 建模流程,包含模型定義、仿真運(yùn)行、校準(zhǔn)和數(shù)據(jù)生成,以及相應(yīng)參數(shù)分析和涌現(xiàn)分析。首先可以將因果圖方法應(yīng)用到參數(shù)分析上,并且可以融合敏感性分析、機(jī)器學(xué)習(xí)方法等,對(duì)參數(shù)和關(guān)注指標(biāo)原因進(jìn)行量化,以及相應(yīng)解釋。輔助用戶進(jìn)行更好的做校準(zhǔn),以及涌現(xiàn)分析相應(yīng)解釋。
應(yīng)用因果效應(yīng)估計(jì),助力并加速ABM任務(wù)校準(zhǔn)過程。校準(zhǔn)過程在 ABM 整個(gè)運(yùn)行參數(shù)空間也是非常龐大的。譬如100 個(gè)不同參數(shù),它們當(dāng)中有大量連續(xù)性參數(shù),空間是非??植赖?,而且每一次運(yùn)行過程都非常耗時(shí),尋求最優(yōu)組合空間也是一個(gè)相當(dāng)耗時(shí)的過程。如果應(yīng)用因果效應(yīng)估計(jì),首先可以在已經(jīng)運(yùn)行過的參數(shù)空間空間之上,去訓(xùn)練因果效應(yīng)估計(jì)模型,基于此基礎(chǔ)之上,進(jìn)行類似于進(jìn)化方法,在里面去相應(yīng)地調(diào)整一些變量,讓目標(biāo)指標(biāo)更接近于校準(zhǔn)參數(shù)指標(biāo)。另外可以通過反事實(shí)方法,抽樣一批新參數(shù)出來,基于模型基礎(chǔ)上,對(duì)新抽樣參數(shù)組合空間里面去做反事實(shí)推斷,判斷哪些參數(shù)組合更有效,之后再去做運(yùn)行和校準(zhǔn)過程。
目前我們團(tuán)隊(duì)更關(guān)注的是AIGC對(duì)結(jié)構(gòu)化數(shù)據(jù)的生成和對(duì)因果推斷的助力,當(dāng)然因果推斷其實(shí)也可以反過來助力 AIGC對(duì)結(jié)構(gòu)化數(shù)據(jù)的生成。
四、YLearn介紹
最后分享一下YLearn因果學(xué)習(xí)軟件。
YLearn倒過來是learn why,這正是它的初衷和含義。框架核心目標(biāo)是提供簡(jiǎn)單易用的一站式因果推斷框架。YLearn的模塊覆蓋了基本全部因果推斷主流任務(wù)類型,包括因果發(fā)現(xiàn)、因果圖、因果效應(yīng)估計(jì)、策略學(xué)習(xí)、Interpreter以及反事實(shí)預(yù)測(cè)。其中因果效應(yīng)估計(jì)包含了現(xiàn)在常見的主流算法,比如Meta Learner、Causal Tree, Causal Forest等等。同時(shí)也做了整體封裝的統(tǒng)一接口,可以一站式地完成大部分因果建模任務(wù)。
這是一個(gè)因果效應(yīng)估計(jì)的例子。對(duì)于給定的數(shù)據(jù)集,定義treatment 是哪個(gè)變量, outcome 是哪個(gè)變量,調(diào)用對(duì)應(yīng)的 feed 方法,進(jìn)行模型訓(xùn)練,就可以做因果效應(yīng)評(píng)估。
第二個(gè)是因果圖方向,比如左邊代碼,用戶只需要加載數(shù)據(jù)集,通過 Causal Discovery 接口就可以進(jìn)行因果發(fā)現(xiàn)??蚣苤С志€性、非線性的多種因果發(fā)現(xiàn)算法。右邊部分,提供了因果圖的功能,包括因果圖的定義、可視化,以及因果量識(shí)別方法。
下方案例主要是通過后門調(diào)整去識(shí)別 treatment x,以及outcome y的因果效應(yīng),結(jié)果可以輸出后門變量。
最后介紹一下統(tǒng)一接口why。這個(gè)接口是對(duì) YLearn 內(nèi)部組件的統(tǒng)一封裝,覆蓋了因果推斷相關(guān)的所有任務(wù),僅需要通過一個(gè)why的實(shí)例,就可以去實(shí)現(xiàn)因果發(fā)現(xiàn)、因果效應(yīng)估計(jì)、whatif反事實(shí)推斷,interpreter因果解釋等因果推斷任務(wù)。
YLearn的核心目標(biāo)就是幫助建模人員在一個(gè)工具內(nèi)完成因果推斷的全部任務(wù),避免使用多個(gè)框架的切換。