新模型,新風(fēng)險(xiǎn):如何有效管理機(jī)器學(xué)習(xí)與人工智能?
利用海量數(shù)據(jù)所構(gòu)建的模型,機(jī)器學(xué)習(xí)和人工智能將優(yōu)化商業(yè)決策,提供定制服務(wù),改進(jìn)風(fēng)險(xiǎn)管理。兩者帶來的優(yōu)勢也注定會(huì)為銀行業(yè)帶來翻天覆地的變化。麥肯錫全球研究院的數(shù)據(jù)顯示,這些技術(shù)的應(yīng)用有望為銀行業(yè)創(chuàng)造超過2500億美元的價(jià)值。
但是,機(jī)器學(xué)習(xí)模型的應(yīng)用也放大了某些傳統(tǒng)模式下的風(fēng)險(xiǎn)。目前,大多數(shù)銀行在對模型風(fēng)險(xiǎn)進(jìn)行評估和管理時(shí),采用的都是傳統(tǒng)風(fēng)險(xiǎn)管理模式下相對成熟的模型驗(yàn)證框架。這些傳統(tǒng)做法雖然能夠滿足監(jiān)管合規(guī)要求,但仍不足以有效管理與機(jī)器學(xué)習(xí)模型相關(guān)的新型風(fēng)險(xiǎn)。
考慮到其管理難度,多數(shù)銀行都在謹(jǐn)慎前行。比如,它們會(huì)試探性地將機(jī)器學(xué)習(xí)模型應(yīng)用于數(shù)字營銷等低風(fēng)險(xiǎn)業(yè)務(wù)中,以測試銀行可能會(huì)面臨的財(cái)務(wù)、聲譽(yù)和監(jiān)管風(fēng)險(xiǎn)。銀行害怕自身會(huì)不知不覺地觸犯反歧視法,從而招致巨額罰款。出于這一擔(dān)憂,一家銀行明令禁止其人力資源部門使用基于機(jī)器學(xué)習(xí)的簡歷篩選器。鑒于上述情況,如果銀行想最大程度地從機(jī)器學(xué)習(xí)模式中受益,更好的、可能也是唯一可持續(xù)的辦法,就是加強(qiáng)模型風(fēng)險(xiǎn)管理。
目前,監(jiān)管機(jī)構(gòu)尚未發(fā)布任何具體章程,來引導(dǎo)企業(yè)如何管理機(jī)器學(xué)習(xí)和人工智能相關(guān)模型。在美國,監(jiān)管機(jī)構(gòu)規(guī)定,銀行必須負(fù)責(zé)管理機(jī)器學(xué)習(xí)模型帶來的所有風(fēng)險(xiǎn)。與此同時(shí),他們也指出,諸如美聯(lián)儲(chǔ)此前頒布的”模型風(fēng)險(xiǎn)管理指南”(Guidance on Model Risk Management)(SR11-7)等現(xiàn)有監(jiān)管準(zhǔn)則的內(nèi)容已足夠?qū)挿海勺髦笇?dǎo)手冊而用。
可喜的是,許多銀行并不需要通過建立全新的模型驗(yàn)證框架,來應(yīng)對機(jī)器學(xué)習(xí)模型的風(fēng)險(xiǎn)。它們大可對現(xiàn)有模型管理的驗(yàn)證框架進(jìn)行一系列補(bǔ)充,以達(dá)到同樣目的和效果。例如,它們可將新模型納入模型清單中,并確定相應(yīng)的風(fēng)險(xiǎn)偏好、風(fēng)險(xiǎn)層級、風(fēng)險(xiǎn)角色、管理職責(zé),以及模型生命周期管理中相關(guān)的模型驗(yàn)證技術(shù)。
新風(fēng)險(xiǎn)、新選擇、新實(shí)踐
近年來,新興機(jī)器學(xué)習(xí)模型產(chǎn)生的負(fù)面新聞并不少見。2016年,算法的逆向反饋機(jī)制直接導(dǎo)致英鎊“閃崩”6%。此外,一輛基于機(jī)器學(xué)習(xí)技術(shù)而研發(fā)的自動(dòng)駕駛汽車,也未能正確識(shí)別并避讓一名推著自行車過馬路的行人。
無論機(jī)器學(xué)習(xí)模型被應(yīng)用于何種行業(yè)或應(yīng)用,這些風(fēng)險(xiǎn)發(fā)生的原因,與所有機(jī)器學(xué)習(xí)模型中風(fēng)險(xiǎn)被放大的原因其實(shí)都相同:即模型復(fù)雜性的大幅增加。機(jī)器學(xué)習(xí)模型通常基于大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù)集(如自然語言、圖像和語音信息等),并使用新的軟件包和特定的計(jì)算基礎(chǔ)架構(gòu)進(jìn)行構(gòu)建。這些算法比傳統(tǒng)的統(tǒng)計(jì)方法要復(fù)雜得多,往往需要在測試訓(xùn)練環(huán)節(jié)開始前,就做好設(shè)計(jì)決定。
然而,模型本身的復(fù)雜并不意味著我們也要采取過度復(fù)雜的應(yīng)對方式。如下圖所示,只要理解得當(dāng),銀行現(xiàn)有的傳統(tǒng)模型驗(yàn)證框架,完全能夠有效管理與機(jī)器學(xué)習(xí)模型相關(guān)的風(fēng)險(xiǎn)。
從上圖中,我們可以清楚地看到,麥肯錫Risk Dynamics模型風(fēng)險(xiǎn)驗(yàn)證和管理團(tuán)隊(duì),對模型驗(yàn)證框架和實(shí)踐方法作出了調(diào)整。這一框架覆蓋了SR11-7的監(jiān)管要求,曾被用于驗(yàn)證銀行業(yè)數(shù)千個(gè)傳統(tǒng)模型。它的審驗(yàn)范圍涵蓋8大風(fēng)險(xiǎn)管理層面,共計(jì)25個(gè)風(fēng)險(xiǎn)要素。針對機(jī)器學(xué)習(xí)和人工智能技術(shù)相關(guān)模型,模型風(fēng)險(xiǎn)驗(yàn)證和管理團(tuán)隊(duì)修改了12個(gè)已有要素,增補(bǔ)了6個(gè)新要素,讓銀行能夠借助新模型來有效識(shí)別和管理與機(jī)器學(xué)習(xí)相關(guān)的風(fēng)險(xiǎn)。
六大新要素
這六大新要素(可解釋性、偏差、特征工程、超參數(shù)、生產(chǎn)就緒和動(dòng)態(tài)模型校準(zhǔn))代表了對傳統(tǒng)驗(yàn)證框架最根本的增改。
可解釋性(Interpretability)
受模型架構(gòu)的牽制,機(jī)器學(xué)習(xí)生成的結(jié)果有時(shí)會(huì)難以理解或作詮釋。因而,機(jī)器學(xué)習(xí)又常被稱為“黑匣子”。例如,為了幫助業(yè)務(wù)經(jīng)理交叉銷售,某銀行花費(fèi)數(shù)月開發(fā)了一個(gè)基于機(jī)器學(xué)習(xí)的產(chǎn)品推薦引擎。然而,由于業(yè)務(wù)經(jīng)理無法理解模型為何會(huì)做此推薦,便決定無視這些建議,甚至對模型采取置之不理的態(tài)度。這種忽視會(huì)直接帶來人力資源的浪費(fèi),甚至可能還會(huì)錯(cuò)失商業(yè)機(jī)會(huì)。不過,如果一味地聽從模型并采取行動(dòng),而不深究其背后的原因,可能也會(huì)帶來嚴(yán)重的后果。
對銀行而言,決定機(jī)器學(xué)習(xí)模型的可解釋性應(yīng)到達(dá)何種程度,是銀行應(yīng)根據(jù)其自身風(fēng)險(xiǎn)偏好而作出的一個(gè)政策規(guī)定。銀行可以規(guī)定所有機(jī)器學(xué)習(xí)模型的可解釋性都必須保持在統(tǒng)一的高標(biāo)準(zhǔn),也可以選擇根據(jù)模型風(fēng)險(xiǎn)的不同而進(jìn)行具體區(qū)分。以美國為例,決定是否批準(zhǔn)借貸申請的模型受美國公平信貸法管轄,因此,當(dāng)模型做出拒絕的決定時(shí),必須提供明確的原因代碼。有些時(shí)候,銀行可能會(huì)認(rèn)為,機(jī)器學(xué)習(xí)模型做出的某些決策不會(huì)對銀行帶來太多風(fēng)險(xiǎn)——如在特定客戶的移動(dòng)應(yīng)用上投放產(chǎn)品廣告。在這種情況下,了解模型做此決定的原因就沒那么重要了。
驗(yàn)證人員還需確保模型符合所選策略。幸運(yùn)的是,盡管機(jī)器學(xué)習(xí)模型一直有“黑匣子”的別稱,但近年來,我們確實(shí)在其結(jié)果的可詮釋性方面取得了重大進(jìn)展。基于模型類別,我們可從一系列方法中做選擇:
-
線性且單調(diào)模型(如線性回歸模型):線性回歸系數(shù)有助于揭示模型結(jié)果對輸入的依賴程度。
-
非線性但單調(diào)模型(如有單調(diào)性約束的梯度提升模型):通過限制模型輸入(自變量)和函數(shù)值(因變量)具有全域上升或下降的關(guān)系,從而簡化輸入對預(yù)測的貢獻(xiàn)。
-
非線性非單調(diào)(如非約束的深度學(xué)習(xí)模型):可采用LIME(Local Interpretable Model-Agnostic Explanations)或Shapley值,以確保局部可解釋性。
偏差(Bias)
一般來說,模型主要會(huì)受到四種偏差的影響:樣本偏差、測量偏差、算法偏差,以及對特定人群偏見的偏差。在機(jī)器學(xué)習(xí)模型中,后兩種類型(即算法和偏見)的偏差可能會(huì)被放大。
具體來看,隨機(jī)森林算法傾向于采用價(jià)值更為明確的輸入值,但這樣會(huì)增加決策欠佳的風(fēng)險(xiǎn)。例如,某銀行開發(fā)了一個(gè)隨機(jī)森林模型,以期識(shí)別潛在的洗錢活動(dòng)。他們發(fā)現(xiàn),該模型傾向于采用具有大量分類值的字段(如職業(yè))。但事實(shí)上,某些分類值較少的字段(如國家)則能更好地預(yù)測洗錢的風(fēng)險(xiǎn)。
為解決算法偏差,我們應(yīng)更新模型驗(yàn)證過程,以確保在任何給定情況下,都能選擇出合適的算法。當(dāng)然,有時(shí)候也存在一些技術(shù)解決方案,比如隨機(jī)森林模型的特征選擇。如果沒有技術(shù)解決方案,便可換種思路,比如建立“挑戰(zhàn)者”模型,即用其他算法來對標(biāo)該算法的表現(xiàn)。
想要解決針對特定人群的偏見偏差,銀行必須首先確定,公平的評判標(biāo)準(zhǔn)是什么。以下四個(gè)評判標(biāo)準(zhǔn)最廣為人知,但具體的使用情況還要視模型的選擇而定:
-
人群無關(guān)性:機(jī)器學(xué)習(xí)做出的決策基于一系列有限的特征集,但這些特征與受保護(hù)的人群——即受法律或政策保護(hù)的人群——相關(guān)度極低。
-
人群均等: 所有受保護(hù)人群的特征值按比相等。
-
機(jī)會(huì)均等: 所有受保護(hù)人群的真陽性率相等。
-
幾率相等: 所有受保護(hù)人群的真陽性率和假陽性率相等。
模型驗(yàn)證者需要確認(rèn)開發(fā)者已經(jīng)采取了必要的措施來保證公平。在模型開發(fā)的各個(gè)階段,驗(yàn)證者可對這些模型進(jìn)行公平性測試,在必要的情況下,會(huì)對從模型設(shè)計(jì)到模型性能監(jiān)控的各個(gè)階段進(jìn)行修正。
特征工程(Feature engineering)
相較于傳統(tǒng)模型,機(jī)器學(xué)習(xí)模型的特征工程更為復(fù)雜。原因有以下幾點(diǎn):第一,機(jī)器學(xué)習(xí)模型可以容納海量的信息。第二,機(jī)器學(xué)習(xí)模型基于非結(jié)構(gòu)化的數(shù)據(jù)源(如自然語言),而這些非結(jié)構(gòu)化數(shù)據(jù)通常在數(shù)據(jù)集訓(xùn)練前就需要特征預(yù)處理。第三,現(xiàn)在已有越來越多的商業(yè)機(jī)器學(xué)習(xí)包都在提供所謂的自動(dòng)機(jī)器學(xué)習(xí)(AutoML),自動(dòng)機(jī)器學(xué)習(xí)可以生成大量的復(fù)雜特征來測試多種數(shù)據(jù)轉(zhuǎn)換。使用這些特征產(chǎn)生的模型可能會(huì)非常復(fù)雜,從而導(dǎo)致過度擬合。比如說,某機(jī)構(gòu)使用了一個(gè)商業(yè)自動(dòng)機(jī)器學(xué)習(xí)(AutoML)平臺(tái)搭建模型,結(jié)果發(fā)現(xiàn),一款產(chǎn)品應(yīng)用程序中的特定字母序列會(huì)被視作欺詐行為。這是算法為了實(shí)現(xiàn)模型樣本外性能最優(yōu),而得到的錯(cuò)誤結(jié)論。
在特征工程中,銀行也需要制定相應(yīng)的政策來降低風(fēng)險(xiǎn)。比如,銀行必須明確,為實(shí)現(xiàn)每一個(gè)特征的概念完備性需要多少支持。當(dāng)然,隨著模型應(yīng)用場景的不同,政策的設(shè)定也會(huì)有差別。比如說,如果是一個(gè)受到嚴(yán)格監(jiān)管的信用決策模型,銀行可能就需要仔細(xì)評估模型中的所有特征。而對于風(fēng)險(xiǎn)較低的新型模型,銀行也許僅僅審視一下特征工程的處理流程(如數(shù)據(jù)轉(zhuǎn)換和特征排除)就可。
接下來,模型驗(yàn)證者應(yīng)確保,特征及特征工程過程與相應(yīng)的風(fēng)險(xiǎn)政策互相吻合。在針對某個(gè)特征進(jìn)行測試時(shí),模型驗(yàn)證者通常會(huì)考慮三點(diǎn):模型輸入的正確轉(zhuǎn)換、特征選擇的標(biāo)準(zhǔn),和特征對應(yīng)的商業(yè)邏輯。例如,銀行可能會(huì)認(rèn)為,與客戶使用自動(dòng)取款機(jī)的頻率(ATM usage)相比,將客戶的債務(wù)收入比(debt-to-income ratio)納入信貸模型建模的特征會(huì)更為理想。這一決定從商業(yè)角度來看十分合理,因?yàn)榭蛻羰褂?span>ATM機(jī)本來就是銀行所倡導(dǎo)的,不應(yīng)為此而受到政策上的懲罰。
超參數(shù)(Hyperparameters)
在訓(xùn)練過程開始前,機(jī)器學(xué)習(xí)模型的許多參數(shù)都應(yīng)得到明確的定義,如隨機(jī)森林模型中樹的深度,或深層神經(jīng)網(wǎng)絡(luò)中的層數(shù)等。換句話說,它們的值并不是從可用數(shù)據(jù)中派生的。從經(jīng)驗(yàn)來看,那些用于解決其他問題的參數(shù),甚至是用于反復(fù)試驗(yàn)的參數(shù),都是常見的替代品。在統(tǒng)計(jì)建模中,有關(guān)這類參數(shù)(稱為超參數(shù))的決策,通常都要比類似的決策更為復(fù)雜。令人不足為奇的是,模型本身的性能及穩(wěn)定性,也會(huì)視所選超參數(shù)而改變。例如,銀行越來越多地在使用二進(jìn)制分類器,如結(jié)合支持向量機(jī)和自然語言處理,以識(shí)別客戶投訴中潛在的行為準(zhǔn)則風(fēng)險(xiǎn)。選定的內(nèi)核函數(shù)不同,這些模型的性能和泛化能力可能也會(huì)十分不同。
模型驗(yàn)證者應(yīng)當(dāng)確保,所選的超參數(shù)越正確越好。與定性型輸入不同,在某些定量性的輸入上,可以使用特定的搜索算法來確定參數(shù)空間的最優(yōu)范圍。在其他情況下,選擇超參數(shù)的最佳方法,是將專家判斷與可以獲知的最新行業(yè)實(shí)踐相結(jié)合。
生產(chǎn)就緒(Production Readiness)
不同于規(guī)則驅(qū)動(dòng)型的傳統(tǒng)模型,機(jī)器學(xué)習(xí)模型由算法驅(qū)動(dòng),因此需要的計(jì)算過程也更多。在模型開發(fā)過程中,對計(jì)算的要求通常會(huì)被忽視。現(xiàn)實(shí)情況是,模型開發(fā)人員在構(gòu)建完復(fù)雜的預(yù)測模型后,卻往往發(fā)現(xiàn)銀行現(xiàn)有生產(chǎn)系統(tǒng)無法給予支持。例如,某家美國銀行投入了大量資源,建立起一個(gè)基于深度學(xué)習(xí)的模型來預(yù)測欺詐交易,結(jié)果卻發(fā)現(xiàn),它根本無法達(dá)到系統(tǒng)運(yùn)行所需的標(biāo)準(zhǔn)。
在傳統(tǒng)模型驗(yàn)證框架中,與模型實(shí)施相關(guān)的系列風(fēng)險(xiǎn)都得到了有效的評估和審核。但對機(jī)器學(xué)習(xí)模型而言,相關(guān)風(fēng)險(xiǎn)評估的范圍還需進(jìn)一步擴(kuò)大,比如預(yù)估模型將會(huì)擁有的數(shù)據(jù)流量、評估生產(chǎn)系統(tǒng)的體系架構(gòu)(如用于深度學(xué)習(xí)的圖形處理單元),以及估算相應(yīng)的運(yùn)行時(shí)間。
動(dòng)態(tài)模型校準(zhǔn)(Dynamics model calibration)
有別于傳統(tǒng)的定期手動(dòng)審閱及更新模式,機(jī)器學(xué)習(xí)模型可以通過強(qiáng)化學(xué)習(xí)算法,或貝葉斯模型來動(dòng)態(tài)修改其參數(shù),以反映數(shù)據(jù)中隱含的新態(tài)勢。值得注意的是,如果監(jiān)督不夠,隨著時(shí)間的推移,過度強(qiáng)調(diào)數(shù)據(jù)的短期態(tài)勢可能會(huì)損害模型的性能。
因此,銀行需要明確動(dòng)態(tài)重校準(zhǔn)的觸發(fā)規(guī)則。比如,它們可能會(huì)認(rèn)為,只要監(jiān)督得當(dāng),類似于算法交易的部分應(yīng)用可以進(jìn)行動(dòng)態(tài)重校準(zhǔn)。但對其他應(yīng)用,如信用決策而言,則需有明確的證據(jù)表明,動(dòng)態(tài)重校準(zhǔn)確確實(shí)實(shí)要優(yōu)于靜態(tài)模型,這樣才可采取相應(yīng)的操作。
明確了相應(yīng)的規(guī)則后,模型驗(yàn)證者便可根據(jù)模型的預(yù)期用途,來評估是否需要采用動(dòng)態(tài)重校準(zhǔn),并制定相應(yīng)的監(jiān)測和控制手段來識(shí)別和減輕潛在風(fēng)險(xiǎn)。比如,預(yù)先設(shè)定好反映模型運(yùn)行發(fā)生重大變化的指標(biāo)(如樣本外性能評價(jià)指標(biāo))閾值,和其他預(yù)定義值(如風(fēng)險(xiǎn)敞口上限值),這樣才能判斷是否需要人工評估的干預(yù)。
針對機(jī)器學(xué)習(xí)和人工智能技術(shù)的普及,銀行業(yè)需要逐步開展和完善相應(yīng)的風(fēng)險(xiǎn)管理工作。銀行要做的第一步,就是確保所有現(xiàn)存的機(jī)器學(xué)習(xí)模型都已被納入模型清單中。以一家銀行為例,其模型風(fēng)險(xiǎn)管理部門一直認(rèn)為,該銀行并沒有使用機(jī)器學(xué)習(xí)模型。直到最近他們才發(fā)現(xiàn),其新成立的創(chuàng)新部一直在忙于開發(fā)用于反欺詐和網(wǎng)絡(luò)安全的機(jī)器學(xué)習(xí)模型。
為了有效管理機(jī)器學(xué)習(xí)模型的風(fēng)險(xiǎn),銀行可以考慮擴(kuò)展現(xiàn)有的傳統(tǒng)模型驗(yàn)證策略。考慮到模型性能的監(jiān)測和優(yōu)化需要長時(shí)間的積累,銀行可以先對部分特定的機(jī)器學(xué)習(xí)模型進(jìn)行管理,積累更多經(jīng)驗(yàn)后,再在未來逐步將這些驗(yàn)證策略推廣至各類機(jī)器學(xué)習(xí)模型。若能有效發(fā)揮機(jī)器學(xué)習(xí)的技術(shù)威力,銀行可顯著降低風(fēng)險(xiǎn)。
亞洲實(shí)踐
隨著機(jī)器學(xué)習(xí)的推廣,亞洲金融機(jī)構(gòu)也會(huì)日益將其視作一種流行的技術(shù)手段,廣泛用于商業(yè)決策和風(fēng)險(xiǎn)管理等領(lǐng)域。這種局面出現(xiàn)后,如何有效控制相應(yīng)的模型風(fēng)險(xiǎn),也會(huì)成為各大金融機(jī)構(gòu)的焦點(diǎn)所在。
近期,東南亞某商業(yè)銀行就在遵從上述模型驗(yàn)證框架,從初始診斷開始,逐漸建立起整體模型風(fēng)險(xiǎn)任務(wù)、模型風(fēng)險(xiǎn)政策和治理框架,以明確模型生命周期中的各個(gè)角色與職責(zé)。他們還建立了中央模型庫存,以便管理所有使用的模型。除去使用模型分層法,在每個(gè)模型層分別建立起相應(yīng)的驗(yàn)證標(biāo)準(zhǔn)外,他們還將模型風(fēng)險(xiǎn)引入了高管KPI,并建立起了一套模型風(fēng)險(xiǎn)實(shí)時(shí)報(bào)告體系。針對復(fù)雜度更高的機(jī)器學(xué)習(xí)模型,這家商業(yè)銀行建立了相應(yīng)的驗(yàn)證標(biāo)準(zhǔn),有效且高效地進(jìn)行了模型驗(yàn)證工作。
作者
Kevin Buehler是麥肯錫全球資深董事合伙人,常駐紐約分公司;
Adam Pivonka是麥肯錫Risk Dynamics全球副董事合伙人,常駐紐約分公司;
Bryan Richardson是麥肯錫資深知識(shí)專家,常駐溫哥華分公司;
Derek Waldron是麥肯錫全球董事合伙人,常駐紐約分公司;
Bernhard Babel是麥肯錫自身外部顧問。
一周熱點(diǎn)
- 2022-11-28首屆種業(yè)科學(xué)家獎(jiǎng)獲獎(jiǎng)名單公布
- 2022-11-28全球飼糧市場一周要聞:巴西啟動(dòng)對華玉米出口 美國出口可能放慢
- 2022-11-28巴西玉米來了!明年對華出口可達(dá)500萬噸
- 2022-11-25科技前沿 | 農(nóng)科院飼料所研究揭示酵母細(xì)胞壁多糖調(diào)控蛋雞先天免疫和抗炎性應(yīng)激作用機(jī)制
- 2022-11-25巴西玉米來了! 6.8萬噸已裝船啟航
- 2022-11-24通威股份農(nóng)牧總裁郭異忠出席中國大農(nóng)業(yè)經(jīng)營年會(huì),深度解析魚周期下水產(chǎn)飼料企業(yè)的發(fā)展問題
- 2022-11-23數(shù)據(jù) || 中國10月大豆進(jìn)口產(chǎn)地排名
- 2022-11-21齊心協(xié)力保安全 團(tuán)結(jié)奮進(jìn)促發(fā)展——全產(chǎn)業(yè)鏈共同實(shí)施獸用抗菌藥使用減量化行動(dòng)倡議書
- 2022-11-2110月份中國玉米進(jìn)口量較上年同期顯著下滑
- 2022-11-18廣西首個(gè)飼料精準(zhǔn)配方與精細(xì)化加工項(xiàng)目簽約啟動(dòng)