智能風(fēng)控體系介紹

智能風(fēng)控是利用大數(shù)據(jù)、人工智能技術(shù)和科學(xué)決策方法,通過(guò)自動(dòng)化預(yù)測(cè)、評(píng)級(jí)和決策等方式,提高風(fēng)控效果和效率、降低成本的一套綜合體系。智能風(fēng)控包括智能風(fēng)控的方法論,智能風(fēng)控的算法,工程技術(shù)的實(shí)現(xiàn)以及深入業(yè)務(wù)場(chǎng)景的應(yīng)用。智能風(fēng)控方法包含模型搭建方法、數(shù)據(jù)挖掘方法、風(fēng)控策略制定方法,通過(guò)一系列方法,我們可以構(gòu)建智能風(fēng)控的基本架構(gòu)。智能風(fēng)控算法包括機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)和關(guān)系網(wǎng)絡(luò)等算法,這些算法是方法體系中的核心部件,也是智能風(fēng)控得以展現(xiàn)智能的關(guān)鍵部分。工程技術(shù)實(shí)現(xiàn)是運(yùn)用智能風(fēng)控的方法論以及智能算法,結(jié)合工程技術(shù),實(shí)現(xiàn)自動(dòng)化的風(fēng)控決策和智能交互。應(yīng)用方面,在業(yè)務(wù)流程的全過(guò)程中,只要有風(fēng)險(xiǎn)點(diǎn)的環(huán)節(jié)都可以加入智能風(fēng)控進(jìn)行決策。根據(jù)不同的業(yè)務(wù)場(chǎng)景靈活的選取模型規(guī)則的組合進(jìn)行自動(dòng)決策。自動(dòng)體系要達(dá)到的最終目的是提高企業(yè)風(fēng)控的精準(zhǔn)度和效率,將風(fēng)險(xiǎn)控制在合理的范圍內(nèi),減少風(fēng)險(xiǎn)損失提高企業(yè)的盈利能力。
智能風(fēng)控詳細(xì)體系架構(gòu)

我們可以將智能風(fēng)控體系拆解為圖示的詳細(xì)架構(gòu)。該架構(gòu)包含四層,分別為數(shù)據(jù)層、特征層、模型層和決策層。
如果將整個(gè)智能風(fēng)控體系比作一棟建筑,那么
數(shù)據(jù)層是智能防控體系最基礎(chǔ)的原材料。我們通過(guò)大量的歷史數(shù)據(jù)來(lái)訓(xùn)練模型,通過(guò)數(shù)據(jù)構(gòu)建特征,通過(guò)數(shù)據(jù)作為新決策的判斷輸入。
特征層是智能風(fēng)控的磚瓦,基于數(shù)據(jù)構(gòu)建特征,通過(guò)提取數(shù)據(jù)中的關(guān)鍵信息,形成可以用于模型和決策的特征。
模型層是智能風(fēng)控的主體結(jié)構(gòu),通過(guò)歷史樣本數(shù)據(jù)和目標(biāo)數(shù)據(jù),利用各類機(jī)器學(xué)習(xí)算法基于豐富的特征,訓(xùn)練出滿足各類業(yè)務(wù)場(chǎng)景的模型。
策略層是智能風(fēng)控的門面,特征和模型最終將服務(wù)于業(yè)務(wù)的特定場(chǎng)景。在不同的業(yè)務(wù)場(chǎng)景參與決策,策略層通過(guò)模型和規(guī)則的各種組合完成決策過(guò)程。
智能風(fēng)控的每一層,再進(jìn)行橫向劃分,包括關(guān)鍵內(nèi)容、流程步驟、算法方法、工具平臺(tái)。
關(guān)鍵內(nèi)容列包含每一層的主體內(nèi)容和重要結(jié)果。
流程步驟列是每一層構(gòu)建關(guān)鍵的內(nèi)容的流程和主要步驟。
算法方法列是構(gòu)建每一層結(jié)果采用的主要智能算法方法。
工具平臺(tái)列是包含構(gòu)建流程管理關(guān)鍵結(jié)果的工具,是自動(dòng)化管理的技術(shù)落地。
以上是整體的智能風(fēng)控的體系架構(gòu)。接下來(lái)展開(kāi)每一層進(jìn)行詳細(xì)介紹。
1. 數(shù)據(jù)層詳解

首先是數(shù)據(jù)層。數(shù)據(jù)是所有智能風(fēng)控的基礎(chǔ),數(shù)據(jù)中包含識(shí)別風(fēng)險(xiǎn)的信息,智能風(fēng)控?cái)?shù)據(jù)層包含不同類型的數(shù)據(jù)。根據(jù)來(lái)源我們可以將數(shù)據(jù)分為其內(nèi)部數(shù)據(jù)和第三方數(shù)據(jù)。以金融風(fēng)控場(chǎng)景中常見(jiàn)的數(shù)據(jù)為例,企業(yè)內(nèi)部數(shù)據(jù)包含基礎(chǔ)信息,比如身份信息、學(xué)歷信息、設(shè)備相關(guān)的信息包含 app 行為數(shù)據(jù)、設(shè)備指紋數(shù)據(jù)等。交易數(shù)據(jù)包含授信記錄數(shù)據(jù)、還款記錄數(shù)據(jù)等。第三方數(shù)據(jù)就更加廣泛,包括多頭借貸數(shù)據(jù)、征信相關(guān)數(shù)據(jù)等。數(shù)據(jù)處理上,按照處理的實(shí)效性劃分,可以分為實(shí)時(shí)計(jì)算和離線計(jì)算。實(shí)時(shí)計(jì)算通常是用于實(shí)時(shí)決策場(chǎng)景。比如線上金融業(yè)務(wù)的授信審批,需要實(shí)時(shí)獲取各類信貸決策的數(shù)據(jù)。離線計(jì)算通常用于定時(shí)任務(wù),比如信貸風(fēng)控中的貸中風(fēng)控識(shí)別場(chǎng)景。從數(shù)據(jù)處理的方式上劃分,可以分為流式數(shù)據(jù)處理和批量數(shù)據(jù)處理。數(shù)據(jù)處理的步驟通常分為數(shù)據(jù)采集、數(shù)據(jù)校驗(yàn)、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)、標(biāo)準(zhǔn)輸出和數(shù)據(jù)監(jiān)控。數(shù)據(jù)采集步驟對(duì)企業(yè)內(nèi)部數(shù)據(jù)通常是從業(yè)務(wù)系統(tǒng)產(chǎn)生的數(shù)據(jù)元素獲取需要的數(shù)據(jù)字段。對(duì)外是從第三方接口獲取數(shù)據(jù)。數(shù)據(jù)校驗(yàn)是對(duì)數(shù)據(jù)做基本的驗(yàn)證判斷,確保指定對(duì)象的數(shù)據(jù)有效。數(shù)據(jù)清洗是對(duì)數(shù)據(jù)做規(guī)范標(biāo)準(zhǔn)化處理,排除異常和雜亂數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)分為線上實(shí)時(shí)數(shù)據(jù)和離線數(shù)據(jù)存儲(chǔ),以滿足不同使用場(chǎng)景和目的。標(biāo)準(zhǔn)化輸出是將數(shù)據(jù)處理的結(jié)果對(duì)外提供使用接口或者其他的查詢服務(wù)。最后,數(shù)據(jù)監(jiān)控是對(duì)整個(gè)數(shù)據(jù)處理結(jié)果的過(guò)程進(jìn)行監(jiān)控預(yù)警,及時(shí)發(fā)現(xiàn)數(shù)據(jù)層的應(yīng)用異常。那么最后數(shù)據(jù)平臺(tái)是數(shù)據(jù)層的支撐工具,通過(guò)數(shù)據(jù)平臺(tái)來(lái)實(shí)現(xiàn)數(shù)據(jù)層的管理。通常數(shù)據(jù)平臺(tái)包含內(nèi)外部數(shù)據(jù)接入整合的功能,數(shù)據(jù)管理和服務(wù)的功能,數(shù)據(jù)校驗(yàn)和監(jiān)控的功能。
2. 特征畫像層詳解

特征是對(duì)數(shù)據(jù)的再次加工,將智能風(fēng)控建筑的原材料變成磚瓦。特征是從數(shù)據(jù)中抽取有效的、針對(duì)特定目的的部分信息,從數(shù)據(jù)產(chǎn)生特征的過(guò)程就是特征挖掘。數(shù)據(jù)質(zhì)量決定了特征質(zhì)量的上限,但是好的特征挖掘過(guò)程是盡量的從數(shù)據(jù)中挖掘出最有價(jià)值的信息。有些特征是直接從數(shù)據(jù)中獲取的比如性別、年齡、居住區(qū)域這類身份特征和基礎(chǔ)信息特征。另外一些特征就需要對(duì)原始數(shù)據(jù)進(jìn)行匯總加工比如借款次數(shù)、額度使用占比等。還有一些特征需要基于關(guān)系圖譜機(jī)器學(xué)習(xí)的方法進(jìn)行深度加工才能提取,比如二度關(guān)系里人的特征、收入指數(shù)、消費(fèi)能力指數(shù)等。特征提取的方法包括基于統(tǒng)計(jì)聚類的 RFM 方法,基于時(shí)序特征的提取方法,基于機(jī)器學(xué)習(xí) NLP 圖特征圖算法等特征提取方法。雖然特征提取的方法不同,但是特征提取的關(guān)鍵步驟基本是一致的。源數(shù)據(jù)分析和清洗是對(duì)原始數(shù)據(jù)的流轉(zhuǎn)、時(shí)效、質(zhì)量等進(jìn)行分析并清洗處理成標(biāo)準(zhǔn)格式。中間數(shù)據(jù)構(gòu)造是按照不同特征提取的方法構(gòu)建中間數(shù)據(jù)集,比如二分類特征提取方法要求數(shù)據(jù)集為標(biāo)準(zhǔn)的寬表數(shù)據(jù)格式。特征設(shè)計(jì)和生成是根據(jù)不同特征提取方法設(shè)計(jì)并生成特征,比如 RFM 特征方法中需要選取特征匯總的不同維度、匯總的對(duì)象以及匯總的計(jì)算方式。特征評(píng)估是對(duì)特征效果進(jìn)行分析,選擇效果好、穩(wěn)定性高的特征。特征回溯是對(duì)歷史數(shù)據(jù)進(jìn)行回測(cè),通常服務(wù)于特征提取后的建模場(chǎng)景。特征監(jiān)控是對(duì)已經(jīng)進(jìn)入使用階段的特征進(jìn)行持續(xù)監(jiān)控以確保有效性和穩(wěn)定性。特征平臺(tái)是為了支撐特征從開(kāi)發(fā)到應(yīng)用的工具平臺(tái)。通常特征平臺(tái)包括特征挖掘模塊、特征計(jì)算模塊和特征管理模塊。
3. 模型算法層詳解

模型算法層是智能風(fēng)控的核心,是構(gòu)成智能風(fēng)控建筑的主體結(jié)構(gòu)。通過(guò)模型算法層實(shí)現(xiàn)智能化的預(yù)測(cè)評(píng)估。風(fēng)控中典型的場(chǎng)景就是預(yù)測(cè)風(fēng)險(xiǎn),計(jì)算發(fā)生風(fēng)險(xiǎn)的概率,再?gòu)?fù)雜的算法本質(zhì)上還是可以理解為概率問(wèn)題。風(fēng)控場(chǎng)景中的模型有很多種類,這些都是根據(jù)業(yè)務(wù)場(chǎng)景來(lái)決定的。金融風(fēng)控場(chǎng)景中我們構(gòu)建模型計(jì)算評(píng)分來(lái)預(yù)測(cè)用戶的欺詐概率、違約概率、貸中風(fēng)險(xiǎn)發(fā)生的概率、貸后催收回款的概率。在營(yíng)銷場(chǎng)景中我們構(gòu)建模型來(lái)判斷營(yíng)銷成交轉(zhuǎn)化的概率、識(shí)別作弊的概率。在內(nèi)容風(fēng)控場(chǎng)景中構(gòu)建模型來(lái)判定內(nèi)容違規(guī)的概率。模型是機(jī)器學(xué)習(xí)算法構(gòu)建的結(jié)果。為了構(gòu)建模型我們可以選擇的算法是多種多樣的,新的算法也在不斷產(chǎn)生和更新迭代。風(fēng)控領(lǐng)域常用的算法包括基礎(chǔ)算法如邏輯回歸算法、決策樹(shù)算法等。集成學(xué)習(xí)算法包括隨機(jī)森林、xgboost 等。深度學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)等等。算法和場(chǎng)景雖然不同,但是構(gòu)建模型的流程也是基本相似的。可以劃分為如下幾個(gè)步驟: 問(wèn)題定義是對(duì)業(yè)務(wù)場(chǎng)景的問(wèn)題進(jìn)行明確和界定。
樣本定義及劃分是選擇合適的樣本定義標(biāo)簽,選擇可用的特征范圍。
模型架構(gòu)設(shè)計(jì)是確定算法,確定模型結(jié)構(gòu)。
數(shù)據(jù)準(zhǔn)備與 EDA 是對(duì)樣本數(shù)據(jù)進(jìn)行整理探索性分析。檢查樣本的可靠性。
特征選擇是從大量的被選特征當(dāng)中選擇效果好和覆蓋率高的特征。
模型訓(xùn)練與評(píng)估是完成模型訓(xùn)練并評(píng)估模型效果,此過(guò)程可以循環(huán)迭代多次。
模型監(jiān)控是在模型應(yīng)用之后持續(xù)的監(jiān)控,確保模型的有效性和穩(wěn)定性。
模型平臺(tái)是支持模型管理的工具。通常模型平臺(tái)包括自動(dòng)建模功能模塊、模型計(jì)算功能模塊、模型管理功能模塊。
4. 決策應(yīng)用層詳解

決策應(yīng)用層是整個(gè)智能風(fēng)控體系的最后環(huán)節(jié)。這一層針對(duì)業(yè)務(wù)場(chǎng)景,基于特征和模型結(jié)果制定決策方案,對(duì)最終的業(yè)務(wù)決策和流程產(chǎn)生影響。策略環(huán)節(jié)通常需要設(shè)計(jì)一套決策流程,在流程中的每一個(gè)環(huán)節(jié)設(shè)置決策規(guī)則。這些規(guī)則包括直接使用特征制定的規(guī)則和基于模型制定的規(guī)則。通過(guò)規(guī)則實(shí)現(xiàn)業(yè)務(wù)流程的通過(guò)或者拒絕、差異化的分流等動(dòng)作。在金融風(fēng)控貸前場(chǎng)景中,通常的決策包括欺詐識(shí)別、信用風(fēng)險(xiǎn)識(shí)別以及其他一些準(zhǔn)入攔截。對(duì)于通過(guò)的客戶在進(jìn)行差異化的審核操作、差異化的授信額度決策、差異化的定價(jià)政策等等。在策略制定的過(guò)程中,可以選擇多種的決策算法進(jìn)行支持的,包括決策樹(shù),異常點(diǎn)檢測(cè)等等算法來(lái)支持我們制定決策規(guī)則,用最優(yōu)化的算法來(lái)支持我們進(jìn)行最優(yōu)化決策點(diǎn)的選擇。風(fēng)控策略制定中最常見(jiàn)的就是進(jìn)行風(fēng)控規(guī)則策略的制定,通常的流程如下: 識(shí)別業(yè)務(wù)場(chǎng)景中常見(jiàn)的風(fēng)險(xiǎn)點(diǎn)
選擇合適的分析樣本
基于歷史數(shù)據(jù)選擇算法生成規(guī)則
對(duì)規(guī)則的有效性和穩(wěn)定性進(jìn)行評(píng)估
設(shè)計(jì)規(guī)則測(cè)試的方案
通常進(jìn)行 AB 實(shí)驗(yàn)來(lái)驗(yàn)證規(guī)則的效果
對(duì)規(guī)則的有效性和穩(wěn)定性進(jìn)行持續(xù)監(jiān)控
決策引擎是支持策略部署執(zhí)行的一個(gè)工具。決策引擎通常包括規(guī)則配置、決策流的配置、審批管理等功能模塊。
智能風(fēng)控平臺(tái)交互邏輯

企業(yè)在風(fēng)控體系搭建的初期,不一定會(huì)有標(biāo)準(zhǔn)化的平臺(tái)工具來(lái)支持。但是隨著企業(yè)智能風(fēng)控體系的這個(gè)發(fā)展和成熟,更加高效的方式還是去建立每個(gè)功能模塊的平臺(tái)化工具。智能風(fēng)控體系中幾個(gè)關(guān)鍵平臺(tái)工具之間的交互關(guān)系如上圖所示: 數(shù)據(jù)平臺(tái)主要是為特征平臺(tái)提供數(shù)據(jù)的輸入,同時(shí),它也支持各類樣本數(shù)據(jù)、分析數(shù)據(jù)的提取。
特征平臺(tái)主要是為模型平臺(tái)和決策引擎提供特征計(jì)算和輸入。
模型平臺(tái)主要是為決策引擎提供模型計(jì)算結(jié)果的輸入。
決策引擎主要是基于特征平臺(tái)和模型平臺(tái)的結(jié)果進(jìn)行決策,幾個(gè)工具平臺(tái)之間的相互依賴和配合,形成了智能風(fēng)控全流程的一個(gè)閉環(huán)。?
發(fā)展趨勢(shì)展望

智能風(fēng)控技術(shù)發(fā)展到今天,各種機(jī)器學(xué)習(xí)算法層出不窮。但是這些技術(shù)發(fā)展和其他新鮮事物是一樣的,會(huì)從高速發(fā)展逐步進(jìn)入穩(wěn)定期。這個(gè)階段新的技術(shù)不會(huì)有明顯的顛覆性,更多的是在原有的基礎(chǔ)上進(jìn)行一定的改良。那么現(xiàn)在智能風(fēng)控技術(shù)目前就處于這樣一個(gè)階段,但是在應(yīng)用場(chǎng)景上隨著智能風(fēng)控技術(shù)的持續(xù)發(fā)展和應(yīng)用場(chǎng)景的不斷創(chuàng)新探索,智能風(fēng)控會(huì)越來(lái)越深入到每一個(gè)業(yè)務(wù)場(chǎng)景的每一個(gè)環(huán)節(jié)。傳統(tǒng)的通過(guò)人工完成的大部分工作都可以被智能風(fēng)控技術(shù)所替代。不論是從風(fēng)控識(shí)別的效率還是效果上,這類場(chǎng)景智能技術(shù)都比人工更好。但是另一方面,在一些特殊的復(fù)雜度較高的情況下,還是需要一些進(jìn)行人工補(bǔ)充的,尤其是在數(shù)據(jù)量較少、新的風(fēng)險(xiǎn)模式變化不確定性又非常大的領(lǐng)域還是有人工發(fā)揮的余地。智能風(fēng)控會(huì)占據(jù)大多數(shù)的通用場(chǎng)景,人工是趨于在一些細(xì)分領(lǐng)域或者小眾的場(chǎng)景繼續(xù)發(fā)揮價(jià)值。
(部分內(nèi)容來(lái)源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)