基于大數(shù)據(jù)的電商領域征信模型及風險控制系統(tǒng)設計與實現(xiàn)
摘要:由于銀行業(yè)在風險控制中存在一些先天的不足,2014年第三季度末中國的商業(yè)銀行不良貸款總額上升36%,達到7670億元人民幣,是四年來的高點,2015年不良貸款也呈現(xiàn)了上升的趨勢。而電商企業(yè)做為一類特殊的中小企業(yè),其特點就是輕資產(chǎn),這對銀行來說是屬于被規(guī)避的客戶群體。但近年來,電子商務發(fā)展迅猛,國家也大力發(fā)展電子商務,2015年電子商務交易規(guī)模達到18.2萬億,而電商貸款規(guī)模卻不到200億,電商企業(yè)普遍面臨著資金短缺的情況,電商領域存在著巨大的金融市場。因此,銀行在傳統(tǒng)貸款業(yè)務市場趨于飽和的情況下,也試圖開拓電商領域的金融市場,但針對電商的征信與風險控制的不足,使銀行又顧慮重重。本論文以大數(shù)據(jù)平臺為技術平臺,整合電商、銀行、電信三方數(shù)據(jù),用互聯(lián)網(wǎng)的數(shù)據(jù),銀行的風控模式,打造屬性的電商的專有征信模型與風險控制體系。
關鍵詞:大數(shù)據(jù);Hadoop;電子商務;征信模型;
1、國、內外征信系統(tǒng)現(xiàn)狀
1.1國外征信系統(tǒng)模型發(fā)展
征信系統(tǒng)信用評估業(yè)最早啟始于20世紀四五十年代初。最初的征信評估由銀行各自根據(jù)自己的業(yè)務發(fā)展情況,各自構建信用評估方法進行試驗,希望通過可量化的數(shù)學模型,處理快速發(fā)展的貸款業(yè)務,減少人工參與,提升信用評估的準確性和客觀性。隨著經(jīng)驗的積累,工程師Bill Fair和數(shù)學家Earl Isaac于1956年成立了Fair Isaac公司,發(fā)明了隨后廣泛流行的FICO評分方法,并在1958年推出了全球首套通用的信用評估評級系統(tǒng)。Fair Isaac公司是首家通過數(shù)據(jù)模型構建信用評估體系的公司,標準著征信行業(yè)進入一個新的時代。
在60年代,參考FICO評估方法,在全球范圍內出現(xiàn)了大量專門的信用評估公司和信用管理局,為銀行和客戶提供專門的信用評估報告和信用評分。目前各信用管理局和信用評分公司都采用了不同的數(shù)據(jù)來源,構建了具有各自特色的信用評分系統(tǒng)。從總體來說各信用管理局和信用評分公司的信用評分體系基本參考FICO個人評分模型構建。
影響模型分數(shù)的因素主要包括:信用歷史長短;信用賬戶是否過多;信用額度飽和使用度;毀譽信用記錄;拖欠稅款、法院訴訟判決、拖欠水電煤生活記錄、個人破產(chǎn)的公共記錄;最近是否有透支使用信用卡行為;是否過于頻繁的貸款咨詢;是否持有過少或過多的周轉賬戶。
1.2國內征信系統(tǒng)現(xiàn)狀
1932年“中華征信所”是我國成立的第一家征信機構,距今已有80年的歷史。但在上世紀80年代,中國改革后,中國的征信行業(yè)才真正的開始發(fā)展。目前一共經(jīng)歷了探索階段、起步階段、發(fā)展階段、互聯(lián)網(wǎng)金融時代四個階段:
圖表:征信業(yè)在國內發(fā)展階段
在系統(tǒng)建設方面,中國人民銀行自2002年開始,構建了“中國銀行信貸登記咨詢系統(tǒng)”,系統(tǒng)采用三級數(shù)據(jù)庫,實現(xiàn)對中央、地方的全面覆蓋。在此基礎上人民銀行于2004 年開始組織進行商業(yè)銀行、外資銀行、小額貸款公司、保險等金融機構信用數(shù)據(jù)的全面接入,啟動全國范圍內的金融信用基礎數(shù)據(jù)庫全面建設工作,并于2006 年1 月實現(xiàn)在全國范圍內的聯(lián)網(wǎng)運行,為各級金融機構提供查詢服務。目前金融信息基礎數(shù)據(jù)庫涵蓋所有的金融授信機構類型,并分為企業(yè)信用信息基礎庫和個人信用信息庫。目前接入企業(yè)信息信息服務機構超過622家,個人信息信息分服務機構超過629家。
隨著互聯(lián)網(wǎng)理念和技術,進入金融行業(yè),對于傳統(tǒng)金融企業(yè)來說,意味著在平靜的水面中,放進了幾條左右沖突的鯰魚。在傳統(tǒng)的百貨行業(yè)、圖書行業(yè)、音樂行業(yè),面對互聯(lián)網(wǎng)的獨特優(yōu)勢和新的商務模式的顛覆,都出現(xiàn)了增長乏力、停滯、后退甚至消亡的情況。金融行業(yè)面對互聯(lián)網(wǎng)金融的“鯰魚效益”除了被倒逼,進行積極擁抱,快速響應,互相促進、共同發(fā)展,改變固有的商業(yè)模式外,別無他途。所以在互聯(lián)網(wǎng)金融時代,互聯(lián)網(wǎng)企業(yè)借助數(shù)據(jù)、電子商務、開放合作的優(yōu)勢切入支付結算及信貸兩項核心業(yè)務。傳統(tǒng)銀行業(yè)也在進行積極轉型,紛紛與互聯(lián)網(wǎng)公司進行合作,借機進行壯大,在把握風險管理的基礎上抓住歷史的機遇進行快速發(fā)展。
2、Hadoop平臺
Hadoop是目前最受歡迎的Internet對搜索關鍵字進行內容分類及管理的工具,Hadoop工具具有平穩(wěn)擴展的特點,能通過并發(fā)機制,大大提高系統(tǒng)的處理能力和效率,同時采用并發(fā)機制,能夠快速方便的對系統(tǒng)進行擴充,可以解決許多要求極大伸縮性系統(tǒng)的問題。
圖表:Hadoop技術架構
Hadoop架構由許多元素和組件構成,通過多個組件的協(xié)同處理,解決系統(tǒng)問題,具有豐富的功能和靈活的擴展和方便的部署特點。其最核心組件的包括:HDFS2(Hadoop Distributed File System2),系統(tǒng)存儲組件,通過分布式的方式將系統(tǒng)文件分別保存在平臺的多臺系統(tǒng)中,保障系統(tǒng)分布式處理及冗余存儲,提高系統(tǒng)文件的安全性和并發(fā)能力。MapReduce 引擎,分布式任務處理組件,由JobTrackers 和 TaskTrackers 組成,負責將任務分解到不同的機器上進行并發(fā)處理,并將處理的結果匯總返回。
Hadoop平臺在互聯(lián)網(wǎng)及大數(shù)據(jù)領域的快速發(fā)展、廣泛應用,得益于Hadoop平臺在分布式計算,大數(shù)據(jù)量處理的天然優(yōu)勢。Hadoop平臺通過分布式架構,將數(shù)據(jù)處理引擎向數(shù)據(jù)存儲端靠近,提升存儲性能和處理能力。同時通過MapReduce功能將單個大任務分解成多個小任務,分配(MAP)到多個節(jié)點執(zhí)行,之后再匯總成單個數(shù)據(jù)集進行處理(Reduce),能夠進一步提升原有數(shù)據(jù)處理過程(ETL)的效率,提升包括數(shù)據(jù)倉庫、ETL等系統(tǒng)的效率。
3、系統(tǒng)設計
3.1系統(tǒng)架構設計
圖表:系統(tǒng)架構設計
系統(tǒng)采用多層三域架構,實現(xiàn)管理、應用、數(shù)據(jù)的解耦,提高系統(tǒng)的靈活性。系統(tǒng)包括數(shù)據(jù)域、應用域、管理域三大部分。
● 數(shù)據(jù)域:
在數(shù)據(jù)服務層面上,系統(tǒng)通過統(tǒng)一的ETL工具,為系統(tǒng)提供統(tǒng)一的數(shù)據(jù)獲取和對外服務接口,并在系統(tǒng)中建立統(tǒng)一的數(shù)據(jù)存儲模型,為應用及后續(xù)擴展統(tǒng)一的服務,提供基礎數(shù)據(jù)。
系統(tǒng)的數(shù)據(jù)來源包括互聯(lián)網(wǎng)數(shù)據(jù)、電商經(jīng)營數(shù)據(jù)、社會征信數(shù)據(jù),人行征信系統(tǒng)數(shù)據(jù)、及人工錄入數(shù)據(jù)。其中互聯(lián)網(wǎng)數(shù)據(jù)、電商經(jīng)營數(shù)據(jù)、社會征信數(shù)據(jù)通過合作接口、互聯(lián)網(wǎng)爬蟲進行匯總,并在平臺中進行分析加工和保存處理。人行征信系統(tǒng)數(shù)據(jù)及其他需要人工錄入的數(shù)據(jù)錄入到平臺中進行處理。
基礎數(shù)據(jù)層:通過構建通用的業(yè)務模型,將結構數(shù)據(jù)按照業(yè)務的特點,分模型進行保存,保證數(shù)據(jù)的高效存儲、方便訪問、便于擴展。
業(yè)務模型層,主要對系統(tǒng)中整理的數(shù)據(jù)層的基礎數(shù)據(jù)和指標,通過設置相應的閾值,對商家的風險、貸款額度、貸后情況進行監(jiān)控。
●應用域:
應用域負責將數(shù)據(jù)域的數(shù)據(jù)進行加工處理,為前臺業(yè)務人員提供服務。它主要包含業(yè)務應用和前臺展現(xiàn)二層。
業(yè)務應用層,主要為銀行后臺管理人員提供客戶管理、貸前、貸中、貸后、運營管理、業(yè)務分析、模型優(yōu)化分析和模型參數(shù)調整服務。
前臺展現(xiàn)層,根據(jù)人員角色提供個性化的工作臺,提供訪問適配和主動服務能力,應用信息推送機制。前臺應用根據(jù)不同角色的工作環(huán)境的情況,提供包括APP、WEB訪問方式,將業(yè)務應用滲透到銀行的各個業(yè)務環(huán)節(jié)。主要通過門戶整合、前臺適配和門戶管理建設實現(xiàn)。
●管理域:
應用管理域包括權限管理、數(shù)據(jù)管理、運維管理,為系統(tǒng)的正常運營、安全管理、數(shù)據(jù)質量提供保障,為系統(tǒng)的正常運行提供服務。
3.2系統(tǒng)功能設計
功能架構如下圖:
圖表:功能架構設計
● 前端APP應用根據(jù)電商金融在線貸款流程需求,提供:客戶推廣、客戶申請、盡職調研服務??蛻艚?jīng)理APP,滿足客戶經(jīng)理的業(yè)務推廣和盡職調研需求,包括客戶查詢、產(chǎn)品介紹、業(yè)務推廣、盡職派單接收、調研結果記錄及信息提交功能??蛻羯暾圓PP,滿足客戶注冊、貸款申請、資料上傳、額度預估及申請狀態(tài)查詢功能。
● 后臺管理滿足銀行后臺人員的業(yè)務管理流程及系統(tǒng)的運營管理需求。包括客戶管理、貸前信息查詢及數(shù)據(jù)收集整理、貸中派單及審核管理、貸后監(jiān)控及風險處置管理、客戶整體分析、成交客戶分析、模型優(yōu)化分析等功能。
● 業(yè)務分析模型,包括額度預估模型、風險評估模型、風險預警模型以及基礎的電商刷單模型、去庫存能力模型等基礎模型。平臺根據(jù)銀行的業(yè)務要求及運營情況,在系統(tǒng)中通過參數(shù)配置,對評分結果、監(jiān)控風險管理級別進行分層、分級處理,保障系統(tǒng)的靈活性,滿足業(yè)務運營的需要。
● 基礎數(shù)據(jù):系統(tǒng)對接口方錄入的數(shù)據(jù),根據(jù)業(yè)務需求構建相應的數(shù)據(jù)存儲模型,包括電商主要銷售產(chǎn)品的行業(yè)統(tǒng)計數(shù)據(jù),商家基礎信息數(shù)據(jù)、商家運營情況數(shù)據(jù)、商家主要經(jīng)營人數(shù)據(jù),為后續(xù)分析和運營提供數(shù)據(jù)基礎。
● 應用管理包括系統(tǒng)管理、數(shù)據(jù)管理、運維管理、信息管理,為系統(tǒng)的正常運營、安全管理、數(shù)據(jù)質量提供保障,為系統(tǒng)的正常運行提供服務。
3.3數(shù)據(jù)需求分析
1)企業(yè)數(shù)據(jù)
主要包括企業(yè)基本信息,經(jīng)營信息,信用信息,從不同角度反映企業(yè)的銷售能力,信用能力,運營能力,存在風險和抗風險能力,該數(shù)據(jù)主要通過企業(yè)提供錄入,網(wǎng)站爬取,接口調用的方式接入。
2)店鋪數(shù)據(jù)
主要包括店鋪基本,經(jīng)營信息,反映店鋪的健康指數(shù),行業(yè)所處位置,產(chǎn)品開發(fā)和運營能力,以及店鋪持續(xù)的營運能力和存在的風險情況,該數(shù)據(jù)主要通過企業(yè)提供錄入,網(wǎng)站爬取,接口調用的方式接入。
3)個人數(shù)據(jù)
主要包括個人基本信息,信用信息,作為企業(yè)的法人,主要負責人和風險承擔者,從企業(yè)主的個人基本情況,個人貸款情況和社會角色的誠信度等方面反映主貸人的還款意愿和還款能力,該數(shù)據(jù)主要通過企業(yè)提供錄入,網(wǎng)站爬取,接口調用的方式接入。
4)行業(yè)數(shù)據(jù)
主要包括行業(yè)基本信息,該行業(yè)主要以企業(yè)經(jīng)營的電子商務平臺所在行業(yè)情況分析,反映店鋪經(jīng)營情況在行業(yè)中所處于的排名和競爭力,該數(shù)據(jù)主要通過網(wǎng)站爬取方式接入;
5)征信核查
主要包括企業(yè),個人,工商注冊類,銀聯(lián)交易賬單查詢,其他查詢共計5塊內容,從不同角度對企業(yè),個人錄入信息數(shù)據(jù)進行合法性校驗和稽核,以確保信息的真實性和合法性,該數(shù)據(jù)主要通過接口調用的方式接入。
6)通信行為數(shù)據(jù)
主要包括身份信息核驗,身份屬性,手機號碼,常駐地匹配,緊密聯(lián)系人等不同角度反映消費能力和誠信度,該數(shù)據(jù)主要通過接口調用的方式接入。
3.4系統(tǒng)應用
依據(jù)客戶申請單中提交的個人、企業(yè)及店鋪信息,收集、整理并分析相關信息,綜合評估客戶的貸款風險,為銀行最終確定授信額度提供參考。
數(shù)據(jù)建模采用熵值法,分別根據(jù)指標大類分類體系,共分為基本信息、銷售能力、信用歷史、風險保障以及運營能力五大類,并分級對各級指標的權重進行進行計算,并進行取整調整,得出具體的模型如下:
圖表:風險評估得分示例
4、結束語
本文以電商數(shù)據(jù)、電信數(shù)據(jù)、銀行數(shù)據(jù)的共享以及銀行風險評估模式為基礎,通過大數(shù)據(jù)技術、數(shù)據(jù)挖掘技術、數(shù)據(jù)可視化技術,完成的一套電商領域的征信系統(tǒng)。完成了業(yè)務模型開發(fā)、基于大數(shù)據(jù)平臺的數(shù)據(jù)分析和加工、數(shù)據(jù)挖掘分析、產(chǎn)品展示等功能。實現(xiàn)了電商、電信、銀行數(shù)據(jù)的跨領域應用,通過分析挖掘、服務共享的方式為銀行在電商領域開展貸款業(yè)務提供服務的能力。有效的提升銀行貸前風險識別能力,及貸后對風險的控制能力,提升銀行資產(chǎn)的利用效率。
作者曾振、王建紅 單位創(chuàng)發(fā)科技有限公司湖南長沙;掌錢電子商務有限公司湖南長沙
《基于大數(shù)據(jù)的電商領域征信模型及風險控制系統(tǒng)設計與實現(xiàn)》
- 職稱論文刊發(fā)主體資格的
- 政法論文淺析工會法主體
- 化學在初中教學中的情感
- 中學教育論文思想政治方
- 法治論文投稿法治型市場
- 雜志社論文發(fā)表淺析推動
- 新疆教育報投稿淺析學生
- 分男女招生錄取的合憲性
最新優(yōu)質論文
- 寫高職英語教育的論文怎
- 水利水電工程師職稱論文
- 膜分離相關論文發(fā)表期刊
- 音樂課老師晉升職稱必須
- 河南群眾文化類職稱評審
- 職稱論文發(fā)表可靠網(wǎng)站有
- 環(huán)境工程晉升高級職稱條
- 知網(wǎng)能免費下載論文嗎
論文發(fā)表問題熱點
- 泥泵磨損論文適合哪些期
- 學術期刊規(guī)范化需要注意
- 哪能咨詢發(fā)表論文期刊的
- 中醫(yī)藥論文準備常見問題
- 工程師中級職稱評審條件
- 會計畢業(yè)論文職稱論文準
- 自考本科論文格式要求
- 發(fā)表論文必須本省的期刊