2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ 備案號:
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)
人工智能和大數(shù)據(jù)技術(shù)正在重塑整個金融產(chǎn)業(yè)生態(tài)鏈,尤其在網(wǎng)貸產(chǎn)業(yè)中,人工智能和大數(shù)據(jù)的潛力正在被深層次挖掘。6月15日,億歐金融在上海正式舉辦“2018智能+新商業(yè)峰會——智能+新金融峰會”,探析AI、區(qū)塊鏈分布式技術(shù)和大數(shù)據(jù)帶來的金融業(yè)智能化,展望新一代智能金融的基礎設施和未來應用藍圖,推進智能金融的演進。此次峰會由上海市經(jīng)濟和信息化委員會、上海市商務委員會、上海市長寧區(qū)人民政府、上海市互聯(lián)網(wǎng)金融行業(yè)協(xié)會指導,上海市長寧區(qū)青年聯(lián)合會和億歐公司聯(lián)合主英凡研究院、星合資本、百融金服、融360、同盾科技、包銀消費金融、新網(wǎng)銀行、網(wǎng)商銀行、快牛金科、拍拍貸、恒昌公司、光速中國、宜信新金融產(chǎn)業(yè)基金等單位出席本次峰會。恒昌CTO薛正華現(xiàn)場發(fā)表了題為《新科技驅(qū)動的新普惠金融》演講,薛正華演講要點如下:
1、網(wǎng)貸是一個非常有挑戰(zhàn)的行業(yè),想做好特別不容易。
2、網(wǎng)貸行業(yè)競爭非常激烈,同時隨著監(jiān)管收緊,很多政策上的紅利也慢慢消失了。
3、金融領域核心的東西是風控。風控的基礎是什么?大數(shù)據(jù)。
4、信貸知識圖譜將成為金融產(chǎn)業(yè)的基礎設施,在諸多領域的應用變得越來越重要。
5、人工智能作為金融產(chǎn)業(yè)的基礎,未來將應用在整個信貸全生命周期,從獲客到風控到貸后的資產(chǎn)管理都將發(fā)揮巨大作用。
以下是薛正華演講正文:
各位親愛的嘉賓們,大家下午好!非常感謝大家這么晚了還能夠堅持在這里聽我們的各種想法和報告。我想給大家呈現(xiàn)一些在金融科技領域的一些實戰(zhàn)的干貨,和大家分享一下。
首先我想和大家分享一個數(shù)據(jù),大家看到這個是最近幾年網(wǎng)貸行業(yè)變化的情況,在大家左手邊是整個網(wǎng)貸行業(yè)成交量的走勢,2016年底,2017年左右的時候達到了高點,從2017年開始往下走。
右手邊的圖,大家可以看到的是,整個正常運行網(wǎng)貸平臺的數(shù)量,2015年底開始有一個跳水,為什么會出現(xiàn)這種情況?我覺得這個跟很多行業(yè)非常類似,就是剛開始的時候都是上千家平臺,我不知道大家記不記得“千團大戰(zhàn)”,大家想想今天還剩下幾個團購公司。
網(wǎng)貸也是一樣的,最多的時候應該有三五千家,但是在這兩年大量的沒有競爭力的一些網(wǎng)貸公司紛紛倒下了,為什么倒下?我覺得有幾方面的原因。
第一,從事這個領域的網(wǎng)貸平臺沒有意識到網(wǎng)貸是一個非常有挑戰(zhàn)的行業(yè),想做好特別不容易。
第二,競爭非常激烈,同時隨著監(jiān)管的收緊,很多政策上的紅利也慢慢消失了,所以說這是為什么會出現(xiàn)這么一個圖形的原因。
這兩年大家在說大數(shù)據(jù),大家知道在金融領域核心的東西是風控。如果風控厲害,可以把業(yè)務規(guī)模往大撐,這樣可以進入收益的正循環(huán)。如果你的風控不行,業(yè)務規(guī)模越大,死的越快。所以說,風控是金融最核心的東西,不管是網(wǎng)貸還是傳統(tǒng)的金融業(yè)務,是一樣的。
風控的基礎是什么?大數(shù)據(jù)。
那么,不管是網(wǎng)貸平臺還是銀行,如果沒有足夠強的大數(shù)據(jù)作為基礎,你說能把風控做好,沒有人相信。所以,大數(shù)據(jù)是風控的基礎,這個邏輯非常清楚,想把金融行業(yè)做好就得把風控做好,想把風控做好就有得非常強大的數(shù)據(jù)基礎。
在過去幾年,我們在大數(shù)據(jù)方面有幾方面的來源。一個是我們自己業(yè)務的數(shù)據(jù),另外一個是公開的一些數(shù)據(jù),比如說網(wǎng)上公開的這些名單,包括在58,百度、貼吧、趕集公開的地方收集的,這些名單我們會篩選處理,選出白名單、灰名單和黑名單,我們現(xiàn)在也有4000萬左右的數(shù)據(jù)。另外一部分是用戶合法授權(quán)的一些數(shù)據(jù),這個我們會把它作為信貸的重要考量的標準。
有了這些數(shù)據(jù)之后,如何用這個數(shù)據(jù)?這是一個非常關鍵的問題,怎么支持恒昌的核心業(yè)務,怎么把信貸做好。恒昌2016、2017年投入了非常大的團隊在做的工作,就是大規(guī)模的信貸知識圖譜,我們構(gòu)建了支持上億,上百億關系的超大信貸知識圖譜。
信貸知識圖譜怎么用?我給大家舉幾個實例,大家右手邊是真實的案例,我們把東北部一個省,2015年、2016年兩年的數(shù)據(jù)做了一個數(shù)據(jù)分析,王某在做借款的時候會提交很多信息,比如你的姓名、身份證、聯(lián)系方式、聯(lián)系人、電話號碼,包括你的工作單位等等非常多的信息,知識圖譜系統(tǒng)把這些數(shù)據(jù)作為一個節(jié)點存在。
另外一個借款人姓高,也有很多屬性,我們的知識圖譜系統(tǒng)會把他的屬性和已經(jīng)有的屬性進行自動關聯(lián)和匹配,我們發(fā)現(xiàn)三個人是同一家公司的,那么我們系統(tǒng)會給他自動構(gòu)建一個同事關系鏈,我們經(jīng)過大數(shù)據(jù)統(tǒng)計分析,我們發(fā)現(xiàn)當一個人周圍不管什么關系連接起來的,如果有兩個出現(xiàn)過逾期,這個人出現(xiàn)逾期的概率是89%。如果有三個人都是有問題的,那么他出現(xiàn)的概率是91%、96%。我們用大數(shù)據(jù)的方法,用圖的關系生成一些新的欺詐和信用有關的。這是用知識圖譜做的事情。
我再舉一個例子,這是一個實例,目前我們公司做了有超過100萬的貸款用戶,用戶里面,每個用戶假設有一百個屬性,各種屬性,大家想想這個數(shù)據(jù)項有多少,有一個多億的數(shù)據(jù)項。想在一個多億數(shù)據(jù)項里面找到不同數(shù)據(jù)項之間的關聯(lián)是比較麻煩的,在知識圖譜里面我們通過機器自動找出關系。
舉一個例子,比如大家的右手邊看到這個實例。這五個人在不同的時間、不同的地點來提交的,我們發(fā)現(xiàn)這五個人竟然用同一個郵箱,這是不可能的。郵箱我們每個人只有一個,為什么出現(xiàn)這樣的情況,這是非常典型中介代辦的欺詐案例。中介為了省事,因為他要包裝很多人騙貸,就會申請郵箱,如果我們通過了會發(fā)一些郵件信息,他為了處理起來方便就用一個。這個時候,我們通過這些技術(shù),通過知識圖譜關系,自動把欺詐的過程炸出來,不用人去做。
信貸知識圖譜還能干什么?第三個業(yè)務場景,就是行業(yè)的難題——失聯(lián)修復,就是說在小額貸行業(yè)里面,很多人借錢以后電話號碼一扔,就找不到他了,其實也能找到,因為他是小額的,找這個人花的成本太高了,很多大公司就不找了,但是這樣的話就造成逾期,而且很多人知道這個東西以后就惡性逾期,這是一個非常不好的問題。怎么解決這個問題呢?我們在過去也是利用圖譜,在我們的系統(tǒng)中一個人周圍有一兩百個人一度聯(lián)系人,我們通過算法和分析,在一百多個一度聯(lián)系人當中篩選出哪些人跟他有強相關性,我們會給每一個編一個權(quán)重來計算判斷,比如通過頻次比較高,比如說稱呼里面爸爸媽媽之類的,我們會把權(quán)重加高,或者單位的領導等等,我們通過一度聯(lián)系人找到他。
大家可以看到,其實我們在上線這個技術(shù)的當月,我們的失聯(lián)修復已經(jīng)到了行業(yè)的非常高的水平,目前我們已經(jīng)到了40%的水平,我相信隨著我們圖譜數(shù)據(jù)量增多,我們最終達到80%,90%的水平,徹底把這個難題解決掉。
剛才和大家分享了一些大數(shù)據(jù)方面的工作。人工智能領域我們在2016年12月份的時候,上線了人臉識別,后期我們跟行業(yè)里面做的非常好的頂級的人臉識別公司合作,進行借款人身份證的識別。
2017年10月份,恒昌的聲紋識別系統(tǒng)上線,聲紋和眼睛的虹膜都是人體唯一的標識,為什么做這個事情,我們發(fā)現(xiàn)大部分欺詐是中介包裝,普通人是比較難的,但是中介因為整天研究各家平臺風控的漏洞等等,它是比較專業(yè)的。怎么能夠防住這些人欺詐呢?我們后來討論很多,我們發(fā)現(xiàn),有一個東西很難改變就是他的聲音,我們通過聲紋的識別,他上次幫借款人騙我們,比如他是借款人的某某領導,下次變成另外一個公司的領導,我們就根據(jù)他的聲音判斷出來他已經(jīng)出現(xiàn)過了,到目前為止我們已經(jīng)累計了30萬的聲紋,目前我們的技術(shù)可以做到9秒鐘識別出30萬樣本中這個聲音是否出現(xiàn)過,利用語音識別技術(shù)把聲音翻譯成文本,比對一下文本和上次文本的差異到底多大,來識別出是不是有欺詐。
我們目前正在全國試點的技術(shù),就是我們的遠程面審技術(shù),過去人要到門店去看,效率比較低。2017年10月份,恒昌研發(fā)了遠程面審,客戶可以在任何時間、任何地點進行面審,提高效率,降低欺詐的可能,特別降低內(nèi)外勾結(jié)的欺詐,因為你不知道被誰審。
今天更多是在把人工智能的一些技術(shù),除了剛才大家看到的反欺詐技術(shù)之外,我們應用在我們整個信貸全生命周期,從獲客到風控到貸后的資產(chǎn)管理。這是我們目前流量方面做的工作,我們在過去一年多,我們合作了三四百家渠道,包括融360,包括百融等等都有四五十家大的,還有三百多家小的貸款超市,和他們合作。合作之后怎么持久穩(wěn)定地發(fā)展呢?我們對整個渠道上百家的渠道進行量化評分,我們根據(jù)客戶的轉(zhuǎn)化情況,以及逾期情況進行量化評分,以此篩選出來哪些渠道是好的客戶,哪些渠道是差的渠道,不斷循環(huán)迭代,這里面也是對渠道進行量化評分,做調(diào)控,以及精準管控。
第二塊也是我們最核心的東西,我們會繼續(xù)地把我們的風控利用圖譜以及深度學習的技術(shù)進行反欺詐的識別。最后會把整個人工智能技術(shù)應用在貸后的資產(chǎn)管理等多方面。
另一方面我們做了一次改進,我們讓每一次打分之后必須有一個反饋,我的評分不一定是準的,我們評1-10分,1是容易的,10是比較難的。你實際作業(yè)過程當中,發(fā)現(xiàn)這個1挺難回款的,應該是5才對,這個分數(shù)反饋給機器,我們差不多有六七百個做貸后作業(yè)的人,這六七百個人平均每天打電話的次數(shù)在200-300通,假設算200,每天可以反饋12萬的數(shù)據(jù)告訴機器你評錯了,或者你評的很準,這樣的話,人和機器不斷的交互,機器通過大數(shù)據(jù)分析的結(jié)果告訴人,讓人更加高效回款,人實際的作業(yè)情況反饋給機器,模型就會不斷迭代,越來越突出。我們相信利用這些技術(shù)可以把貸后深度學習的技術(shù)做的更好。
最后,大家可以看到左手邊的技術(shù)都是我們已經(jīng)上線的技術(shù),右手邊的這些技術(shù)也是正在不斷完善的技術(shù)。我們相信通過我們的大數(shù)據(jù)技術(shù),通過我們的生物識別技術(shù),通過我們的深度學習做的模型技術(shù),在獲客的模型,在風控反欺詐,在貸后的模型,我相信人工智能的技術(shù)、大數(shù)據(jù)的技術(shù),一定會讓普惠金融做的越來越好。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ 備案號:
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)