[專欄]“垃圾進,垃圾出” 大數(shù)據征信可靠不可靠 - 副本_第1頁
[專欄]“垃圾進,垃圾出” 大數(shù)據征信可靠不可靠 - 副本_第2頁
[專欄]“垃圾進,垃圾出” 大數(shù)據征信可靠不可靠 - 副本_第3頁
[專欄]“垃圾進,垃圾出” 大數(shù)據征信可靠不可靠 - 副本_第4頁
[專欄]“垃圾進,垃圾出” 大數(shù)據征信可靠不可靠 - 副本_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、專欄“垃圾進,垃圾出”大數(shù)據征信可靠不可靠來源:金融混業(yè)觀察時間:2015-04-27 作者:王強當今大數(shù)據風行一時,各行各業(yè)都趨之若鶩。在征信業(yè)更是如此。但如果認真的問一下,什么是大數(shù)據,卻沒有一個一致的答案。很多分析認為借貸雙方信用信息是非對稱的(asymmetric,大數(shù)據可以幫助貸方彌補與借方信息的差距。這個論點的前提是對的,但美國的經驗證明信用報告能夠很好的解決這個問題。而大數(shù)據用于征信存在一些很難逾越的障礙。大數(shù)據由來準確性是征信的第一準則。本著這種精神,我們來看一下大數(shù)據的由來和其準確定義。在美國計算機協(xié)會數(shù)字圖書館中,大數(shù)據(Big Data 第一次出現(xiàn)是在1997年10月,邁

2、克爾·考克斯 (Michael Cox和大衛(wèi)·埃爾斯沃思(David Ellsworth發(fā)表的一篇關于處理圖像數(shù)字化后數(shù)據量管理的文章里。文章開頭指出“圖像數(shù)字化給計算機系統(tǒng)出了一個有趣的難題,數(shù)據都相當大,占用主存儲器,終端磁盤,甚至遠程磁盤的容量。我們稱之為大數(shù)據的問題?!睆倪@以后,數(shù)據隨著互聯(lián)網的發(fā)展呈現(xiàn)爆炸式增長。“大數(shù)據”也成為各行各業(yè)的一個熱門的話題。明白“大數(shù)據”始于圖像數(shù)字化非常重要。大數(shù)據包括:可視化數(shù)據 - 視頻,照片,指紋印記等;言語數(shù)據 - 聲音和語言,其他聲音(動物,自然;社會關系 - 工作和個人關系(LinkedIn;各種同時和即時的活動 -人類

3、,動物或自然(信用卡交易,微博,人類活動,傳感器和計量器等;等等。但占壓倒性比例的數(shù)據是影像。思科(Cisco公司去年的報告指出,目前美國78%的互聯(lián)網流量是影像。這一比例在三年內會增加到84%。影像在所有新創(chuàng)數(shù)據中的比例,應該是接近或超過它在互聯(lián)網流量中所占的份額。具體到征信領域,通常把信息局和銀行搜集的數(shù)據叫做常規(guī)數(shù)據,其他的叫大數(shù)據。大數(shù)據包括了所有可以獲得和可以產生的數(shù)據。和常規(guī)數(shù)據相比,“大數(shù)據”種類多樣(影像,產生速度更快(90%的數(shù)據是近兩年產生的,數(shù)據量比常規(guī)數(shù)據大千倍萬倍。這些特點使得傳統(tǒng)數(shù)據分析工具和方法難以應對。美國征信業(yè)的起源國務院“征信管理條例”對“征信業(yè)務”做出了明

4、確定義:“征信業(yè)務是指依法收集、整理、保存、加工個人、法人及其他組織的信用信息,并對外提供信用報告、信用評分、信用評級等的業(yè)務活動”。簡而言之,征信是建立和提供“信用檔案”和“信用評級”。將此“征信業(yè)務”定義用于美國,它包括了四項相當不同的業(yè)務:1.個人信用信息局 - 包括美國三大信用信息局Equifax、 Experian、和Trans Union 和很多小型個人信息公司。2.信用評分 - 主要用于個人。FICO(費埃哲基本上壟斷了這一行業(yè)。3.商業(yè)信用信息局 - 未上市公司的信用信息主要由一家公司Dun & Bradstreet(鄧白氏壟斷。上市公司信用信息公開,在美國證卷交易委員

5、會(SEC的網站上即可獲得。4.信用評級 - 主要用于商業(yè)公司。美國有很多企業(yè)在這一領域。但最重要的有三家Standard & Poor's (S&P、 Moody's 和 Fitch Group.個人和企業(yè)征信有根本的區(qū)別。本文只討論個人征信。企業(yè)征信將在另一篇詳細論述。在美國,當一個人到銀行去借錢,銀行要對借款人進行“5C”(Character、Capacity、Capital、Collateral、Conditions貸前分析和審查,以確定借款者是否會還本付息。分析和審查需要的數(shù)據,包括認識借款者是誰和其人品,以前是否借過錢,是不是有過借錢不還的記錄(Ch

6、aracter;借多少錢,什么用途;最近幾年收入多少;借款人財產情況;根據收入和財產判斷它是否能按時還錢 (Capacity;如果借錢買房,本金占多少比例(Capital;房子價格、狀況(Collateral;此外還要分析當?shù)氐姆渴泻徒洕闆r(Conditions。銀行會要求借款人提供一系列的證明材料:收入、財產證明、銀行月報、信用卡和已有房貸月報,以及其它報表;銀行的信貸員還要打電話給申請人單位或者登門拜訪,以了解申請人的人品、收入可靠性和穩(wěn)定性等。銀行要花很多時間,做很多工作。如果借款額大(在美國高于十萬美元,銀行有錢賺,借款人也可以理解。但如果是申請一個少于三萬美元的信用卡,上述的過程讓

7、銀行代價太大,借款人也很麻煩。這個小額貸款對借貸雙方費用都太高,也就做不成了。當這成了一個需要解決的社會問題時,征信業(yè)應運而生,其目的是提供一個“信用檔案”來減少或取消信貸、保險及雇傭過程中所需數(shù)據的采集和費用。美國公平信用報告法案解決個人征信問題美國在1970年通過公平信用報告法案以后,通過幾十年的摸索和實踐,基本上解決了個人征信問題。房貸中的人品分析和已有債務在信用檔案中可以直接找到,減少了分析和審查的工作量。而對于無抵押小額貸款或信用卡申請,信用檔案加上申請人口頭報告的收入情況,就可以滿足貸前分析和審查的數(shù)據要求。這極大減少了銀行無抵押小額貸款或信用卡發(fā)行的費用,其結果是信用卡在2000

8、年普及到美國成人人口的80%。公平信用報告法案以法律的形式具體規(guī)定個人信用信息局、信息使用者和信息提供者的責任和義務。要求個人信息局公平、合理、準確,保護個人信息和隱私。法律指出消費者有了解自身信用文檔的權利;信息局對外透露個人信息須有信息主體本人書面同意或其他具體合理用途;當信息主體本人提出信息不準確不完整時,信息局和信息提供者必須調查并給與答復。該法案還規(guī)定,個人信用檔案中超過一定年限的負面紀錄必須刪除。例如,破產記錄只能保留7年。至于信用評分使用的信息,法律界有一致的解釋。公平信用報告法案適用于個人信用評分使用的所有信息。這就是為什么FICO只使用信用信息局的信息來評分。在公平信用報告法

9、案通過之前,很多信息局的信息中,除了直接從債權人處獲取的屬于具體事實的消費者信用記錄,還有一部分被定義為“消費者調查報告”的非事實信息。它的目的是了解一個消費者的性格、信譽、個性特征及生活方式等;其信息是通過“調查訪談”認識或者知道被調查者的人群,比如被調查者的鄰居、朋友、同事或者合伙人等。公平信用報告法案對這種調查行為和信息進行了詳細定義和具體限制,把它摒棄于公平信用報告之外,目的是使信用報告符合三大原則:準確性,透明性,相關性。大數(shù)據征信難題征信法律是大數(shù)據征信的第一個難題。去年三月,美國國家消費者法律中心對主要的大數(shù)據征信公司進行了調查并發(fā)表了一篇重要的調查報告。題目是大數(shù)據,個人信用評

10、分的大失望。文章指出大數(shù)據征信公司的信息錯誤率高于50%。這些公司的數(shù)據模型繁多又復雜,使用不準確的數(shù)據,有“垃圾進,垃圾出”之嫌。文章對這些公司的合法性提出質疑,建議政府加強監(jiān)管。大數(shù)據征信在中國問題更大。“征信管理條例”明確規(guī)定“采集個人信息應當經信息主體本人同意,未經本人同意不得采集。”。這比美國公平信用報告法案對信息采集的要求更嚴格。如何按照條例要求,讓信息主體本人同意用沒人能說得清的大數(shù)據對其進行征信,這不是個容易事。壞賬的不可預測性是大數(shù)據征信的第二個難題。征信的目的是預測借款人是否會守信還貸。那么人為什么會借錢不還?這里面有兩個原因,一是有錢就是不還;二是想還就是沒錢。第一種情況

11、在美國很少。原因是信用報告和就業(yè)、住房相關,對中產階級價值很高。有工作、有錢的人不會為幾萬美元債務毀掉自己的信用,這是賠本買賣。但是 2008年房貸危機后產生了一個比較特殊的現(xiàn)象叫做策略性欠債不還借房貸的房主在房價下跌到比貸款額低很多的時候,再去買一棟房子,然后不付以前買房子欠的貸款,把以前的房子還給銀行。這一策略可以“套利”幾十萬美元。銀行只能把房子收回,損失幾十萬美元。雖然這些人的信用記錄上會有一個污點,但是這對信用報告的影響有限,因為其他的債務照付不誤。這種壞賬歷史上沒出現(xiàn)過。造成這一現(xiàn)象的原因一部分是經濟和房價波動,但更主要的原因是政府政策失誤。大數(shù)據對這種壞賬的預測(征信能力非常有限

12、。至于沒錢還債又可分成兩個原因。一個原因是借款人花錢花得多了,入不敷出。美國的一些研究調查顯示大概有三分之一的美國人是“月光族” - 每個月把掙的錢基本上花光。這部分人很多是低收入,一旦發(fā)生意外,比如車禍、生病,或者別的一些緊急用錢的情況,他們就只能把能借到的錢都用上。這些借款的利息都很高,利滾利,時間久了,還不了債,就成了壞賬。有了壞賬信用評分就比較低。這部分人有一個不雅的統(tǒng)稱叫“次貸借款人”(subprime borrower,在個人信用信息局的檔案里占20%-25%。銀行根據信用報告和信用評分的信息識別這樣的客戶,對他們非常謹慎,貸款卡的緊,貸款額比較低,利息也比較高。美國幾乎所有大數(shù)據

13、征信公司都是在做“次貸借款人”的征信細分(包括頗受國內關注的Zestfinance,聲稱可以通過大數(shù)據找出其中信用好的借貸人,但到目前成效不大。另一個原因,也是最主要、最普遍的原因是借款人收入出了問題。美國人失業(yè)后可以領取失業(yè)保險金。美國“勞工統(tǒng)計局”的數(shù)字顯示在經濟好的時候,每四個星期新增領取失業(yè)保險金的人口大約是28萬人,其中15%的人失業(yè)時間會超過半年,稱為長期失業(yè)。一年平均長期失業(yè)人口約為55萬。這個人群中多數(shù)也屬于“次貸借款人”。而在2009年經濟危機的時候,每四個星期新增領取失業(yè)保險金的人是65萬,長期失業(yè)的比例是45%,當年長期失業(yè)人口約為380萬。也就是說,經濟差的年份里長期失

14、業(yè)率是經濟好的時候的7.2倍,按人頭計算是增加了325萬人。增加的這部分長期失業(yè)人群大多數(shù)曾是“優(yōu)良借款人”(super-prime or prime borrowers。美國信用卡的壞賬率在2006年是3.5%,而在2010年是10.5%。這七個百分點的增加幾乎全部是新增長期失業(yè)人口造成的。經濟好的時候,要預測哪年會發(fā)生經濟危機、哪些人會失去工作、失去工作中的哪些人會賴賬,這是不可能的?,F(xiàn)在的經濟情況和2006年有些相似,沒有聽說過用大數(shù)據預測下一個經濟危機的,但要用大數(shù)據征信的公司倒有不少。如果清楚壞賬增加的主要原因是經濟危機造成的失業(yè)等內在的不可測性,那么大數(shù)據的局限性也就很明顯了。大數(shù)據如何作用于金融領域那么大數(shù)據在金融領域有沒有作為?答案是肯定的。大數(shù)據會促進銀行業(yè)的發(fā)展和變革,但它的應用領域會有兩個特點:1對準確性的要求會比征信低一些; 2會用很多錄音和影像視頻。在風險管理方面,大數(shù)據在減少欺詐、貸后管理以及壞賬征收方面有很多應用;在市場營銷,客戶管理,也有很多成功的例子。金融領域的大數(shù)據創(chuàng)新應該在這些方面下工夫。總之,我們今天熟悉的個人信用報告體系是美國經過半個世紀的摸索,實踐,提煉形成的。 它以最高的效率、最低的成本解決了就業(yè)、信貸、保險交易過程中,信貸雙方財務和信用記 錄信息不平衡的問題。由于信用報告是透明、準確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論