近日,多家通過爬蟲技術開展大數據信貸風控的公司被查。短短幾天時間,“爬蟲”技術被推上了風口浪尖,大數據風控行業也迎來了前所未有的“震蕩”。業內人士透露,這些被調查的大數據公司基本都是涉嫌利用網絡爬蟲技術侵犯個人隱私,并將這些數據信息轉賣給其他機構獲利。
“爬蟲”變成了“害蟲”?
何為爬蟲?百度百科給出的定義是,網絡爬蟲,是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。
據了解,爬蟲的發展歷史可以追溯到20年前,搜索引擎、聚合導航、數據分析、人工智能等業務都需要基于爬蟲技術。隨著互聯網的發展,網絡資源有大量信息的載體,如何更好更有效地提取并利用它,爬蟲技術起到關鍵作用。爬蟲技術在信息定位也比較準確,可以根據客戶的搜索需求爬取最合適的數據推送出去。而且現在大數據處理方面,爬蟲技術可以對爬取的數據進行分析從而得出比較準確的數據。
爬蟲技術的優勢不言而喻。技術是中立的、無罪的,但技術被頗有用心的人亂用就會出現問題。近期暴露出來的事件就是最大的警示。
事實上,自2016年開始,大數據風控、智能風控、智能催收逐漸成熟,并且開始應用于互聯網金融領域。從金融發展的角度來講,這是一件好事兒,大大降低了行業成本。而且隨著大數據的出現和興起,第三方大數據風控平臺也迎來一波發展高潮。
然而,提供信用評估類服務的第三方風控商在解決小額信貸多頭借貸、欺詐等風險問題的同時,也在無形中掌握了用戶貸前、貸后等各類信息數據。
“風險來源于過分地獲取用戶數據,并且利用這些數據干一些‘見不得人’的事兒。”知名金融科技分析人士畢研廣告訴記者。
畢研廣分析道,其實,很多數據公司從一開始最為基礎的業務是“爬蟲業務”,后來演變到給金融機構或者互金平臺做風控系統,或者幫助平臺開發設計“線上放貸系統”。做系統不賺錢,還是賣數據賺錢。但是這一舉措也讓“爬蟲”變成了“害蟲”,非法獲取、銷售個人隱私數據,必定涉及到了違法犯罪。
據了解,爬蟲技術的數據采集主要包括:公開的第三方數據;抓取用戶主動授權的個人基本信息、聯系人信息、銀行卡信息等數據;授權抓取數據,如設備號、IP地址、運營商/電商等用戶授權后合規采集數據;經授權的平臺數據,如用戶在平臺的歷史借款、還款情況等用戶已在注冊協議或隱私協議中授權業務方進行分析的數據。
那爬蟲技術在數據采集過程中是否經過用戶授權、是否存在過度爬取信息、爬取到的信息用途不明等也成為當下人們關注的焦點。
對此,中國社會科學院金融研究所法與金融研究室副主任尹振濤表示,一方面公共數據的爬取是不允許商業利用的,并不是說互聯網的數據可以隨便爬取。另一方面有些客戶提供淘寶號,甚至密碼授權爬取,在爬取時就侵入了對方的計算機,這其實也是一種犯罪行為,叫作侵入計算機犯罪。
以“爬蟲”為主的大數據公司稱不上金融科技公司
不可否認,當前大數據風控行業對個人隱私缺乏保護,存在廣泛的數據濫用問題。對此,業內普遍呼吁監管的加強。
近兩年,很多互聯網金融平臺轉型,也有一些做數據的平臺,他們都強調自己做的是金融科技。是真科技還是假科技?轉型助貸、網絡小額貸業務,是合規的還是不合規的?
在畢研廣看來,現在的互聯網金融、金融科技還處在一個相對的“混沌期”。相信隨著政策的不斷清晰化、監管對行業整治的不斷深化,也將逐漸清晰起來。以“爬蟲”為主的大數據公司稱不上金融科技公司。
事實上,今年以來,監管逐漸趨嚴。5月28日,國家互聯網信息辦公室發布的《數據安全管理辦法(征求意見稿)》明確規定,網絡運營者通過網站、應用程序等產品收集使用個人信息,應當分別制定并公開收集使用規則;網絡運營者以經營為目的收集重要數據或個人敏感信息的,應向所在地網信部門報備收集使用規則、使用目的和保存期限等。
日前,浙江發布《中國銀保監會浙江監管局辦公室關于進一步規范個人消費貸款有關問題的通知》(浙銀保監辦發〔2019〕213號),明確提出,不得將授信審查、風險控制等核心業務外包。
國家發展改革委9月16日發布《關于推送并應用市場主體公共信用綜合評價結果的通知》,根據通知,國家發展改革委組織國家公共信用信息中心會同相關大數據機構對全國3300萬家市場主體開展了第一期公共信用綜合評價,現將評價結果推送,并就充分應用公共信用綜合評價結果,推動落實以信用為基礎的新型監管機制。
“一系列監管政策的下發對行業的長遠發展起到了積極作用。”蔣韜說,“當前監管機構并不是采取了所謂一刀切的態度和做法,而且依法對于沒有合規經營、侵犯個人隱私的企業進行調查,對于加速清退劣質企業、保護用戶權益、促進優質企業發展有重要意義。”
蔣韜認為,長久來看,隨著金融機構第一方數據積累以及第三方數據源壁壘降低,輸出數據分析能力將成為風控公司更好的商業模式,提供標準評分卡產品+數據科學家咨詢能力,將成為更有競爭力的商業模式。
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238265 -
數據分析
+關注
關注
2文章
1445瀏覽量
34050 -
大數據
+關注
關注
64文章
8882瀏覽量
137403
發布評論請先 登錄
相關推薦
評論