来源:北京商报
原标题:互金大数据平台被查背后网络爬虫侵犯隐私产业链整肃
大数据风控行业迎来多事之秋。继魔蝎科技、新颜科技遭遇警方调查之后,公信宝运营主体——杭州存信数据科技有限公司(以下简称“存信数据”)近日也被杭州市公安局西湖分局古荡派出所查封。同时,多家企业收紧或者喊停数据服务。这些操作的背后或与大数据公司涉嫌利用网络爬虫技术侵犯个人隐私有关联。分析人士指出,对没有合规经营的公司进行调查,有助于加速清退劣质企业。
多家大数据公司被查
同盾子公司已停止相关服务
9月11日晚上,关于公信宝运营主体——存信数据已被贴了封条,封条上印着“古荡派出所封”字样的消息在网上流出。北京商报记者9月15日电话联系了杭州市公安局西湖区分局古荡派出所,对方表示,此事属实。对于被查封的原因,对方表示不方便透露。
针对被调查一事,北京商报记者多次联系存信数据天眼查中预留的电话,但该电话一直提示关机。目前,存信数据官方还未正式对外回应被查封具体原因。其股东之一李笑来近日发布微博称,“做天使投资真的不是容易的事儿啊”,疑似回应“公信宝事件”。
资料显示,存信数据成立于2016年,是一家以区块链为核心技术的数据科技公司,旨在提供企业间、个人间、企业与个人之间的数据交换服务。目前,该公司已为200家互金企业提供基于区块链技术的数据交易/交换服务,官网披露的合作商户包括现金巴士、PPmoney等。
除了公信宝外,魔蝎科技、新颜科技等多家数据爬虫类企业近期也遭遇了警方调查。某知情人士对北京商报记者表示,近期被调查的大数据公司基本都是涉嫌利用网络爬虫技术侵犯个人隐私,或与助力暴力催收有关联。
北京商报记者注意到,部分同类机构也开始收紧或者喊停数据服务。例如,一家大数据采集服务商极光爬虫代理客服人员对记者表示,目前只能爬取现金贷平台的公开信息,客户隐私信息没法爬取。
值得一提的是,知名第三方大数据风控平台同盾科技近期也被卷入大数据风波潮,有消息称,同盾科技旗下子公司数聚魔盒目前网页已打不开。公开信息显示,数聚魔盒主要涉及数据采集流程,支持爬取数据用作信用评估。
同盾科技相关负责人在接受北京商报记者采访时表示,该公司没有运营爬虫技术的相关服务,主营业务是智能风控与分析决策服务。针对数聚魔盒,该相关负责人回应,数聚魔盒为同盾子公司杭州信川科技有限公司旗下的产品,该服务对适用条件与场景有严格的授权要求与限制,为更加严格地保护用户合法权益,避免个人信息被误用,并积极响应国家关于个人信息保护的相关政策,杭州信川科技有限公司自2018年开始已逐步调整业务,截至目前已全部停止相关服务。
苏宁金融研究院金融科技中心主任孙扬表示,目前对于大数据公司的整顿是“进一步做好互联网金融风险专项整治”的延续和深入,整顿进入深水区。这也表明监管层已经下定决心要互联网金融和个人隐私保护两手都要抓,抓出典型,抓出实效。
爬虫技术被推向台前
侵犯隐私产业链渐现
在互联网金融浪潮中,大数据服务供应商一直扮演着关键角色。而短短数日3家公司接连被查则将数据风控服务背后的网络爬虫技术推向台前。
据了解,爬虫是一项计算机技术,其作用是搜集网页上的信息或数据,然后把搜集到的数据搬运到自身数据库里。用户授权后,风控数据供应商通过后台“爬虫”搜集信息,将通话信息、消费数据等互联网信息进行整合,最终形成对借款人的综合评估,供金融机构做相应的后续决策。
一位不愿具名的行业内部人士介绍称,爬虫技术的数据采集主要包括:公开的第三方数据;抓取用户主动授权的个人基本信息、联系人信息、银行卡信息等数据;授权抓取数据,如设备号、IP地址、运营商/电商等用户授权后合规采集数据;经授权的平台数据,如用户在平台的历史借款、还款情况等用户已在注册协议或隐私协议中授权业务方进行分析的数据。
值得一提的是,在现金贷产业链条中,运营商数据是一个非常重要的风控维度。某知情人士指出,大数据公司在用户授权情况下,会抓取一些手机卡过往使用情况的信息,包括使用时长、常用联系人等。
对此,中国银行法学研究会理事肖飒表示,在大数据公司产业链中,运营商的责任有以下几点:首先,互相勾结情形,即在没有征得用户授权的情形下,和爬虫公司合作,这种情形是有责任的。其次是不知情的情形,运营商没有责任,甚至也是受害者。比较复杂的是,在运营商得到用户授权的情形下,运营商的责任主要体现在如何合法归置这些数据。
伴随着爬虫而来的还有“是否经过用户授权,是否存在过度爬取信息,爬取到的信息用途不明”等诸多争议。中国社会科学院金融研究所法与金融研究室副主任尹振涛表示,大数据公司采集的数据存在是否获得授权、爬取是否合法合规的问题。一方面公共数据的爬取是不允许商业利用的,并不是说互联网的数据可以随便爬取。另一方面有些客户提供淘宝号,甚至密码授权爬取,在爬取时就侵入了对方的计算机,这其实也是一种犯罪行为,叫作侵入计算机犯罪。
那么如何界定爬虫的合法性?5月28日,国家互联网信息办公室发布的《数据安全管理办法(征求意见稿)》明确规定,网络运营者通过网站、应用程序等产品收集使用个人信息,应当分别制定并公开收集使用规则;网络运营者以经营为目的收集重要数据或个人敏感信息的,应向所在地网信部门报备收集使用规则、使用目的和保存期限等。
行业冲击潮持续
加速清退劣质企业
当前,大数据风控行业对个人隐私缺乏保护,存在广泛的数据滥用问题。随着监管信号的不断释放,野蛮生长的大数据收集时代进入冷静期。孙扬认为,未来很多风控公司、征信公司以及金融大数据公司都会受到深远的影响,很多现金贷、网络贷款业务也会受到影响。
同盾科技相关负责人向北京商报记者表示,严格监管对于行业的长远发展起到了积极作用,当前监管机构并不是采取了所谓一刀切的态度和做法,而且依法对于没有合规经营、侵犯个人隐私的企业进行调查,对于加速清退劣质企业、保护用户权益、促进优质企业发展有重要意义。
“长久来看,随着金融机构第一方数据积累以及第三方数据源壁垒降低,输出数据分析能力将成为风控公司更好的商业模式,提供标准评分卡产品+数据科学家咨询能力,将成为更有竞争力的商业模式。”上述负责人说道。
如何整肃现金贷爬虫技术涉嫌侵犯隐私的产业链?肖飒分析称,没有授权的爬虫就一定是违法的,需要重点整治。现在的关键是如何面对这些看似“合法”的爬虫,重中之重就是运营商做到用户授权链的完整,明晰完整的授权链,做到源头控制。总的来说,应当尽快制定完善针对网络爬虫的数据安全法律法规,将网络爬虫引向合法轨道。若是违法进行网络爬虫,就要重拳出击,加大惩罚力度和侦查力度,涉及刑事犯罪的要重点处理。
在金融科技方面,孙扬直言,监管层面要尽快出台金融科技监管的条例,出台金融科技的具体监管规则,向监管金融业务一样监管金融科技公司,促进大数据风控行业的合规、有序、健康发展。
北京商报记者岳品瑜吴限/文
图片来源:视觉中国