站内搜索:
庞大的简历数据库让这家公司“点石成金”
日期:[2019-04-08]  版次:[A14]   版名:[财眼周刊]   字体:【
■廖木兴/制图

拥有简历累计37亿份、超10亿份通讯录、8亿自然人认知数据

起底大数据灰色产业链 1

编者按

当今社会正处于大数据时代,公众也理所当然地接受了这个现实。基本上任何商业模式,只要扯上“大数据”,就好像镀了层金般价值飚升,认为掌握了通往大金矿的钥匙。然而,对一般用户来说,有多少人清楚或了解,自己就是这个大金矿中的一粒金砂呢?在大数据淘金者手中,每个人都可能每时每刻都在被筛选、分析、画像、评价、共享、交易、推销……我们可能知道,也可能从不被告知,就算知道了,也无力阻止。

今年3月25日,号称中国最大的简历大数据公司、曾获李开复旗下创新工场投资的巧达科技(北京)有限公司(以下简称“巧达”)被警方一锅端,所有员工均被带走。

本文复盘的巧达商业模式中的问题操作,都基于巧达公开资料所做的合理推断,并非为针对巧达公司,而是为引申说明、呈现一条存在多年的简历大数据灰色产业链。

■新快报记者 郑志辉

1

“获取简历、数据变现”

公开资料显示,巧达科技成立于2014年7月,号称拥有中国最大的简历数据库,拥有2.2亿自然人的简历、简历累计总数37亿份。此外,还有超过10亿份通讯录,并且掌握着与此相关的社会关系、组织关系、家庭关系数据。结合简历、通讯录,以及外部获取的超过千亿条其他用户数据,巧达自称拥有超过8亿自然人的认知数据。

巧达是如何将这座数据富矿点石成金的呢?“我们的商业模式概括起来也就8个字:获取简历、数据变现。”巧达高管刘博曾在2015年公开表示。

根据媒体得到的一份巧达当时的商业伙伴计划介绍文件,巧达将这些数据用在教培、保险、招聘等行业,某大型地产公司、某职业教育培训机构、某分类信息网站和几家招聘网站在这份文件里被列为典型案例。

2016年,巧达科技全年收入1.2亿元,净利润4800万元;2017年,巧达科技全年收入4.11亿元,净利润1.86亿元,净利润率超过45%。

巧达显然从一开始就清楚这种大数据生意即使在当时也是可能触碰到法律红线,并且早有准备的。2015年,巧达高管曾在给客户介绍数据合规性时表示:简历中不存在民法规定的个人隐私信息,巧达只分析简历信息中的个人教育经历和个人求职经历两部分,是属于“个人可向公众开放并知悉”的信息,且数据使用时会经过脱敏处理,还称公司COO刘炜曾是中国最大的在线法律服务平台盈科律云的创始人,在法律方面把关格外严谨。

而我国从2018年5月1日起才正式实施的《信息安全技术个人信息安全规范》,其中对“个人敏感信息”的标准寄予明确说明:个人敏感信息包括身份证件号码、个人生物识别信息、银行账号、通信记录和内容、财产信息、征信信息、行踪轨迹、住宿信息、健康生理信息、交易信息等。

此外,《规范》也对个人信息使用做出明确规定,无论直接还是收集、收取用户个人信息时,都需要有个人授权,还应了解授权的同意范围,包括使用目的(如只能用于特定招聘网站的人事招聘、猎头业务),个人信息主体是否授权同意转让、共享、公开披露等。

2

三大数据获取手段惹争议

巧达的大数据生意如此受欢迎,其中的核心在于,传统的用户画像靠的是上网特征、媒体及购物偏好等相对模糊的信息,但巧达依据的是个人简历和通讯录,通过自然人数据打通了一般用户个人信息以及敏感信息,其用户画像精准到了每个人,以及他们完整的关系网络。

在巧达当年的那份商业伙伴计划书中,提到其数据获取主要有三大途径,并且都是合法的:自有招聘网站、招聘工具产品和第三方数据源。

有法律专家指出,不管是巧达还是第三方公司的招聘工具,超过为用户直接推荐工作机会之外的用途,都需要取得用户的明确许可,否则就属于擅自利用用户信息并可能侵犯隐私。

一种途径是巧达曾经提供的服务之一——简历共享,即HR或者猎头把自己用不到的简历上传换取积分,再用积分下载平台上有用的简历。法律专家认为,HR并非这些简历的所有者,简历数据归属于求职者,如果用简历到平台上换取积分,这与买卖简历本质上无差别。

还有人推测,巧达在用爬虫的方式抓取其他招聘网站的简历数据,因为巧达长期在招聘爬虫工程师,其岗位职责包括“设计爬虫策略和防屏蔽规则,解决封账号、封IP、验证码等难点攻克,负责网页信息抽取、清洗、消重和结构化处理等工作”。法律专家认为,如果有公司在未经同意的情况下抓取用户简历,该行为不仅涉嫌侵犯用户的隐私权,情节严重的涉嫌构成侵犯公民个人信息罪。

更进一步的数据交易是,巧达很可能拿着手中免费得来的简历数据和拥有其他类型数据的数据公司进行了交换,有行业人士指出,“数据交易行业里,简历数据属于比较贵的数据”,巧达可能藉此拿到了通讯录数据、消费数据等其他数据。

3

一份精准营销数据可卖0.5-2元一条

最简单的商业模式可能就是直接的数据交易。举例来说,巧达已经掌握了你的简历数据并且建立了一定的用户画像,在此基础上,通过和某些调用过通讯录的工具类APP合作,掌握你的社交网,以此找到和你消费能力相匹配的商家“精准营销”。

如某职业教育培训机构每日新增15万线索号码,但仅有手机号+简单信息,面临需求不明、付费率低、无效沟通增加成本、等问题。巧达可以自动补全意向学员的资料信息,将学员线索按照关系分配给课程顾问,并且发现学员通讯录中有培训需求的人。更进一步,还可以将课程学员号码进行产品特征建模,得出最适合该客户的前几位课程。有业内人士透露过,此类通过通讯录匹配、标记画像后的数据,提供给商家用于精准营销的收费在0.5元-2元/每条。

另外一种交易数据的方式是“卖”给求职者的老板们。巧达在2015年推过一项在职场中一片骂声的服务“爱伙伴”——让公司CEO提前知道员工离职。企业每年支付一定费用用于监测员工,一旦有员工在各大招聘网站上有信息更新,投递简历,或资料被猎头频繁查看,系统后台就会预警,“该员工很有可能打算跳槽或者被人挖走”。

讨论

谁来保护大数据时代的 渺小个体?

在法律机关最后结果出来之前,我们并不能就此下定论巧达的商业模式都是违法的。事实上,在大数据行业,对用户隐私的保护,存在太多的灰色空间,让有意藉此牟利的人游刃有余了。

互联网企业与其他企业、商家交易用户精准营销数据违法吗?只要“不具有个人识别性”就是合法的。经过加工处理后的数据财产权,到底是归属于数据的生产者,还是原始数据的拥有者?国内外至今均无明确规定。

用户能不能拒绝互联网企业将自己的简历数据用于交换或者交易?以智联招聘APP为例,用户在注册时已开宗明义“注册代表您已同意《智联服务协议》和《隐私条款》”,而服务协议中已经列明,其不但可以在不公开姓名的情况下,可以向第三方提供综合性的非个人化信息资料,对用户数据库进行分析并予以商业化的利用,而且对业务合作伙伴公司获得个人信息及之后个人信息的使用不承担任何法律责任。

离职预警的业务是否违法?有律师说,“尚处于法律灰色地带”。所以,从2015年至今,提供类似服务的互联网公司络绎不绝,如HR家、互推网、人才啊、小鱼HR助手小程序等等。

简历数据如此,那更敏感的病历、学历、购房者、理财用户大数据呢?2018年7月,山东成功破获一起特大侵犯公民个人信息案,被称为“大数据行业第一股”的新三板上市企业数据堂被指“在8个月时间内,日均传输公民个人信息1亿3千万余条”,还曾以众包模式,用每条0.2元的价格公开采集病历信息。截至发稿时,该案尚未宣判。

分享到:
  以上内容版权均属广东新快报社所有(注明其他来源的内容除外),任何媒体、网站或个人未经本报协议授权不得转载、链接、转贴或以其他方式复制发布/发表。