讲一个十年前的故事,权当一乐。
====================================================
说有一个程序员,暂且称他小A,因为他是网络攻防专业,所以非常重视自己的信息安全,他养了一个蜘蛛爬虫,整天就在不断抓取包含自己QQ号、手机号、身份证号的网页信息,每天都检查日志,看自己的信息有没有泄漏。
他为什么这么做呢?因为他知道大数据太厉害了,但凡他露出蛛丝马迹,他就有几率被抓。
2011年,这个程序员在读大学,学计算机专业,喜欢泡论坛,那时候天涯论坛很火,有一天他发现有一个女人发帖,怀疑自己老公出轨,想弄清真相,但苦于没有人脉且毫无头绪,如果有人帮忙她可以重金酬谢。
程序员小A回帖和该女聊了一阵后决定帮忙,他写了一个爬虫脚本,在网上爬女人老公的信息,通过姓名、性别、国籍、民族、身份证号、生日、地址、邮编、手机、固话、传真、邮箱、公司、住宿时间等不同的字段,在全网抓取资料。
结果有一个IP地址在浙江的主机上,找到了女人老公的信息,姓名、性别、手机号、身份证号都对的上,仔细一看,居然是在某某酒店的开房信息,居然是大床房,同住人的信息还是一位女性。
出轨证据这就到手了,后来发帖的这个女人转给程序员2万元作为报酬。
出于好奇,程序员小A开始不停地抓取该服务器上的信息,随着数据增加,他建立起了数仓,然后对数据进行筛选和清洗,他发现这些拥有诸多特征字段的信息,不是单一酒店的开房信息,而是诸多不同品牌的酒店使用的同一系统,该系统存储数据的服务器,上面的数据库没有加密。
随着数据越来越多,已经不是一个Excel表格能概括的了,他默不作声,除了这个服务器以外,他还用爬虫采集类似的字段信息,一直悄悄摸摸地收集,不知不觉已经有了上千万不同字段的信息……
当数据只有一条的时候,它只是一条数据。
当数据有成千上万条时候,它成了大数据,也是金钱、是财富……
2012年恰好是微博、微信公众号兴起的时候,网络营销如火如荼,资本也开始向互联网倾斜,动不动就是几千万的投资,很多公司开始成立网络营销部门,对自身产品的用户画像也越来越明确。
程序员小A开始整理自己手中的数据,比如筛选出18—28岁女性,将她们的姓名、年龄、手机号卖给化妆品公司,筛选出25-35岁的人群,将他们的信息卖给母婴用品的销售部门,筛选出住豪华五星级酒店的人群,将他们的信息卖给地产公司、房产中介……程序员花几个月整理的大数据,在短短的3个月就有40多万元的收入。
由于最主要的数据来源于江浙沪地区酒店商旅信息,因此该程序员的数据可谓是又高质又多金,尤其是包含上海几个五星级酒店的开房记录,都是高净值人群。
该程序员也晓得树大招风,觉得是时候收手了,然后就将这些数据以十几万的价格卖给了杭州某个公司,但也留了一个后手。
说来也巧,在程序员小A用爬虫采集某些网站时,在访问记录里发现了该杭州公司的信息,该公司居然用实名备案的域名、服务器,所以很快该程序员就联系上了这个公司的负责人(也是程序员),然后很快谈妥,就把数据卖给了他。
该公司表面上是法律咨询有限公司,但实际上是一家主打抓出轨的私人侦探公司,手机定位、私家侦探、讨债业务、电子商务诈骗等都有所涉及。
该公司负责人也非常精通爬虫,而且小有名气,是一个有着程序员圈子的整合型人才,暂且称他小E,小E也是通过帮别人抓小三入行,看到了商机,于是联系了好些专门做信息倒卖的灰产人士,他在明面上开公司,背后是这些灰产码农在运作。
整个运作也正规起来,像婚外情调查,起步价是1.5万元,不仅会和客户签订委托合同书,还会签保密协议……当然也接散活,提供单次查询,比如查手机定位一次800元,开房信息一次300元,如车牌号、住址、身份证号等信息是500到2000元。
程序员的数据以前就是单机游戏,到这个公司负责人这里,算是联网了,大数据更大了,而且成了产业链上面的一环。
在程序员手里,切片都能卖出几十万,整盒蛋糕虽然十几万卖出去,但是这些数据能产生的价值绝对是十倍百倍……
于是这些大数据里面的人名和电话成了受害者,当销售的赵经理一天接到的网络推销电话业务要比客户联系的电话业务多几十倍!愁货款的钱总也不知道怎么这么多人知道他资金周转困难,一下午接了20多个低息或无息贷款的推销员电话!美丽的少妇孙女士总是接到“您想知道你老公都在做些什么吗?我们提供拷贝手机SIM卡服务,绝对为您保密,每张卡仅需500元,电话……”而LSP李先生总是收到新茶到货、上门服务的信息。
事情在接下来的一年里慢慢发酵……
直到2012年,越来越多人收到骚扰电话、骚扰短信,尤其是很多律政行业、金融行业、软件行业的人士,深知信息安全的重要性,之前对这些倒卖数据的犯罪分子,在法律的判断上不是很清晰,这次泄漏事件让工信部意识到,必须要写进刑法里。然后工信部开始起草《信息安全技术、公共及商用服务信息系统个人信息保护指南》,开始明确法律边缘。
也就是在这一年,浙江省公安厅刑侦总队牵头,杭州市公安局刑侦支队冲锋,联合打掉了浙江境内17家非法调查公司,其中就有小E的公司,查封服务器,小E喜提牢饭,但由于认罪快、吐钱快,所以判的也不久。
但,关住了小E,关了服务器,关不掉那些数据。
小E公司的机房因为有着这么高质量的数据,每天都遭受DDOS洪水攻击,也被无数爬虫窥探,就像非洲草原上的肥羊,周围早有鬣狗伺机而动,甚至在他不知道的某个时候,早就被人拷贝过一份。
这份大数据就像一份《九阴真经》,创始人可以死,门派可以灭,武功秘籍却永在江湖流传……不过真正让人颤栗的,是这本武功秘籍就像是一个魔性的吃豆人,总有人愿意前赴后继地填充它、完善它……
2013年,8月,乌云网的某个白帽子黑客,无意中发现了浙江省那个酒店住宿系统的漏洞,一看日志,好家伙,数据库背后都是爬虫的痕迹,随后按照标准流程通知厂商,并逐步向专家和技术人员公开,将漏洞细节公之于众,也交给了CNCERT国家互联网应急中心进行处理。
乌云网当时在网络安全里还算小有影响力,一下子引得不少灰产码农去围观,虽然漏洞公布的当晚,就有许多人把这个酒店住宿系统的数据库全部下载了下来,但是截止到2013年9月,其实事态还没有那么严重,围绕乌云网的这批人都是技术宅,所以还是小范围内大家讨论。
无奈总有掀桌子的人,2013年10月13日,有人在国外云服务器上建了一个网站,将开房数据上传,名为“开房网”,输入名字或者手机号身份证号可以查询开房记录。
这一下子炸开锅了。
铺天盖地的新闻!
后被媒体称为2000万开房数据泄露事件。
在那个月里面,“开房网”以及类似的“查开房网”、“开房数据库”等网站访问流量大到屡屡崩溃。
网监部门开始封IP、封DNS等方式封锁相关网站,无奈层出不穷,时至今日,开房同住,手机号查户籍等关键词或真或假的网站还是屡禁不止,2013年简直可以称为开房元年。
不过上文说到,2012年有成立相关法规,2013年开始实施,所以就是侵犯公民信息是真的可以有牢饭吃,无奈这个2000万开房数据涉及到的人物都是技术人才,而且信息泄漏者作为“攻”的一方,传播的太快太广,当时国家队的“守”的一方还没有头绪,办案也不知道从何查起,面对服务器境外、域名随机、注册信息乱码的网站,很难揪出幕后的操纵者,这也从侧面加快了中国的网站实名备案、公安部备案的进程。
人们对白帽子的工作也产生了一些疑虑,毕竟他们也是真正拥有采集数据能力的一群人。
其中就有一个这样的小故事,有一个程序员Y,发现一个著名的婚恋网站有一个漏洞,本来每天只能查看系统推送的女方资料,要付费才能查看更多女方资料,但是将用户组权限改变之后,可以查看更多女方资料,如果黑客入侵,那婚恋网站的用户资料可能全部被泄漏。
程序员Y在乌云网提交了漏洞,乌云网通过商务联系了婚恋网站,婚恋网站付钱并修补了漏洞。但事后,统计发现,有900多条数据被下载过,于是选择报警。
警方调查后发现只有程序员Y一个人涉嫌此案。于是Y喜提牢饭。
黑与白的界限非常模糊,所以这些灰产人士容易在两边反复横跳。
回到主话题,关于开房数据泄漏的新闻,程序员小A也看见了,整个网络上充斥着各种关于数据泄漏的声音,也有越来越多人开始关注这个产业链,俗话说的好,目光在哪里,钱就在哪里。
小A觉得这个蛋糕怎么分也分不完,毕竟每年都有人要出轨,每年都有人要离婚,每年都有人要追星……信息数据只会越来越大,愿意为此花钱的人也会越来越多。
等到过了两年,2015年,风浪小了,小A当初给自己重出江湖留的后手,就开始行动了。
原来当初小A利用一套假的身份系统和手机号,注册了一个QQ,潜伏在一个名叫“苏州私家侦探”的群里面,这是他当初为了摸底和试探小E,佯装客户而埋下的种子。
虽然小E当初吃了牢饭,电脑服务器手机都被作为证据扣下了,但是QQ群并没有解散。
小A通过聊天和攻心,辗转加了一些私人侦探、数据、监控、讨债群,发展了三个下线,分别是小X、小H、小Z。
其中小X在广东,小H在四川,小Z在吉林,三人从未谋面。
这三个人都曾经在小E或其他“科技公司”那里领教过大数据的强大,甚至曾经是小E的老客户,但是随着群主销声匿迹,他们作为群里老人也经常会接到很多小白的询问,但他们苦于不懂技术,因此吃不到这碗饭。
小A将自己数据库里的关于这三人的资料一整合,上来就问候了全家,这三人一见户口本都被人开出来了,服服帖帖,知道这下是抱住技术大腿了,于是开始到处发帖发广告,吃上了这口蛋糕。小X、小H、小Z三人都开始过起了有点小钱的日子!
由于小A极少通过QQ在线,在XHZ三人眼里,像是一个隐形人的存在,他们通过小A架设的数据库查询数据信息,且每月将小A那份钱以USDT的形式转到他账户。
就这样,XHZ陆陆续续吃蛋糕吃了大半年。
整天和大数据打交道的他们,万万没有想到,六扇门的那一方进步了!
现在的办案模式变了,大数据时代了!
从三大运营商,移动联通电信,到手机服务商、贷款服务商,到软件服务商,管你微信还是QQ,微博还是知乎,要你点资料太简单了,甚至是你什么都不用,你什么都不说,我只要扫一下你的脸,你几点钟在哪里,路过哪个路口买了什么东西,大数据都能给你算出来!
2016年6月21日,小X租住在广州一个城中村的出租房,在回家的时候被两个便衣警察按头。
2016年6月21日,小H在四川自己小区家里,警察上门按头。
2016年6月22日,小Z在吉林一个网吧里正在打英雄联盟,被警察按头。
小A在发现不对劲后潜逃泰国,至今未归。