关于爬虫:K哥爬虫普法12亿公民信息泄露仅判3年个人信息是否为爬虫禁区

40次阅读

共计 3375 个字符,预计需要花费 9 分钟才能阅读完成。

我国目前并未出台专门针对网络爬虫技术的法律标准,但在司法实际中,相干裁决已不足为奇,K 哥特设了“K 哥爬虫普法”专栏,本栏目通过对实在案例的剖析,旨在进步宽广爬虫工程师的法律意识,通晓如何非法合规利用爬虫技术,警钟长鸣,做一个违法、护法、有准则的技术人员。

案情介绍

出生于 1983 年 12 月的黎某是湖南省浏阳市人,从 2012 年开始做淘宝客生意,即通过做淘宝推广赚取淘宝客佣金,其要害就是须要大量的淘宝客户联系方式。

2017 年 7 月,黎某在网上意识了逯某。单方谈起上述生意时,黎某提到,“很难获取大量的淘宝客户联系方式”。为此,逯 (lù) 某为其编了一个“微信加人”软件,并且没收钱。“这个软件应用起来十分不便,也利于淘宝客生意。我感觉他有很好的网络编程技术,于是就承诺逯某,待成立了公司,算逯某技术入股。”黎某供述称。

2019 年 3 月,黎某在湖南省浏阳市成立了浏阳市泰创网络科技有限公司(自然人独资),该公司次要做“淘宝联盟”里的淘宝返利,次要用一些手机号,加对方微信好友进行推广淘宝商品,让用户支付“淘宝联盟”优惠券,对方应用优惠券胜利购买商品,该公司会取得返利。逯某受雇于黎某,作为公司技术员,每月工资一万元。自 2019 年 11 月,逯某自写软件“淘评评”。该软件能够通过淘宝商品详细信息接口和淘宝信息分享接口,爬取淘宝客户的淘宝数字 ID 和淘宝昵称,通过淘宝分享接口爬取淘宝客户手机号信息,并将其中淘宝客户的手机号码提供给黎某,用于浏阳市泰创网络科技有限公司用于经营流动。

黎某称,他在收到淘宝客户手机号码之后,会把这些信息数据导入“微信加人”软件,加微信好友胜利后,由浏阳市泰创网络科技有限公司的员工负责发送广告链接,淘宝用户在该公司的广告群里购买商品,该公司取得佣金。

该公司一位工作人员王某走漏,该公司约有 1100 个微信群,每个微信群最多有 200 人,起码约 90 人。其主营业务就是帮淘宝商家带货,从而取得淘宝网佣金和商家服务费。至于其淘宝客户起源,该人员称“不分明”。“咱们建好微信群后,将群二维码提供给老板黎某,而后就有人主动进群。”王某称。

逯某盗取数据的形式十分激进:仅在 2020 年 7 月 6 日 - 7 月 13 日这七天里,均匀每天爬取数量 500 万,爬取敏感字段量微小,被淘宝公司风控部门发现。

该公司自 2019 年 11 月份至 2020 年 7 月份利用该信息经营共获利 340187.68 元。

经司法鉴定,逯某通过其开发的软件爬取淘宝客户的数字 ID、淘宝昵称、手机号码等淘宝客户信息共计 1180738048 条(即:11.8 亿条),逯某将其爬取信息中的淘宝客户手机号码通过微信文件的模式发送给黎某应用共计 19712611 条(即:1971 万条)。

法院观点

法律规定:

  • 《最高人民法院、最高人民检察院对于办理进犯公民个人信息刑事案件适用法律若干问题的解释》第一条

    刑法第二百五十三条之一规定的“公民个人信息”是指以电子或者其余形式记录的可能独自或者与其余信息联合辨认特定自然人身份或者反映特定自然人流动状况的各种信息,包含姓名、身份证件号码、通信通讯联系形式、住址、账号密码、财产情况、行踪轨迹等;

  • 《检察机关办理进犯公民个人信息案件指引》

    对“公民个人信息”的审查认定依据《解释》的规定,公民个人信息是指以电子或者其余形式记录的可能独自或者与其余信息联合辨认特定自然人身份或者反映特定自然人流动状况的各种信息,包含姓名、身份证件号码、通信通讯联系形式、住址、账号密码、财产情况、行踪轨迹等。通过解决无奈辨认特定自然人且不能还原的信息,尽管也可能反映自然人流动状况,但与特定自然人无间接关联,不属于公民个人信息的领域。

最高院法官的阐述:

在大数据时代,从实践上而言,任何信息与其余足够多的信息相结合,都能够辨认特定自然人身份或者反映特定自然人流动状况。因而,对于不能独自辨认特定自然人身份或者反映特定自然人流动状况的局部关联信息,到底哪些能够纳入“公民个人信息”的领域,必然会存在较大的意识一致。在司法实用中具体判断局部关联信息是否能够认定为“公民个人信息”,应留神以下几点:

(1)须要联合的其余信息的水平。如果涉案信息自身与特定自然人的身份、流动状况关联水平高,须要联合的其余信息绝对较少,则认定为“公民个人信息”的可能性较大;反之,如果须要联合的其余信息过多,则认定为“公民个人信息”的可能性较小。

(2)信息自身的重要水平。如果涉案的信息与人身安全财产平安密切相关,敏感程度较高,则对于此类信息在认定是否属于“公民个人信息”时,能够采取绝对从宽的规范。

(3)行为人主观目标。如果行为人主观上获取涉案信息就不须要辨认特定自然人身份或者反映特定自然人流动状况,则此类局部关联信息原则上不宜认定为“公民个人信息”。

裁决状况

逯某受雇于黎某,二人违反国家规定,非法获取公民个人信息,情节特地重大,其行为均已形成进犯公民个人信息罪。公诉机关指控罪名成立。且系共同犯罪,逯某、黎某有坦率情节,且认罪认罚,对其均可从轻处罚。

综合其立功情节及社会危害性,按照《中华人民共和国刑法》第二百五十三条之一、第二十五条第一款、第六十七条第三款、第五十二条、第五十三条、第六十四条之规定,裁决如下:

一、被告人黎某犯进犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币三十五万元;

二、被告人逯某犯进犯公民个人信息罪,判处有期徒刑三年三个月,并处罚金人民币十万元。;

三、被告人黎某、逯某守法所得依法持续予以追缴上缴国库;

四、依法扣押的作案工具逯某电脑主机 5 台、电脑显示器 3 台和手机 5 个,由扣押机关依法处理。

裁决文书

(2021)豫 1403 刑初 78 号

案例剖析

就最高院观点而言,“淘宝昵称”、“淘宝账号”不应该认定为为公民个人信息,尽管账号是不可反复的,但账号并非身份证号码,每个人都能够有多个账号,且并非所有账号都绑定身份信息,仅有账号很难辨认到特定自然人。《解释》第一条中尽管列举了“账号密码”为公民个人信息,但该当了解为一组账号和明码,而不是独自的账号或者独自的明码。就本案而言,该当主张在 12 亿条信息中心剔除“淘宝账号”、“淘宝昵称”两组信息。

如果逯某所述属实,其是通过淘宝分享接口爬取到的淘宝客户手机号信息,证实彼时淘宝的信息安全爱护是做的很不到位的,并且不足相干意识。近年来信息泄露问题重大,快递信息、防疫信息等都应该引起无关部门及企业的警觉,这方面的平安防护是重中之重。

对于个人隐私爱护,这里给到以下倡议:

  • 爱护集体账号密码:设置一个简单的明码,并且不要把明码通知任何人。同时,应用明码管理器来妥善治理明码;
  • 留神公共 Wi-Fi 的应用:在公共场所应用 Wi-Fi 时,要注意安全,不要在不平安的 Wi-Fi 环境下进行敏感操作,如登录银行账户等;
  • 审慎分享个人信息:不要随便把个人信息分享给陌生人,不要在社交媒体上公开分享个人信息,在网上填写信息的时候,能填虚构的中央就尽量不要写实在的信息;
  • 定期检查账户平安设置:查看并设置账户的平安设置,如双重验证、密保问题等,确保账户平安;
  • 不要轻易点击生疏链接:不要随便点击来自不明起源的链接,免得被钓鱼网站坑骗;
  • 不要随便下载生疏应用程序:不要轻易下载不出名的应用程序,免得个人信息被窃取;
  • 定期清理浏览器缓存:定期清理浏览器缓存和历史记录,免得个人信息被别人利用。

当解决个人隐私数据时,爬虫工程师们须要特地留神以下几点:

  • 恪守相干法律法规:必须严格遵守国家的法律法规,包含《个人信息保护法》等相干规定;
  • 尊重个人隐私:尊重个人隐私是一种道德和职业操守。在爬取集体数据时,必须确保数据起源非法且曾经取得了用户的受权批准,不得擅自窃取、利用、发售或泄露用户的隐衷信息;
  • 增强数据安全治理:应该增强数据安全治理,包含加密、脱敏、拜访日志记录、定期审查等措施,以确保数据的平安;
  • 及时删除集体数据:在用户申请删除集体数据或者集体数据不再须要的状况下,应及时删除集体数据,以保障用户隐衷;
  • 审查第三方合作伙伴:在与第三方单干时,应该审查合作伙伴的数据保护政策和安全措施,确保他们的数据处理流程合乎法律法规要求,并且可能保障用户的隐衷平安。

个人隐私数据不能碰!数据起源是否非法是爬虫流动的前提,不要因为一时的利益,抱有侥幸心理,常在河边走哪有不湿鞋,银手铐戴到手上的那一刻才晓得悔恨,就什么都晚了,愿各位警钟长鸣。

正文完
 0