乐趣区

关于python:K哥爬虫普法微信公众号爬虫构成不正当竞争爬虫er面对金山如何避免滥用爬虫

我国目前并未出台专门针对网络爬虫技术的法律标准,但在司法实际中,相干裁决已不足为奇,K 哥特设了“K 哥爬虫普法”专栏,本栏目通过对实在案例的剖析,旨在进步宽广爬虫工程师的法律意识,通晓如何非法合规利用爬虫技术,警钟长鸣,做一个违法、护法、有准则的技术人员。

案情介绍

2011 年 1 月微信问世,腾讯公司通过继续投入,构建起包含微信平台、微信个人用户、开放平台、微信领取、小程序等产品性能和服务,构建起包含微信平台、微信个人用户、公众号运营者、第三方服务商等多角色主体独特参加的微信生态系统。为了保障微信生态系统的衰弱倒退,保护包含微信公众平台在内的经营秩序和用户信息安全,保障良好的用户体验,腾讯公司作为平台经营者和管理者,通过在微信公众平台官网(https://mp.weixin.qq.com)设置 robots 协定,禁止任何第三方通过爬虫技术抓取微信公众号平台信息内容及数据,制订并公示了各种微信平台规定对微信公众平台信息内容及数据资源平安进行爱护。

原告系“极致了”(www.jzl.com)产品的经营者斯氏(杭州)新媒体科技有限公司,未经腾讯公司许可利用爬虫技术非法抓取微信公众平台信息内容及数据,并对外提供公众号及其文章的搜寻、公众号导航及排行、公众号数据抓取、公众号数据分析等微信公众号数据服务。

被告认为,原告的行为系利用非法抓取的微信公众号源网页信息内容和数据,通过简略的统计和剖析后对外提供微信公众号数据服务的寄生经营行为,重构了微信公众号的数据评估体系,违反了微信公众平台产品设计逻辑和经营准则,侵害了微信平台生态系统的衰弱,侵害了被告的商业利益,具备不正当性。

法院观点

被告腾讯公司和腾讯科技公司系微信公众平台的经营者和管理者,原告斯氏公司是“极致了”网站经营者。被告在微信公众平台官网设置了 robots 协定,禁止任何第三方通过爬虫技术爬取微信公众号平台信息内容及数据,制订并公示了各种微信平台规定对微信公众平台信息内容及数据资源平安进行爱护。但“极致了”网站利用爬虫技术,绕开、冲破了“微信登录限度”和“IP 拜访限度”,爬取微信公众平台信息内容及数据,并通过网站对外提供公众号搜寻、导航及排行等数据服务。

法院经审理认定,“极致了”网站冲破 IP 拜访限度和封禁措施,毁坏了微信产品登录拜访服务运行,同时“爬虫”行为会对微信服务器造成累赘,形成对微信公众号失常运行的障碍。此外,被控行为也障碍了微信产品的失常运行机制。“极致了”提供微信公众号及文章搜寻、展现等服务,形成了对微信公众号局部数据内容服务的实质性代替,进而侵害两被告通过对外受权可获取的单干利益等商业利益,形成不正当竞争。

裁决状况

依据《中华人民共和国民法典》第一百二十七条、第一千一百六十七条、《中华人民共和国反不正当竞争法》第二条、第十二条第二款第四项、第十七条、《最高人民法院对于审理不正当竞争民事案件利用法律若干问题的解释》第十七条、《中华人民共和国民事诉讼法》第六十四条第一款之规定,裁决如下:

一、原告斯氏(杭州)新媒体科技有限公司立刻进行涉案不正当竞争行为,即立刻进行非法抓取微信公众号(http://mp.weixin.qq.com)信息内容及数据、进行对外提供微信公众号及其文章搜寻、公众号排行及举荐、公众号数据抓取等涉案相干数据服务,并删除曾经存储的前述数据;

二、原告斯氏(杭州)新媒体科技有限公司于本裁决失效之日起十日内抵偿被告深圳市腾讯计算机系统有限公司、腾讯科技(深圳)有限公司经济损失及为禁止不正当竞争行为所领取的正当费用共计 60 万元;

三、原告斯氏(杭州)新媒体科技有限公司于本裁决失效之日起七日内,在极致了网站(www.jzl.com)间断七日登载申明为被告深圳市腾讯计算机系统有限公司、腾讯科技(深圳)有限公司打消影响(申明内容需经法院审核,逾期不履行,由法院登报公开裁决次要内容,登报费用由原告斯氏(杭州)新媒体科技有限公司累赘);

对于抵偿数额,两被告主张以原告因侵权行为的获利作为抵偿的根据,一是以每月付费会员免费为计算维度,(2020)厦鹭证内字第 102658 号公证书载明被控网站截止被告公证时付费用户会员为 8197 人,付费会员分为三个等级(高级会员为 89 元每月,奢华会员为 149 元每月,超级会员为 299 元每月),仅以每月 89 元为计算基数,则“极致了”网站每月收取的会员费用为 8197 人*89 元每月=729533 元。依据两被告提交的就“极致了”网站对付费会员提供服务状况等进行的公证,即“极致了”网站对网站会员进行免费截止 2021 年 8 月至多曾经 10 个月,思考付费会员可能在一直增长变动的前提下,暂以 729533 元的 50% 为基数,“极致了”网站仅仅在 10 个月就付费会员获利为:729533 元每月*50%*10 个月 =3647665 元。此外,综合“极致了”网站理论免费会员制度运行工夫远远早于 2020 年 9 月,故“极致了”网站理论获利状况远远不止于此。二是以单次监控/采集收集为计算维度,“极致了”网站最低一级的付费会员费用为每月 89 元,含 300 次阅读数监控和 300 次数据回采,即均匀每次监控/回采收益约为 0.15 元。(2020)厦鹭证内字第 102658 号公证书载明被控网站截止被告公证时“极致了”网站已回采超过 6 亿公众号文章,即仅数据回采局部获利为 6 亿*0.15 元 =9000000 元,思考“极致了”网站还提供阅读数监控等其余服务,“极致了”网站理论获利不止于该金额。综上,被告主张原告抵偿经济损失及正当收入共计 300 万元。原告抗辩其经营的“极致了”网站获利较少,但未提交主观证据予以证实。

法院留神到如下事实:

1. 原告在庭审中自认“极致了”网站于 2020 年 5 月上线,其中下线四个月后又从新上线直至 2021 年 8 月,原告在明知“极致了”网站涉嫌侵权的状况下依然从新上线“极致了”网站,阐明侵权主观歹意较大;

2. 微信在社交产品市场中领有极高的市场占有率, 享有极高的知名度, 商业价值非常可观。微信公众号领有泛滥用户,具备较高的市场价值,可能给两被告带来可观的市场收益,同时微信公众号可能稳固地吸引海量用户数据,具备较大的数据衍生产品开发空间,能给两被告带来可观的增值利润;

3. 被控“极致了”网站通过多个不同网址以及多个公众号进行宣传、服务,每日爬取的公众号及文章数量较大;

4. 联合“极致了”网站不同产品、不同服务的报价等情节予以酌情考量其销售利润;

5. 被控行为尽管造成了微信用户对微信公众号数据局部流量的散失,两者之间只是具备或然性关联关系;

6.“极致了”网站提供微信公众号文章搜寻服务中,点击文章题目查看微信公众号文章内容仍需跳转回微信公众号进行展现;

7. 两被告为本案诉讼采取了屡次公证证据顾全措施,并委托律师参加诉讼,须要领取正当维权费用。

综合考量上述因素,法院酌定原告连带抵偿两被告经济损失及为禁止不正当竞争行为所领取的正当费用共计 60 万元。

裁决文书

杭州铁路运输法院(2021)浙 8601 民初 309 号民事判决书

案例剖析

本案的重点有两处,一是“极致了”网站使得网络用户无需登录微信账号、订阅微信公众号即可在“极致了”网站查看除了微信公众号文章以外的相干阅读数、点赞数等相干数据内容,影响微信用户协定的履行,毁坏微信公众号数据的展现规定,对微信公众号点赞数、阅读数、公众号主体信息等局部数据内容形成实质性代替,分流了微信产品的局部潜在用户;二是微信客户端不仅向网络用户提供能够间接拜访微信公众号及文章的搜寻链接,还能够向搜狗搜寻提供引擎独家受权、容许搜狗提供公众号及文章搜寻。“极致了”官网提供微信公众号及文章搜寻、展现等服务,曾经形成对微信公众号局部数据内容服务的实质性代替,进而侵害两被告通过对外受权可获取的单干利益等商业利益,形成不正当竞争。

目前市面上有不少相似于本案的产品,通过抓取各种内容平台数据,进行数据整顿、加工解决后推出相干产品,短暂做上来的必然是和官网有单干的,单单依附爬虫进行数据采集的话,只有被平台方发现,告上法庭,必然会形成不正当竞争的,搞不好还有毁坏计算机系统罪,宽广爬虫工程师们如果公司正在研发此类产品,肯定要确认是否与官网有单干,多多关注业务的非法合规性,防止走上违法犯罪的路线。

退出移动版