关于python:K哥爬虫普法大众点评VS百度地图论数据权属对爬虫开发的罪与罚

28次阅读

共计 2514 个字符,预计需要花费 7 分钟才能阅读完成。

我国目前并未出台专门针对网络爬虫技术的法律标准,但在司法实际中,相干裁决已不足为奇,K 哥特设了“K 哥爬虫普法”专栏,本栏目通过对实在案例的剖析,旨在进步宽广爬虫工程师的法律意识,通晓如何非法合规利用爬虫技术,警钟长鸣,做一个违法、护法、有准则的技术人员。

案情介绍

被告人:北京百度网讯科技有限公司(以下简称百度公司),百度

上诉人:上海汉涛信息征询有限公司(以下简称汉涛公司),公众点评

汉涛公司诉称,“百度地图”与“百度晓得”未经受权,大量复制“公众点评网”的用户点评等信息,与“百度地图”具备单干关系的上海杰图软件技术公司经营的“城市吧”网站因应用了“百度地图”又扩充了侵权影响范畴、造成公司重大损失。因而,“公众点评网”的经营方上海汉涛信息征询有限公司将北京百度网讯有限公司及上海杰图软件技术公司以不正当竞争为由,诉至法院,要求原告进行侵权、登载布告打消不良影响,并抵偿经济损失 9000 万元和为禁止侵权行为收入的 45 万余元。

该案中,北京百度网讯科技有限公司(“百度公司”)应用技术手段在公众点评等 APP 上抓取了商户的根本信息及点评信息,用户应用其经营的百度地图 APP 查问地位时,无需跳转至公众点评界面,就可间接在百度地图界面获取商户的根本信息和点评信息。汉涛公司以百度公司等相干主体形成不正当竞争向法院起诉。

法院观点

单方是否存在竞争关系?

法院认为,尽管汉涛公司与百度公司所经营的 APP 属于不同行业、不同畛域且有着不同的经营模式,然而单方的行为在抢夺雷同的网络用户群体,两者在为用户提供商户信息和点评信息的服务模式上近乎统一,存在竞争关系。从法院观点来看,在竞争关系的认定上,将不限于对同行业相干主体竞争关系的认定,还将抢夺雷同网络用户群体的相干主体认定为具备竞争关系。这对许多以“流量为王”的企业十分具备警示意义。

汉涛公司是否有可诉诸法律爱护的合法权益?

法院认为,汉涛公司为了积攒点评信息付出了巨额老本。点评信息是汉涛公司的外围竞争资源之一,为汉涛公司带来竞争劣势。在法院考量汉涛公司是否具备可诉诸法律爱护的合法权益上,关注了汉涛公司获取涉案数据信息的老本,以及涉案数据信息为汉涛公司带来的效益。

百度公司是否存在不正当的行为?

法院认为,在百度公司靠本身用户无奈获取足够点评信息的状况下,通过技术手段,从公众点评等网站获取点评信息,用于空虚百度地图,百度公司的这种行为违反了公认的商业道德和诚实信用准则,具备不正当性。在对百度公司行为不正当性进行认定上,法院认为百度公司这种相似于“搭便车”、“劳而不获”的行为违反了商业道德和诚实信用准则。

汉涛公司是否因百度公司的行为蒙受理论侵害?

法院认为,用户在应用百度地图查阅到商户信息和点评信息后已无需跳转至公众点评查看更多信息,百度地图曾经对公众点评造成实质性代替,对汉涛公司造成了实质性侵害。对于互联网企业而言,用户流量的多少,在某种程度上决定了企业在市场上的竞争力和企业价值。与认定是否具备竞争关系相似,法院在认定汉涛公司是否蒙受理论侵害时,关注到百度公司“截取”了汉涛公司应有的网络用户浏览量,对公众点评造成实质性代替。

裁决状况

法院一审判决后果:

  • 百度公司于裁决失效之日起立刻进行以不正当的形式应用汉涛公司经营的公众点评网的点评信息;
  • 百度公司于裁决失效之日起十日内抵偿汉涛公司经济损失 300 万元及为禁止不正当竞争行为所领取的正当费用 23 万元;
  • 驳回汉涛公司的其余诉讼请求,一审案件受理费 494,067 元,由汉涛公司累赘 238,207 元,由百度公司累赘 255,860 元。

法院二审裁决后果:

  • 维持原判,案件受理费人民币 32,640 元,由上诉人北京百度网讯科技有限公司累赘。

裁决文书

https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/i…

案例剖析

本案中汉涛公司认为百度的行为是零老本获取己方领有“著作权的内容”,且因百度的行为造成了理论损失,形成不正当竞争。而百度方代理律师认为,百度是一家搜寻性能公司,与公众点评网之间没有造成竞争关系,所做的只是搜寻相干信息,筛选后进行出现,在这个过程中采集到了公众点评网中的局部信息,不存在不正当行为,而且公众点评网的 Robots 协定是面向百度凋谢的,百度采集的信息是 Robots 协定容许的。

在二审中上诉人汉涛公司的辩称中有一条须要咱们留神:百度公司通过搜索引擎抓取涉案信息并不违反 Robots 协定,但并不意味着百度公司能够任意应用该些信息,若不对应用别人网站信息的形式进行正当管制,将导致百度公司以极低的老本夺取汉涛公司的经营成绩。

咱们晓得 Robots 协定是一种约定俗成的小人协定,并不具备法律效应。即便公众点评网中 Robots 协定是面向百度的,但百度也不能够用采集到的信息对公众点评网造成影响,百度的行为仍旧属于不正当竞争行为。这种状况也存在于很多企业之中,很多企业都会采集一些信息聚合平台上的公开或者半公开的信息,而后将信息利用于本人的业务场景中,企业认为本人采集的是公开信息,并不违反法律。 然而却没有思考业务是否与信息聚合平台间存在竞争关系,没有考量对爬虫信息的应用范畴和形式以及对信息聚合平台造成的影响,这也是很多集体爬虫开发者在爬虫开发时没有去思考的点。

目前数据抓取行为所涉的竞争关系认定规范比拟含糊,目前对于此类案件的裁决次要有三要件:

第一,行为确属法律未特地明确;

第二,其余经营者的合法权益确因该竞争行为而受到了理论侵害;

第三,该种竞争行为确因违反诚实信用准则和公认的商业道德而具备不正当性或可责性。

该案中百度的行为也的确合乎这三要件,同样作为内容提供商,将公众点评网中的信息展现在本人的产品中,会导致公众点评的流量散失,是不正当的行为。

随着数据在古代社会中的重要性日益减少,数据权属问题也越来越重要,企业乃至国家对于数据的器重水平一直加深。《中共中央 国务院对于构建更加欠缺的因素市场化配置体制机制的意见》中明确将数据作为一种生产因素,与传统的生产因素如土地、劳动力、资本、技术等并列 。因而,爬虫开发中,咱们不仅须要关注数据的起源是否非法,也要思考数据的应用是否切当。

正文完
 0