蜘蛛程序_网络爬虫合法吗?中美有不同看法

蜘蛛程序

这个问题变得越来越重要

,在法律层面上,不仅应该保护个人信息,而且不能阻碍数据的流通和使用我该怎么办?


网络爬虫,合法吗?

一个平台使用“爬虫工具”浏览另一个平台的网页内容并检索它找到的信息。满足这些特征的行为被定义为“网络爬虫”动词

“爬”已逐渐成为人们的日常表达。说到“爬升内容”和“爬升数据”,每个人或多或少都能理解这个动作的含义。

数据一直被认为是这个时代的石油——在许多情况下甚至比石油更稀缺。对石油来说,“盗窃”显然是非法行为,但对数据来说,“攀登”是非法的?

近年来,“网络爬虫”引发了越来越多的法律纠纷。

必须首先回答这样一个问题:被爬网的数据属于谁只有明确讨论了“归属权”,才能在此基础上讨论“授权”。很难确认

数据的所有权

企业的平台数据往往包含大量的个人数据,因此平台数据可分为个人所有、平台所有、个人与平台共享或互联网空间中的公共数据。

在法律领域的代表是中国和美国,这两个主要的互联网国家。所有国家都没有关于数据所有权的直接和明确的立法,学术界也没有广泛的共识。

但在实践中,当事人往往选择直接绕过纠纷,从实际情况出发,在现行法律明确规定和保护的范围内解决问题。这是寻求司法救济的有效途径。

在美国,法院主要有四种法律途径来规范数据爬虫:

。侵犯动产;

...违反合同;

、侵犯著作权;

。违反计算机欺诈和滥用法案(违反CFAA)在

中,CFAA是近年来在实践中广泛使用的一个主要趋势。

规定了“故意未经授权或授权访问计算机信息系统,从而从任何受保护的计算机获取信息”的民事和刑事责任

美国最高法院进一步解释说,CFAA规定两种非法访问受保护的计算机信息系统的行为构成犯罪:

。未经授权的访问;

,虽然被授权访问但使用不当

而在中国,当法院裁定网络爬虫违法时,主要引用了《反不正当竞争法》第二条规定的“经营者的合法权益”——基于此,法院裁定未经授权的第三方网络爬虫非法获取数据经营者的大量用户数据。

,但是,法院只将平台数据或数据产品定义为“企业在竞争中的比较优势,以保护排他性利益”,也就是说,法院不承认企业对数据的产权

除此之外,我国《反不正当竞争法》、《劳动法》、《合同法》、《公司法》、《中外合资经营企业法》、《刑法》等一系列法律都有关于商业秘密的规定,企业可以通过这些渠道保护部分数据

正是基于这一背景,本文希望通过对中美典型案例的梳理,阐明影响数据爬虫行为合法性的两个关键因素:数据属性和授权模式希望能为企业的相关实践提供法律风险规避建议。

01

影响合法性的因素之一:数据属性

▌问题1:它是“开放数据”吗?

数据是否开放和可访问是影响爬行行为合法性的一个重要因素

如何定义数据披露?

一般来说,数据控制器采用技术保护手段的数据属于未公开数据。例如,在脸谱网诉电力风险投资公司一案中,受账户密码保护的用户数据被明确认定为非公开数据

对于非公开数据,中美两国的司法实践有相似的主张:相应的数据抓取行为需要得到数据控制者的授权

有趣的是,对于用户自愿选择披露但数据控制者无权抓取的数据,美国法院的态度发生了“从严格到宽松”的变化,而中国法院仍然倾向于需要用户和企业的授权。

2000年,美国投标人的Edge公司在易趣的网站上安装了一个数据爬虫,因此易趣向加州北区法院提起诉讼,理由是违反机器人协议、非法行为,如非法侵入、计算机欺诈和滥用、不公平竞争等。基于以下几点,

蜘蛛程序

法院批准了非法入侵指控,即

易趣的服务器是私有财产。

。它的公共访问被授予。Ebay通常不允许爬行机器人访问它。

易趣已明确告诉投标人的边缘,它不允许爬行其网络。同意非法入侵的指控,认为被告未经授权干涉原告在计算机系统中的权益,直接给原告造成损害。

本案中,法院回避了数据所有权问题法院裁定,投标人的Edge公司的行为是非法入侵动产,主要理由是服务器是私有的,这相当于间接承认爬行公共数据需要平台的授权。

但在2017年,在hiqlabs Inc .诉领英公司案(以下简称领英案)中,情况发生了重大变化。

蜘蛛程序

让我们先看看这个案件的基本事实。

hiQ实验室(以下简称“hiQ”)是一家为雇主提供员工评估服务的数据分析公司。它使用自动机器人从专业社交网站领英(LinkedIn)检索用户的公共个人数据,包括他们的姓名、职位、工作经历和技能,领英拥有5亿多用户。然后,它通过算法处理这些数据,并将分析结果出售给客户。这种行为持续了五年。

。2017年5月

LinkedIn向hiQ发出警告信,要求其停止未经授权的访问和数据抓取,并为hiQ设置相应的技术措施,防止hiQ进一步抓取数据。LinkedIn在其警告信中称,如果hiQ不停止攫取,它将违反一系列联邦和州法律,尤其是CFAA

,2017年6月

hiQ在北加州地区法院提起诉讼,声称LinkedIn的行为违反了加州宪法中关于言论自由的规定,违反了“禁止反言”原则,违反了加州的“反不正当竞争法”,构成了《加州商业和专业法》第17200条下的不公平商业行为,等等。

随后,hiQ发起了一项初步禁止LinkedIn行为的动议

2017年8月

加州北区法院支持hiQ的禁令动议,裁定LinkedIn不得阻止hiQ在其网站上输入、复制和使用公共信息;在临时禁令期间,领英将不得不撤回并禁止向hiQ发送任何进一步的法律声明,禁止其使用数据。LinkedIn拒绝接受

并提出上诉,但上诉法院仍然支持这项禁令。

链接英国案的判决具有里程碑意义

作为对领英的回应,hiQ继续抓取其数据违反了CFAA法规,属于未经授权入侵受保护的计算机系统美国加州北区法院的法官认为,关键问题在于,在领英发布警告信明确禁止hiQ访问数据后,hiQ继续获取领英的公共数据是否构成CFAA方面规定的“未经授权访问计算机”。

首先,法官驳回了LinkedIn的两个案例,以支持他自己的观点:动力投资公司和Nosal II法官认为,这两起案件与本案不同,他们的数据不是公开的,而是受到密码验证系统的保护,因此未经另一家公司授权,他们不能被抓取。

其次,法官在判决书中写道:“CFAA必须根据其历史背景进行解释,并牢记国会的目标。”“这意味着CFAA比互联网出现得更早,它不能在一定程度上直接处理现代科学技术的问题。

判决引用了美国第九巡回上诉法院在美国诉诺萨尔(Nosal I)案中的相关陈述:

“国会于1984年颁布了《CFAA法案》,其主要目的是解决日益严重的黑客攻击问题”,主张不应过度扩大和解释CFAA,导致“其适用范围扩大到计算机黑客以外,任何未经授权使用计算机信息系统数据的行为都被视为犯罪”

换句话说,如果该网站可以在任何时候以任何理由撤销对任何人的授权,并援引CFAA进行强制执行,将使广大互联网用户承担刑事和民事责任。

蜘蛛程序

然后,该判决引用了美国最高法院在Packingham诉北卡罗来纳一案中的判决:

在当前社会中,社交媒体网站已经成为大多数人“获取实时信息、寻找工作、在网络空间表达和听取意见,以及在其他方面探索人类思想和知识的边界”的主要来源

法院将互联网和社交媒体网站与“现代公共广场”的概念进行了整体类比。法院认为,双方的规范性共识包括“对所有访问者开放和无障碍”

此外,本案从言论自由角度的辩护意见也具有代表性。

9 hiq聘请哈佛法学院劳伦斯·查佩尔教授为顾问。教授指出,获取数据和信息是一项言论自由的权利。数据的本质是一种言语,言语的本质是流通和共享,具有公共属性。因此,它不需要网络平台或个人的授权来抓取公共数据。

,当然,本案的判决也考虑了其他因素,不仅仅是数据问题例如,hiQ完全依赖LinkedIn公共数据的二次利用来开展业务,这并没有对LinkedIn造成损害,但一旦停止,将对hiQ造成毁灭性打击。

本案的判决推理主要围绕临时禁令,主要考虑四个因素:胜诉的可能性、是否存在不可挽回的损害、双方利益与公共利益的平衡。从不可挽回的损害和双方利益平衡的角度来看,法院倾向于支持hiQ是合理的。

此外,一个不容忽视的事实是:领英已经被允许在hiQ的网站上爬行五年了。当阻止这种数据抓取行为时,领英刚刚宣布将提供与hiQ类似的服务,这使得领英拒绝hiQ抓取数据,怀疑HiQ滥用其在市场上的主导地位并排斥竞争对手。

如今,美国对用户隐私的研究已经发展到“语境隐私”的理论

海伦·尼森鲍姆教授的数据语境完整性理论认为,保护隐私和个人信息的关键不是隔离信息,而是确保信息流通的“语境完整性”。

意味着在特定的环境下,信息流应该满足人们的期望(但是,法官在Linkin案中的判决提醒我们,披露用户自己的数据并不意味着他们允许第三方出于任何目的收集和使用他们的数据);特定的信息流与特定的情景信息模式相匹配,在特定环境中共享的信息不应在违反这种环境的环境中共享。

因此,隐私和个人信息保护法必须尊重上下文,数据使用规则应根据上下文制定。

简而言之,在线环境中用户的隐私期望是基于情景的,就像医生将患者的个人信息告诉一些商业组织一样,患者会感到惊讶,但如果目标是保险公司或药剂师,就不会有批评。

因此表明,美国正越来越多地从宏观公共利益的角度审视用户数据的流通和共享,并逐渐开放其态度。

蜘蛛程序

中国的情况如何?与

相比,尽管中国也重视个人公共数据的价值和使用,但其目前的态度仍然保守。

在中国的典型案例是新浪诉莫迈。因此,法院提出了“用户授权+平台授权+用户授权”的“三重授权”原则

此案的起因是莫莫超越合作权限获取和使用新浪微博用户的专业教育信息。未经微博及其用户同意,展示momai用户和新浪微博用户的手机通讯录联系人之间的对应关系。根据

微博,momaidid没有完全尊重开发者协议,没有尊重用户的知情权和自由选择权,降低了微博的竞争优势新浪以

提起诉讼后,一审法院主要援引《反不正当竞争法》第二条,裁定莫须有违法。该法的内容是:

“经营者在生产经营活动中,应当遵循自愿、平等、公平、诚实信用的原则,遵守法律和商业道德。”本法所称不正当竞争,是指经营者在生产经营中违反本法规定,扰乱市场竞争秩序,损害其他经营者或者消费者合法权益的行为。本法所称经营者,是指从事商品生产、经营或者提供服务的自然人、法人和非法人组织(以下简称商品包括服务)

199二审法院维持一审判决,进一步强调《反不正当竞争法》第二条在互联网行业的适用应坚持适度的司法态度。值得注意的是,在符合最高人民法院(2009)沈敏字第1065号所规定的三个条件的情况下,“山东省食品进出口公司与青岛圣科达成贸易有限公司等不正当竞争纠纷正在重新审理”

。尽管美国法院在“脸谱网诉权力”一案的判决中也基于数据属于个人和平台的观点,但同样确立了双重授权原则,即要求他们获得个人用户(控制他们的数据和个人页面)和平台(将这些数据存储在他们的物理服务器上)的授权。在脸书发布终止通知后,仅仅获得用户的许可并不足以构成授权< br>

但是,这更多的是非公共数据

对于公共数据,数据权的本质是一种共享权。共享的基本前提是开放,核心是信任。共享的本质精神是利他主义,即集成数据权利、数据利用、数据保护和数据价值

预见到国内司法实践将根据未来具体的案件情况决定是否适用或调整该原则。

▌问题2:原始数据还是衍生数据?

数据是原始数据还是派生数据也是影响数据爬虫行为合法性的重要因素熊乾富,

,提出区分原始数据和派生数据,并根据不同的数据法律关系配置相应的数据权利体系

原始数据的所有权属于用户,用户自己有权拥有、使用、受益和处置。衍生数据的所有权属于衍生数据的“创造者”,因为它是基于数据价值的“第二次”创造,衍生数据的“创造者”享有占有、使用、收益、处分等权利。

根据这一逻辑推论,由用户直接创建或由用户在平台上的行为留下的数据属于用户,而由企业处理和创建的数据属于企业

在美国,简单地抓取在其他企业平台上公开的原始数据并不违法

链接英国案的判决基本上承认第三方企业在获得用户授权的情况下可以访问企业平台上披露的原始个人数据。

Facebook v . power ventures也表明了这一点。

该案例的基本情况是,Power Ventures专注于社会聚合服务。用户可以通过该软件同时登录社交软件,如脸谱网和领英网,并提供脸谱网的登录密码,以获取脸谱网账户中的用户数据。后来,脸谱网知道了,并发送了一封禁令信给电力风险投资公司,该公司更改了其IP地址以继续访问。

是使用其他人的内部网帐户检索数据的典型案例,但是使用其他人的内部网帐户检索数据是否违法?

|第九巡回法院1992-016年的判决不支持原告的理由,但认为在原告明确撤回其授权后,被告继续在原告的网站上爬行侵犯了CFAA。

简而言之,未经另一家公司授权就对用户数据进行爬网的事实并不构成足够的违规。据此,至少可以得出结论,从数据属性的角度来看,在美国企业平台上抓取原始数据并不违法。

在中国,未经用户和其他企业授权,对其他企业平台披露的原始数据进行抓取是非法的微博诉momai案确立的“三重授权”原则清楚地表明了这一点。至于与企业关联度更高的衍生数据,就更不用说了。

在中国,未经其他企业授权抓取其衍生数据是绝对非法的。尚不清楚是否仍需要用户授权。

淘宝诉美晶案是司法机关保护企业衍生数据的典型案例。

本案争议始于淘宝公司自主开发经营的零售电子商务数据产品的“业务顾问”。它是通过处理淘宝用户浏览、搜索、收集、购买、交易等活动留下的痕迹信息而形成的衍生数据产品。主要用于为淘宝商户提供基于数据的业务参考。

被告美晶公司涉嫌诱使订购“商务顾问”产品的淘宝用户下载其产品分享和分享子账户,并在其平台上租用“商务顾问”产品子账户获取佣金。

与此同时,Fairview还组织其自己的平台用户租用一个“业务顾问”子帐户,通过远程登录“出租人”计算机,利用“出租人”子帐户查看“业务顾问”产品的数据内容,从而提供技术帮助和利润。

蜘蛛程序

淘宝公司以锦绣公司为被告,向杭州互联网法院提起诉讼,认为锦绣公司的行为构成了“商业顾问”的实质性替代,直接导致后者的订单量和销售额下降,极大地损害了淘宝公司的经济利益。此外,这一行为恶意破坏了淘宝的商业模式,严重扰乱了大数据行业的竞争秩序,已经构成不正当竞争行为。

案件的核心焦点之一是,法院认为淘宝公司对“商业顾问”数据产品享有财产权,而不是财产权。淘宝认为“商务顾问”数据产品提供的数据内容是在大量原始数据收集的基础上,经过深入分析、处理和整合后得出的数据。

法院同意

法院认为“商业顾问”实际上是一种网络大数据产品它不同于原始网络数据。虽然它提供的数据内容也来源于网络用户信息,但最终通过网络运营商投入大量智力劳动成果,经过深入开发和系统集成,呈现给消费者的数据内容已经独立于网络用户信息和原始网络数据,是与网络用户信息和原始网络数据没有直接对应关系的衍生数据。

法院建议网络运营商应该为他们开发的大数据产品享有自己独立的产权和利益。然而,作为一项绝对权利,财产所有权一旦被授予,就意味着未指明的多数人将承担相应的义务,这一点意义重大。因此,法院没有进一步确认淘宝对数据产品的产权。

和本案判决中提到的财产权益是基于反不正当竞争的保护框架。企业只有在受到侵害时才能获得法律保护,而不能获得事先救济。与财产权相比,这种侵权救济的保护是一种消极赋权模式。

▌其他分类

在某些情况下,法院直接以企业是否已输入其数据为前提来判断是否给予保护。

例如,在北京阳光数据公司诉上海八佳数据信息有限公司技术合同纠纷一案中,法院认为原告在有争议的财务数据库中进行了大量投资,因此应受到保护。

上海市第二中级人民法院在审理上海连刚电子商务有限公司与上海恒盛今日钢铁电子商务有限公司、上海托蒂电子商务有限公司不正当竞争纠纷案中,还裁定原告在投入大量人力、物力、财力和时间后,对原告收集整理的钢材价格数据拥有合法权益。

非常接近于为企业在其合法形成的数据上建立新的专有产权,但它名义上仍限于反不正当竞争。影响

02

合法性的第二个因素:授权模式

▌全面禁止


数据抓取方对第三方网络平台采取的全面禁止措施主要包括Robots协议和ToS禁止前者没有法律效力;后者有,即违反ToS禁止爬行其他公司的数据可能构成违约,必须承担一定的法律责任。


机器人协议(或机器人协议或拒绝机器人协议)指的是由网站所有者生成的指定文件robot.txt,用于指示网站中哪些目录不允许爬网程序爬网,并将此文件放在网站服务器的根目录中友好的爬行器通常在爬行网站的网页之前读取robot.txt文件,并且不下载被禁止的网页和数据。

蜘蛛程序

在正常情况下,网站抓取数据会给机器人协议,而不是直接采取技术措施禁止从一个IP地址访问然而,机器人协议只是君子协定,没有法律约束力。

具有法律效力。ToS禁止,即服务条款,服务协议条款它类似于许可软件的最终用户许可协议(EULA)。两者的区别在于,应用前者的用户并不使用现成的软件产品,而是使用服务。


从文字处理器和图形设计程序到高级行业软件或统计软件服务,用户可以在各种软件上遇到服务条款有不少网络平台对ToS的数据爬行发出警告


例如,大型在线免费分类广告网站Craigslist在其ToS网站上写道,“您同意不通过机器人、蜘蛛、脚本、数据提取、爬虫或任何自动或手动工具复制或收集本网站的内容。”


如果平台采用ToS禁令,拒绝第三方网络平台抓取其数据,则第三方网络平台无权抓取和下载其数据,否则可能构成违约,需要承担一定的法律责任

▌阻止信和IP障碍


包含捕获数据的网站将发送一封阻止信并设置一个IP障碍,以禁止相关的IP访问,一旦他们发现IP违反了访问的一般禁令。该法案被视为撤销了另一方继续访问其美国网站的授权。如果爬网程序继续爬网数据,这将是非法的。但是,如果对具有公共属性的数据进行爬网,爬网平台的撤销措施将毫无意义。


craigslist v.3 tapis案例是一个典型案例

蜘蛛程序

本案中,原告Craigslist在发现被告3Taps网站存在异常访问后,向被告3Taps发出了停止信函,禁止其相关的知识产权访问。然而,在收到停止信后,被告3Taps仍然使用不同的IP地址和代理服务器来隐藏其身份,绕过Craigslist设置的知识产权屏障,继续抓取数据。


作为回应,法院在其判决中认定,原告Craigslist发送停止函和禁止访问知识产权实际上构成了撤销对被告3Taps访问其网站的授权,被告无视停止函并继续获取数据违反了法律。

此外,发生在Craigslist v. 3Taps之后的hiQ Labs v. LinkedIn提醒我们,我们也应该注意捕获数据的性质。如果捕获的数据具有公开性,属于网络空间的公共产品,则不需要数据控制器的授权,授权的撤销自然不会影响爬行行为的合法性。

在Craigslist诉3Taps案中,法院关注的焦点是数据捕获是否违反了数据捕获方的警告措施。法院裁定,Craigslist发出的停止函和设置的知识产权壁垒可被视为撤销对被告继续访问该网站的授权。在林肯号案件中,法院考虑了捕获数据的性质。


虽然LinkedIn也向hiQ发出了停止信函并采取了相应的技术措施来禁止知识产权访问,但由于hiQ获取的数据是向公众开放的,LinkedIn撤销hiQ访问其自身公共部分的授权不会使hiQ的行为在CFAA意义上成为“未授权的”

和hiQ向法院申请强制令,仅仅是因为他们担心,如果LinkedIn的技术措施被绕过,将导致法律责任,这强调了在数据属性被澄清后,另一家公司的授权的重要性。

▌特别授权


签署开发商协议。使用开放应用编程接口授权是允许第三方网络平台获取和下载其数据的最常见方式

在我国,如果企业通过开放应用编程接口进行合作,合作的结束相当于授权的撤销。被撤销的授权方应根据协议清理非用户的信息数据。如果被撤销的一方继续充当网络爬虫,这是非法的。

应用编程接口(application programming interface),也称为应用编程接口,是连接软件系统不同组件的合同例如,如果您在浏览器中输入www.facebook.com,一个请求将出现在脸书的远程服务器上。一旦浏览器收到响应,它就解析代码并呈现网页

对于浏览器(所谓的客户端),脸书的服务器是一个应用程序编程接口这也意味着,每次用户访问互联网上的页面时,他们实际上都在与远程服务器的应用编程接口进行交互。

在数字经济时代,许多企业将原料药包装成产品出售或通过类似的方式如开放原料药进行合作。

气象地下组织将其气象数据应用编程接口的访问权出售给其他第三方网络平台,以获取经济利益;在微博诉momai案中,两人最初是通过微博平台的开放API进行合作的。在脸谱网诉权力案中,双方最初的合作也是如此。

近年来,专业人士对API的讨论越来越多,免费代码营也有不少帖子对此发表评论。彼得·加扎罗夫(Petr Gazarov)在场景示例中解释的应用编程接口似乎更容易理解:你是一个小企业,公司网站上有一个表格,用来注册预约客户。您希望使用这些预订详细信息使客户能够根据谷歌的日程自动创建活动

这意味着您的网站服务器需要通过应用编程接口直接与谷歌服务器通信,并在知道给定细节的情况下申请创建活动。之后,您的服务器将收到谷歌的回复并进行处理,然后将相关信息发送回浏览器,例如,向用户发送确认消息。

一般来说,如果双方通过开放应用编程接口进行合作,合作的结束相当于授权的撤销,被撤销的被授权方应根据协议清理非用户的信息数据在微博诉momai一案中,双方通过微博的开放API签署了开发商合作协议然而,合作期满后,该软件仍然显示一些非微博用户的新浪微博用户信息。此外,在微博给予Momo的特别授权终止后,Momo仍然进行抓取微博数据的行为。


在判决书中,法官认定莫美琪的爬行行为侵犯了微博的商业资源,属于不当获取竞争优势,超出了受法律保护的合法竞争行为,因此莫美琪败诉。

▌特殊默示授权

除了上述授权方法外,还可能有特殊默示授权

例如,LinkedIn允许hiQ在没有任何协议的情况下获取数据长达五年。这是隐含的权威吗?美国法院对此案的判决倾向于将其认定为默示授权。

在领英的案例中,hiQ在领英的网站上实现了一个网络爬虫。然而,加州北区法院的法官认为这种爬虫行为并没有违反法律,因为LinkedIn网站上的数据是公共数据。对于公共数据,即使爬虫违反了另一方设定的机器人协议,也应该得到法律的允许。这就像白天推开一家没有上锁的商店,往里面看,这不能被视为非法入侵。

因此,法院不仅没有认定hiQ的爬虫非法,还认定LinkedIn的反爬虫技术非法,要求LinkedIn消除对hiQ的访问障碍。< br>

蜘蛛程序

这意味着法官认为第三方网络平台捕获和下载公共数据可以被视为已经通过了隐含的授权,因此不属于CAFF规定的非法访问受保护计算机信息系统的两种类型。然而,这一先例能否在随后的实践中得到广泛承认还有待观察。



03

结论


数据爬虫的行为已经引起了国内外理论界和实务界的极大关注


原因之一是:一方面,在大数据时代,数据对个人、企业乃至整个社会都具有重要意义;另一方面,国内外立法在不同程度上与实践脱节,留下了巨大的探索空间。

到目前为止,学术界还没有提出一个令人信服的计划来规范爬行动物的行为。上述美国《CFAA法案》和中国法官经常引用的《反不正当竞争法》并没有很好地针对当前的法律问题。

通过对现有案例的分析,可以看出数据属性和授权方式将明显影响中美两国数据爬虫的合法性。基于对公共利益的考虑,美国认为可以在没有授权的情况下对原始数据进行抓取,而其他类型的数据将受到不同程度的保护。

在中国,即使开放原始数据也需要获得“三重授权”才能合法抓取,至于非公开数据和衍生数据,法律保护的严格性是不言而喻的

此外,还有其他因素,如企业对其数据的投资,也可能进入法院考虑的范围来衡量数据爬行的合法性至于授权模式,广泛使用的机器人协议不具有法律效力,但Tos禁令具有法律效力

当数据爬行器违反这些一般禁令时,另一个企业通常会发送一封停止信并设置知识产权壁垒,这清楚地表明中国和美国都撤销了授权。如果抓取的数据属于需要企业授权的类型,爬虫必须在收到此类表示后停止抓取,否则将承担法律责任。

此外,如果通过开放应用编程接口等类似方式进行合作,合作的终止将是授权的撤销。最后,在美国,被爬行的企业知道但不阻止爬行的行为可以建立隐含的许可并赋予爬行行为合法性

作为一个整体,美国的个人数据和信息保护经历了一个相对漫长的发展过程,其态度逐渐倾向于公共利益,而中国的“三重授权”模式体现了对个人利益的审慎保护。

未来,我们还需要综合考虑数据属性、授权模式、抓取模式、抓取数据利用模式等诸多因素,构建一个平衡各方利益的法律体系

大家都在看

相关专题