人类作为高等动物,其中最主要的特点就是会思考。因此在人类文明建设过程中,人类发明了很多高科技的技术,其中有一名叫做数据抓取。
1. 数据抓取,以其最一般的形式,是指一种计算机程序从另一程序生成的输出中提取数据的技术。数据抓取通常体现在网页抓取中,网页抓取是使用应用程序从网站提取有价值信息的过程。
2. 通常,公司不希望其独特内容被下载并重新用于未经授权的目的。因此,不会通过开放的API或其他便于访问的资源公开所有数据。而另一方面,不管网站怎样限制访问权限,抓取机器人都会尝试对网站数据进行抓取。这样,网页抓取机器人与各种内容保护策略之间就存在一种猫捉老鼠的游戏,道高一尺,魔高一丈。