我们来看一下以下这2个网址:http://www.lcbc.com.cn、http://www.baiud.com,在此之前大家有没有发现有什么异样?仔细一看,大家会发现,工商银行的官网域名中的i被替换成了l,百度官网的d和u被调换了位置。很久以前,就发生过类似的情况,骗子注册一个类似于官网的域名,比如,把官网中l和1相互替换,o和0互相替换,再把这个域名解析到一个页面内容和正规官网一模一样的网站上,进而行骗。据报道,被骗子用此法骗到的人不在少数。接下来极客君就来带领大家来认识一下骗子是怎么克隆一个正规网站的。

防不胜防,你可能访问了一个被克隆的网站_wordpress

如果一个网站没有采取严格的防抓取措施,我们使用一些工具是很容易就能够抓取整个网站页面的,把抓取到的内容稍作修改之后上传到一个服务器上,IP解析到一个相似的域名上,很容易就实现克隆一个网站了。细心的小伙伴会发现,点击某些页面会出现无法正常打开的情况。这是由于抓取网页只能抓取部分页面及内容,如今大部分网站都是动态的,并不能克隆整个网站及其数据库内容。这一系列操作是怎么实现的呢?

防不胜防,你可能访问了一个被克隆的网站_web_02

通过搜索引擎,我们可以找到一些比较正著名的网站页面抓取工具,具体可以在搜索引擎输入“整站下载器”关键字尝试一下。例如:Webzip、Teleport pro、Teleport Ultra、HTTrack等,工具太多了,极客君也就不一一列举了!具体使用方法敬请自行查找教程。下载完成之后,把相应的链接、内容改成自己所需要的,通过FTP、SSH等工具上传到服务器,解析到指定域名就完成了整个网站克隆。

防不胜防,你可能访问了一个被克隆的网站_css_03

最后,极客君温馨提示一下,每次访问涉及敏感信息的网站,请尽量手动输入正确的官方网站域名,认准是官方域名之后再进行点击访问,在后续的文章中极客君会带大家一起去认识、辨别一个网站是不是官方网站,敬请期待!对于网站开发、维护人员,尽量选用识别度高的域名,在开发时就要考虑到网站会被抓取的情况,做好防爬虫、抓取的相关措施。

防不胜防,你可能访问了一个被克隆的网站_搜索引擎_04

新年快乐

防不胜防,你可能访问了一个被克隆的网站_web_05

防不胜防,你可能访问了一个被克隆的网站_搜索引擎_06

防不胜防,你可能访问了一个被克隆的网站_css_07