无意间看到一片博客,关于前端反爬虫的介绍,在这里自己对以上信息进行汇总记录。

1.font-face拼接方式, 如:猫眼电影:

  采用font-face方式,将对应的数字存到字体中,然后在将字体url转换成unicode进行显示到页面,而且每次刷新页面后的url都在变化。如下图:

javascript 反爬 前端反爬虫_伪元素

2.background拼接模式,如:美团:

  美团将信息采用将信息放到background中,然后通过偏移background图片,显示出来。

3.字符串穿插模式,如:微信公众号文章

  某些微信公众号的文章中,在其中穿插了一些无关字符,然后通过css将无用字符在隐藏掉。

4.伪元素隐藏模式: 如:汽车之家

  把一些核心的内容写到了元素的伪元素content上,如果想爬虫数据, 还需要解析css 伪元素。

5.元素定位覆盖式:如:去哪儿

  如展示一个四位数价格的机票,先用i标签展示了错误的数字价格,然后在b标签通过定位,将错误的显示内容在覆盖上,显示正确的内容。