无意间看到一片博客,关于前端反爬虫的介绍,在这里自己对以上信息进行汇总记录。
1.font-face拼接方式, 如:猫眼电影:
采用font-face方式,将对应的数字存到字体中,然后在将字体url转换成unicode进行显示到页面,而且每次刷新页面后的url都在变化。如下图:
2.background拼接模式,如:美团:
美团将信息采用将信息放到background中,然后通过偏移background图片,显示出来。
3.字符串穿插模式,如:微信公众号文章
某些微信公众号的文章中,在其中穿插了一些无关字符,然后通过css将无用字符在隐藏掉。
4.伪元素隐藏模式: 如:汽车之家
把一些核心的内容写到了元素的伪元素content上,如果想爬虫数据, 还需要解析css 伪元素。
5.元素定位覆盖式:如:去哪儿
如展示一个四位数价格的机票,先用i标签展示了错误的数字价格,然后在b标签通过定位,将错误的显示内容在覆盖上,显示正确的内容。