本篇文章是前面两篇文章的总结应用,所以没搭好搜索环境的朋友请先看第一篇文章。本篇文章的搜索结果是基于谷歌浏览器的。浏览器中能搜索出来的资源都是合法资源,大家可以放心食用。

1、 学会分析一些网站的链接,然后利用site+inutl组合进行搜索

以石墨文档为例

利用搜索引擎进行资源搜集第三课时_微信


石墨的链接可以分成两部分,用蓝色框代表的是域名部分,而docs是链接中的关键词。多分析几个石墨就会发现,所有的石墨链接几乎都遵从这个模板。利用搜索语法,我们可以写出这样的搜索语句:

site:shimo.im inurl:docs

来看看搜索的结果

利用搜索引擎进行资源搜集第三课时_搜索引擎_02


请注意,相同的搜索,百度可能存在有结果也可能存在没结果的情况的哈,例如

利用搜索引擎进行资源搜集第三课时_微信_03


不过,仅仅搜索出来一堆石墨分享的链接是不够的,往往我们需要根据内容进行搜索。再以微信的文章为例,

利用搜索引擎进行资源搜集第三课时_搜索_04


微信文章的链接一般长这个样子,于是,我们又可以提炼出域名和url关键词了。写出

site:weixin.qq.com inurl:s 这样的搜索语句应该并不困难。我们来加个关键词儿搜索一下(注意,有的加了关键词之后反而搜索不出来,可能跟个别网站自身对搜索引擎的屏蔽性有关)

利用搜索引擎进行资源搜集第三课时_微信_05


我们需要掌握对一个资源链接进行拆分的方法,然后利用site+inurl关键词组合进行搜索,这样可以搜索到大量新的东西。想想看,你都有那些渠道能够真正了解新的东西,这种方式是一个不错的选择。2、 学会利用谷歌搜索引擎替代站内搜索

之前,朋友碰到一个网站,站内搜索一搜索就会出错,错误如下

利用搜索引擎进行资源搜集第三课时_搜索_06


就是说有非法字符,然而我仅仅搜索了 123 这个词儿

利用搜索引擎进行资源搜集第三课时_搜索_07


最后我给他的建议是,可以使用 site:52pg.net 关键词

的方法进行搜索,例如:

利用搜索引擎进行资源搜集第三课时_搜索引擎_08


这里的搜索结果和站内搜索的结果差距不大,利用谷歌搜索引擎代替各个网站的站内搜索,在站内搜索出问题的情况下,是一个不错的选择。3、 对一类域名进行搜索

我们知道,域名的最后一位,往往可以代表一些组织的性质,例如,org,​​edu.cn​​ 等。我们搜集一些资源的时候,如果不知道具体自己找的资源在哪个网站上,但是能确定在哪一类域名的服务器上,就可以使用最后一位域名固定的方式进行搜索,例如

利用搜索引擎进行资源搜集第三课时_搜索引擎_09


这里值得一提的是,学校是学生信息泄露的一个重灾区。这里,我对 ​​edu.cn​​ 这一类域名进行了搜索。