主要是判断HTTP_USER_AGENT

//屏蔽蜘蛛访问
function banspider($ban_str){
if(preg_match("/($ban_str)/i", $_SERVER['HTTP_USER_AGENT']))
{
exit;
}
}

 

常用搜索引擎名与 HTTP_USER_AGENT对应值

百度 baiduspider

谷歌 googlebot

搜狗 sogou

腾讯 SOSOsosospider

雅虎 slurp

有道 youdaobot

Bing bingbot

MSN msnbot

Alexa is_archiver