仿站的时候采集到的数据存在很多可以跳转其他站的a链接,在采集的时候就可以替换掉

<?php
// 替换a标签中的href属性值
function a_replace_href($str) {
  $preg = '/href=(\"|\')(.*?)(\"|\')/i';
  $replacestr = 'href="#"';
  $res = preg_replace($preg, $replacestr, $str);
  return $res;
}
// 获取字符串中的所有a标签
function from_str_get_a($str){
    $preg = '/<a .*?>/i';
    preg_match_all($preg, $str, $matchs);
    return $matchs[0];
}
$str = file_get_contents("index.html");
$data = from_str_get_a($str);//获取字符串中的a标签
$data1 = a_replace_href($data);//替换后应该显示的a标签
$res = $str;
// 反复对字符串进行查找替换
foreach ($data as $key => $value) {
    $res = str_replace($value,$data1[$key],$res,$i);
}
// 另存文件
file_put_contents("index1.html",$res);