一个单文件的PHP采集,将采集的id数据保存到一个 txt 文档中,运行 php 文件即可自动运行采集,主要是理解 php 的一个采集原理,不适合直接进行网站应用,本程序是一个采集天下mm论坛美女图片的程序,本文件利用的是打开目标网址,采集网址后的ID,然后将其ID保存到 txt 文档中,在 txt 文档中形成一组采集过来的 id 号,我们可以利用这个程序去采集其它网站的一个ID,然后利用单文件采集的原理进行入库,不过这个文件需要适当的进行修改一下。
下面是源文件:
PHP代码
.($id+1)."';</script>");
}
preg_match_all("|
|iUs",$content,$addr);
if(emptyempty($addr[1]))
{
exit("<script>location.href="http://www.php1.cn/">.($id+1)."';</script>");
}
$_SESSION['addr']=$addr[1];
$_SESSION['i']=0;
}
for($i=$_SESSION['i'];$i
18)
{
exit("<script>location.href="http://www.php1.cn/">.$id."';</script>");
}
}
unset($_SESSION['addr']);
unset($_SESSION['i']);
exit("<script>location.href="http://www.php1.cn/">.($id+1)."';</script>");
?>
a.txt 为数据文件
d.php 为图片采集程序,直接在浏览器中打开运行即可。