欢迎访问 舍力博客(www.shuyong.net)

    舍力--用心做好每一件事!

当前位置:首页 » 代码教程 » 防止火车头等采集器采集的一些简单方法分享

PC端所有页面:广告位1,招租联系QQ345952779

防止火车头等采集器采集的一些简单方法分享

日期:2018-05-04   分类:代码教程
舍力自己也用采集器采集过文章的,所以对网站防采集有一些心得体会,今天就给大家分享一些采用动态不规则的html标签防止采集的方法

随机代码:
<?php echo dechex(rand(1,888888));?>

舍力分析:如果css中用[.sheli]来确定参数,那么<div class="sheli">与<div class="slsj sheli">对于页面显示效果一样,但是作为采集器的标记就是两个不同标记了,如果每次页面的html标签内空格数随机,那么采集规则 就失效了。但是,这对搜索引擎爬虫没多大影响。 

操作方法:将循环的div中calss最前面加入随时代码,要注意空格;例如
<div class="<?php echo dechex(rand(1,888888));?> sheli">

适合网站:所有PHP动态且不想遵守网页设计规范的网站。

温馨提示:舍力提供的这个方法也只是给采集器增加一些困难,高手还是能采集到你网站的数据的。
blogger
    本页正文内容约439个文字
    本文地址:http://www.shuyong.net/1028.html
    除非注明,文章均为 【舍力博客】 原创,欢迎转载!转载请注明本文地址,谢谢!
    本文已经被百度收录,点击查看详情
觉得很赞 (1)打赏支持
X
打赏方式:
  • 微信
  • QQ红包
  • 支付宝

使用微信扫一扫
PC端所有页面:广告位2,招租联系QQ345952779

留言/评论:◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

填写好QQ号码,任点空白处自动获取

昵称

邮箱

网址

4楼、亚克力浴缸 [回复该留言]
2018-05-14 17:51
火车头采集有点复杂
3楼、米扑博客 [回复该留言]
2018-05-09 08:17
非常精妙的随机数,正好有用,赞一个
2楼、网站建设 [回复该留言]
2018-05-08 11:01
学习了,谢谢分享
1楼、残影 [回复该留言]
2018-05-05 20:59
谢谢分享

个人资料

舍力

博主:舍力

Emlog交流群

    网站制作
    1、博客网站以Emlog为程序;
    2、企业网站建议以米拓MetInfo为程序,当然也可以用Emlog来做。

博客统计

  • 文章数量:1023篇
  • 文章评论:2988条
  • 总访问量:2671675次
  • 微语数量:50条
  • 在线人数:3人
  • 本站运行:4年9月1天
  • 博主很懒,今天什么都没留下!
PC端所有页面:广告位3,招租联系QQ345952779
Copyright © 2018 舍力博客 版权所有   粤ICP备11021420号
数据存储阿里云 QQ群:398634813
努力写好每一个代码,用心服务每一位用户
Powered by emlog / &Author 舍力博客.