网站防采集的五种方法
发布时间:2019-07-06 23:47:41作者:魏义齐阅读:()评论:
本文为博主原创文章,未经博主允许不得转载、摘编或利用其它方式使用本博客内容。
百度关闭原创保护后,原创内容不再得到保护,若还想保护原创或保障自己的利益只能去百家号或者跟版权公司合作,版权公司基于大数据和区块链技术会快速发现抄袭文章,版权公司进行维权事宜,获得的赔偿金与我们分成,但是老站长很少有人玩百家号的,因为受不了百家号的破规矩;跟版权公司合作也很麻烦,从侵权到获得赔偿是一个漫长的过程,所以,保护自己的原创利益还是要从网站上下功夫,在网站加版权声明这种基本的措施就不说了,我只说几个具体的方法。
一、选择有防采集功能的程序,例如帝国cms有防采集功能,能起到一定的防采集效果。
二、采集者要采集你的网站就必须分析你的网页结构,不管是多老练的采集者还是多牛逼的采集软件都绕不过这一步,因为采集的内容要入库就得跟采集者的网站匹配上。能采集的做的都是批量内容,所以采集一般都是采集列表页,很少有人为了采集某站的某一篇文章而单独建立一个采集节点,我们要做的就是增加采集者分析列表页网页结构的难度,防右键、F12、ctrl+shift+i、手动点击开发者工具代码如下:
<script>
//禁用右键(防止右键查看源代码)
window.oncontextmenu=function(){return false;}
//禁止任何键盘敲击事件(防止F12和shift+ctrl+i调起开发者工具)
window.onkeydown = window.onkeyup = window.onkeypress = function () {
window.event.returnValue = false;
return false;
}
//如果用户在工具栏调起开发者工具,那么判断浏览器的可视高度和可视宽度是否有改变,如有改变则关闭本页面
var h = window.innerHeight,w=window.innerWidth;
window.onresize = function () {
if (h!= window.innerHeight||w!=window.innerWidth){
window.close();
window.location = "about:blank";
}
}
</script>
view-source防不了,我们可以压缩html代码增加分析代码难度,模板建站的注意不要压缩模板代码,否则前台内容出不来,用cdn的可以缓存栏目页静态url,缓存后代码就被压缩了。
三、及时封禁可疑ip。
采集ip一般以C段形式出现,在百度统计里采集ip的访问都是未知、一页,且间隔时间短,我们可以一天查看两次百度统计数据找出这些ip,中午一次、晚上一次,有人会说这样太麻烦了,看统计数据要会看,实时访客着重看三个指标来源、入口页面和访问时长,排查一页数据也就几秒钟,要是一条一条过,干脆别干活了,就盯着数据看。
发现可疑ip立马封禁,没用cdn的源站封禁,用了cdn的最好在节点和源站都封禁,采集ip的封禁在时间上要尽可能长一些,防止以后再采集,关于如何封禁ip大家可以看文章“封禁ip的两种方法”。
四、禁止UA为空或含有PHP的请求,具体代码请查看文章“网站被镜像前后我们应该做什么”添加,这段代码我没有测试过,具体效果未知。
五、在文章上下功夫,比如我的文章“详解rss订阅(如何在网站添加rss订阅功能和如何订阅自己喜欢的网站)”流量大家都很羡慕,但是没人采集也没人抄袭,为啥大家搜索看看就知道。
采取了上面五种方法可以最大程度地防采集,但如果采集者把你的页面扒下来或者有足够的耐心分析你的网页结构,那就没办了,不过我们可以在不同js文件里加不同的非本域访问跳转自己网站的js代码,虽然这些js代码能被找出来,但我想到此大部分采集者已经放弃了。
相关阅读
-
无相关信息
上一篇:如何在西部数码选购适合自己且性价比最高的服务器?下一篇:云存储新选择:西部数码独享云虚拟主机
原创不易,您的赞助就是博主更新的动力!

赞助请备注,8.88元及以上可在赞助光荣榜留下外链信息。
完全自托管的评论系统
-
东方星雨
-
deanhan
-
1264822519
-
aini3311
-
a1051020101
-
weiyiqi
- 微信内置浏览器如何清除缓存和加速打开网页(4459)
- 封禁ip的两种方法(4425)
- windows10系统下如何彻底卸载phpstudy(3200)
- 使用vpn时,使用百度云加速的网站不能访问的两种解决方法及注意事项(2905)
- 彻底解决win10文件夹右上角出现箭头的方法(2641)
- 前端工程师必须要看的五个个人技术博客(1960)
- 网站被莫名其妙植入广告怎么办(1573)
- 多吉云——网站需求一站式解决,附多吉云使用注意事项(1510)
- 站长必知:各搜索引擎的爬虫UA和禁止抓取的robots写法(1404)
- 网站被镜像怎么办(1366)
- 多吉云一年八个月使用体验(2025-05-28)
- 14.152.91.0/24、183.60.225.0/24,这两个东莞的ip段到底是干嘛的?(2025-05-26)
- 将注册和评论系统的阿里邮箱升级至阿里的DirectMail邮件推送服务(2025-05-24)
- 推荐三个近期新发现且有实际使用的工具网站(2025-05-16)
- 电脑上的图片和视频不显示缩略图如何解决?(2024-05-05)