有效防止文章被复制采集的方法技巧
最近在和几个博友闲聊,在谈到为什么最近博客都不更新文章了的时候,博主们就开始吐槽说自己辛辛苦苦原创的文章,被人家直接复制粘贴过去,发到各大论坛来做外链,很是气愤呀!
确实,现在一些推广人员为了做外链,提高自己网站权重,就喜欢复制别人网站的原创文章,不加作者连接,只加上自己需要做的连接,到各大论坛发布,这严重损害了原创作者的心。马海祥博客的很多文章也被这样复制过,最让人生气的就是被人复制粘贴过去的文章排名还比你的原创文章排名还好,流量也被截取了。
当网站中大量的内容被别人采集,特别是被一些权重较高的站采集转载后,是非常损伤网站元气的。你辛辛苦苦的原创,在这时候也只能成一个牺牲的肥羊了。
我非常反感那些采集别人文章的人,特别是采集后一个链接都不留,甚至还把你内容中留的版权内链去掉的人,非常的鄙视!
虽然最近百度算法有进一步的升级,但是对于源网站的排名情况也没有进一步的提升,所以为了最大化的避免站长们的原创文章复制导致的损失,在此马海祥博客跟大家分享以下几种防止文章被复制采集的方法:
一、增加版权信息
对于用户体验最好的,就是可以允许复制,但是我们可以在复制的内容上面加入版权信息,这种方法很多网站都开始使用了。
具体方法是:找到系统后台-模块-默认模块管理-文章页模板中加入下面的代码,可以试试,在IE内核的浏览器中可以可以实现复制网页正文内容时自动添加版权信息的功能!
JavaScript代码:
<script language="javascript" type="text/javascript">
<!--
document.body.oncopy = function () {
setTimeout( function () {
var text = clipboardData.getData("text");
if (text) {
texttext = text + "\r\n(这里是你的文章版权信息,去掉括号):"+location.href;
clipboardData.setData("text", text);
}
}, 100 )
}
-->
</script>
二、使文章页面无法复制代码
找到系统后台默认模块管理中的footer.htm,或者文章页模板的底部代码模块,将以下代码加到页面文件的最后的一个<\div>后边,保存即可。
<script language="javascript">document.oncontextmenu=new Function("event.returnValue=false");document.onselectstart=new Function("event.returnValue=false");</script>
另外,禁用复制功能也是很多人使用的防拷贝防采集的方法,这类防采集的文章,你只能通过“查看源文件”里使用他的文章内容了。不过,已经有很多破解方法了,正所谓上有政策下有对策,但他起到给拷贝者制造麻烦的作用,而且并不是所有人都学会了“破解方法”的,因此,我还是推荐你使用防拷贝策略的。
三、使用防采集代码
其实正常的采集工具,一般都需要内容开始代码和结束代码具有唯一性。所以我们可以在文章页面开始的<div class=”title”>中加入一段id=”{dede:field.id/}”,从而让文章自动获取一个文章ID,如下图所示:
这样每篇文章的ID都是不一样的,所以采集工具采集的时候,每次只能采集一篇文章,进而可以有效防止低级采集工具的采集,但是高级采集工具可能防不住了!
四、设置DEDE自带防采集字符串
DEDE是自带防采集字符串功能的,通过设置防采集字符串,可以让别人采集文章后出现散乱的字符串,这样很影响阅读,从而让采集的网站不得不放弃采集。
经过防采集混杂字符串管理停止设置需,能够增减躲藏被采集后会显现出来的内容,普通能够参加些版权声明或者您网站的相关信息,设置办法只需求在“#start#”和“#end#”之间参加内容即可,每条内容前加“#,”,一条内容为一行,里面的内容会随机插入到生成后的html里面,可依据下图停止设置。
当然,这并不是万无一失的,所为道高一尺魔高一丈,如果防采集字符串比较少,稍微设置下采集规则便可以替换掉那些无意义的字符串;如果字符串比较多,这对文章的关键词密度会起到稀释作用。
另外,少数人建议直接用网站关键字、网站链接作为字符串,据说这样可以增加网站外链,别人采集得越多外链会越多。马海祥对这样的做法持保留态度,毕竟设置防采集字符串和SEO作弊很相似,弄得不好被搜索引擎K掉那就亏大了。所以,目前很多网站都没有设置这种功能,不知道是不是因为这样的原因。
五、封采集者的IP
为了防止采集,绝大多数方法是“双刃剑”,采取封IP的办法防止采集,令企图采集者无功而返,实践证明本方法绝对不影响搜索收录。
具体代码如下:
<%
Dim IP,IPString,VisitIP
'要禁止的IP地址
IPString="|45.125.14.95|183.56.168.84|127.0.0.1|120.55.38.50|47.90.121.181|"
'获取IP地址
IP = Request.ServerVariables("HTTP_X_FORWARDED_FOR")
If IP = "" Then
IP = Request.ServerVariables("REMOTE_ADDR")
End If
VisitIP="|"&IP&"|"
If instr(1,IPString,VisitIP)>0 Then
response.write "你的IP被禁止"
response.end
End If
%>
使用方法:
将上述代码放到<head>区,如果不知道什么是<head>区,你就放到</head>上面即可!
IPString="|45.125.14.95|183.56.168.84|127.0.0.1|120.55.38.50|47.90.121.181|"是采集你网站内容的垃圾站服务器IP,你可以自己替换,不知道对方服务器IP的可以点开始------运行-----输入ping www.*****.com(采集网站的网址)获得其IP。
另外,127.0.0.1是防止从本地采集,你可以在本地试试,因为现在许多新网站都是从本地采集,所以这个127.0.0.1一定要封它,现在许多网站程序有封IP功能,就不需要上述代码了,直接封其服务器IP就行了!
六、防止文章被采集的一些简易方法
除了以上几个方法,我还整理了以下几个随手就可以实现的方法,我觉得还是有一定的作用的,现在分享给大家:
1、加水印
当你的文章中带有图片时候,记得给文章中的图片加上水印,这样就留下了你的版权,对方要采集你的文章后,不可能一张一张去PS的,这样也算是变相地帮助我们宣传网站。
2、穿插信息
写文章的时候,尽量随机的去穿插一些你网站名字,链接,作者之类的信息,只要能够读的通顺就尽力多加一点。对方要采集你的文章的话,他也要花大量的时间去处理,久而久之,便不会愿意采集我们的文章了。同时对于马虎大意的采集者来说,就留下了你的信息。
3、留内链
适当的在你的内容中加一些内链,不过也不要加太多,3个以内吧(具体可查看马海祥博客《网站内链结构该怎么进行布局》的相关介绍)。
4、临时留错
这个方法很巧妙,如果发现某个站盯上你了,每天定时采集你的文章内容时。你可以在发表文章的时候,故意写错一些东西,或者加上一些不好的词汇,代码类的可以错几行代码,看到他采集过去后,自己再赶紧改过来,这样可以让他的用户体验度降低。不过,要提示您,这种方法并不提倡,万一你的用户恰好也在这个时候看到你的文章了,也会对你有影响,所以这种情况只适合刚起步,访问较小的网站。
这个方法的具体做法是在文章各个段落的任何位置里,添加一些无用的字符,然后把这些字符的颜色设置为白色,并把这些字符的大小设置为0。
代码如下:
<font style="font-size:0px;color:#FFF">/ ^! |7 c; i1 T" x1 Q$ X1 \) G) C</font>
这个方法,可以使软件不能轻松采集到他的文章内容。
其实,很多人不是用无用字符,而是用他网站的网址,这样,你拷贝他的文章直接发布时就带上他的网址了,给他网站增加了外链。
因此,遇到此类防采集的网站,采集者需要手动删除这些多余的字符。
不过,这样防采集的同时,文章也多了很多无用的字符,并不利于文章SEO优化。
5、网址提交
先将写好的文章的网址提交给百度,过两天再将文章放出来,此时,百度可能已经收录你的文章了。就算对方再来采集了,也没有那么大的影响了(具体可查看马海祥博客《采集的文章内容该如何快速收录和排名》的相关介绍)。
6、重要内容设定会员访问限制
如果你的网站中确实有比较重要的内容要有所保留,固定的资源才能够吸引固定的用户,这样可以通过设置会员访问限制,让注册会员或者高级会员才能够访问这部分内容。
当然,这同样会把搜索引擎拒之门外,不过为保持网站的吸引力,适当的稀有资源还是有必要保留的。如果网站没有让用户留下来的资源,那么用户很容易出走的。
当然,防采集的方法还有很多,大家可以去各大网站上学习、模仿。马海祥觉得,如果是准备通过原创内容来提高权重的新站,防采集还是有必要的;如果网站已经发展得比较大,防采集是没多大必要的,毕竟搜索引擎已经认可这里是文章首发地。
最后再提醒大家一点,因为每个网站根据使用时间和布局的不同,部分系统模板代码可能都会存在一点区别,所以建议在修改之前要保存一份源代码,以避免不小心的误操作导致整个网站的损失。
马海祥博客点评:
其实,无论多么高明的技术和方法都不能百分百防止原创文章被他人抄袭,只能说起到一定的作用,那就是增加对方的工作量而已。最有效的方法还是大家都遵守规则,要么自己原创,要么就直接转载文章并保留文章出处,要么就进行大规模的伪原创。对于目前网络的这个氛围,感觉要很多年以后,这种抄袭的行为才有可能减少,想根治真的很难。
本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于https://www.mahaixiang.cn/znseo/1990.html,注明出处;否则,禁止转载;谢谢配合!上一篇:子域名和子目录哪个更有利于SEO优化
下一篇:百度判断优质内容的影响因素有哪些?
您可能还会对以下这些文章感兴趣!
-
百度如何判断网站文章质量度的高与低
百度搜索引擎为了提高互联网的良性发展,对搜索算法的更新也是日新月异,不断的推出搜索新算法,要求网站运营需要符合用户体验,给用户提供有价值的内容,新算法给站长们带来的影响是很大的,但最终目的也都是为了发掘更多的优质文章。在SEO优化行业流行着这么一句话:“……【查看全文】
-
独立博客网站该如何做站内SEO优化?
从广义的角度来看,我这篇文章的本身也是一种SEO的手段:既然进行SEO的终极目的还是有人来看,那么作为博客主要构成的内容部分肯定才是最重要的,所以就有“内容为王”的说法,如果你的博客内容非常精彩,你也就没必要做SEO这么无聊的玩意儿了;要是你的博客不但惨淡而且无聊……【查看全文】
-
从网站流量公式来看如何提升网站流量
随着互联网的发展,出现了一群特殊的人,他们有一个共同的名字叫做“站长”,虽然他们各自经营的内容不一样,但是他们有一个共同的目标就是提升网站流量,只有提升流量才能提高网站的排名,从而创造效益。一个网站要想有更大的发展,首先要有流量,网站没有流量就没有人……【查看全文】
阅读:1004关键词: 网站流量 日期:2017-11-26 -
网页热力图对网站页面优化的帮助有哪些?
热力图是以特殊高亮的形式显示访客热衷的页面区域和访客所在的地区,其特点是,可以显示不可点击区域发生的事情,你将发现访客经常会点击那些不是链接的地方,也许你应该在那个地方放置一个资源链接。比如如果你发现人们总是在点击某个产品图片,你能想到的是,他们也许……【查看全文】
-
论坛网站该如何做站内SEO优化
众所周知,网站SEO优化对一个网站的发展与生存至关重要,论坛也是一样,现在很多站长选择用论坛建站,因为比较方便,只要建设起来有了一定人气,每天的工作只是很轻松的管理帖子和用户,不需要太多的文章编辑和内容更新。我看过很多的论坛,很多站长朋友并不懂SEO,也并……【查看全文】
-
大量重复URL被百度索引收录的解决方法
最近,很多SEO有这样的疑惑:索引量工具显示索引量数值很高,但流量总也上不去,也没有发现我们站内有低质内容,对此,马海祥找到了导致索引量高流量低的一个原因,并给出的解决方法,URL参数也叫URL query,是一个最复杂,最容易被忽视,最容易被妥协的问题,他是网站运营中……【查看全文】
-
文章质量的高低是否取决于文章内容的多少?
一般用户在网上阅读内容时,注意力只能集中很短的时间。一般来说,读者在一个网站的文章里驻留的时间平均保持在96秒钟。这意味着你只有一分半钟的时间与读者沟通。因此,很多网站的经营者都会特意把内容的长度限制在扫几眼就能读懂的范围内,那么在网站里一篇文章的最佳……【查看全文】
-
网站跳出率的分析方法及优化技巧
网站跳出率是指用户通过搜索引擎进行搜索关键词来到你的网站,只浏览了一个页面就离开与全部浏览数量的百分比。观察关键词的跳出率就可以得知用户对网站内容的认可,或者说你的网站是否对用户有吸引力,而网站的内容是否能够对用户有所帮助留住用户也直接可以在跳出率中……【查看全文】
-
网站URL路径该如何做SEO优化
搜索引擎作为一个程序,在互联网上抓取和识别网站唯一的标准就是:网站URL路径,我们想要把网站权重做起来,就要想办法让我们每一点权重集中起来,网站URL路径的优化就是网站路径的集权,通过把权重集中于一个主路径上,进而获取更好的搜索引擎的权重,路径优化是SEO优化的比……【查看全文】
-
网站导航的优化方法和设置技巧
一说到网站导航,可能很多人的第一印象就是网站头部的那一排主导航栏,感觉没什么优化的必要。其实这是一个误区,网站导航不仅包括这个主导航,网站其它栏目、文章分类、当前的位置、返回首页、返回上一页等都是网站导航系统的一部分。凡是有助于方便用户浏览网站信息、……【查看全文】
-
网站关键词的选择和优化设置技巧
很多的站长打算建立一个新站之前,首先想的不是要先找关键词,而是先想着怎么上线,关键词等到网站上线正常之后,才慢慢的通过百度指数、下拉框、相关搜索及关键词查询工具进行寻找挑选,其实对于标准的新站SEO操作而言,这是一种大忌,尤其是现在搜索引挚普遍对新站都是非常……【查看全文】
-
如何利用SEO技术设置文章网页标题
SEO标题跟我们正文标题是完全不一样的,因为SEO标题的主要目的是为了做SEO优化而产生的,为了让用户在搜索引擎上面通过这个文章的想要表达的关键词搜索到,是为了引流而设置的标题,既然是为了SEO优化而作的,标题就不受字数的限制、不受语句通顺的限制、不受文章中心思……【查看全文】
-
原创内容就一定是优质内容吗?
原创内容就一定是优质内容吗?这个话题对博主或一些站长圈内的朋友来说,是一个老生常谈且百谈不厌的话题。随着搜索引擎算法不断的迭代更新、越来越智能化,对于优质内容的判断标准也是在不同阶段有不同的要求。现在很多站长或SEO人员一味的为了创造内容而创造内容,但又有多……【查看全文】
-
数据库性能优化的方法
一个数据库系统的生命周期可以分成:设计、开发和成品三个阶段,在设计阶段进行数据库性能优化的成本最低,收益最大,在成品阶段进行数据库性能优化的成本最高,收益最小。一个系统的性能的提高,不单单是试运行或者维护阶段的性能调优,也不单单是开发阶段的事情,而是……【查看全文】
-
怎样使用网站热点图优化网页布局设计?
优秀网站都是通过细节性进行调整,在保持整体网站风格和样式,通过细微的差别体现出与众不同的方式,在网站结合热点图整合创意和设计,让网站跟访客形成良好的互动效果。有了热力图的科学依据,优化网页细节就可对症下药,避免了主观臆想和盲目改版,在点击行为集中和访……【查看全文】
-
百度收录网站文章的现状及原则依据
对于站长或SEO优化人员来说,如果给一个老站做关键词,只需要我们发一些高质量文章和一些外链就能带来很好的排名,网站前期的优化已经有人帮我们做完了。可如果我们做的是新站排名就十分困难,在我们设定好网站三大标签,设定好网站发展方向之后,首先就需要百度能收录网站的……【查看全文】
-
多年的老网站突然不收录的原因是什么?
网站文章不收录是每一个站长都遇到过的问题之一,比如网站突然无缘无故就不收录了,或者是一些网站文章根本就不被收录。对于文章的不收录,我们首先要分为两种况,一种是新站,网站文章一直不收录;另一种是老站,突然之间网站停止了收录。如果你的网站也是老站,突然碰……【查看全文】
-
新手站长该如何做网站结构优化
一个好的网站架构,才能承担起SEO的排名,我们不仅要让用户对我们网站感兴趣,我们还需要让搜索引擎蜘蛛感兴趣,只有让搜索引擎蜘蛛感兴趣,才能经常来光顾我们的站点,才能收录我们的网站,这样我们的网站才能增强曝光率,合理的网站栏目结构,能正确表达网站的基本内容及其……【查看全文】
-
网站内部链接的策略规划
当站长们都在讨论外链的时候,很少有人注意到内链的作用,内链就是网站的内部的相互链接,我认为内链的最主要的作用在于提高搜索引擎索引效率和用户体验,增加PV,除此之外,由于是自己的网站,内链容易控制,有助于PR的传递推动网站排名,对于知名站点的SEO而言主要精……【查看全文】
-
新网站该如何打造用户喜欢的内容
其实优质的网站内容,一定要站在用户的角度去思索,任何一个网站我们面对的真正客户就是活生生的实体他是人,如果你将文章针对搜索引擎,就意味着把人当机器了,这样你肯定写不出优质的文章,你的网站权重和排名肯定是在一个点上不断的徘徊,所以,发布用户喜欢的内容应……【查看全文】
分类目录
互联网更多>>
- 如何收集和存储服务器运营的数据 随着数据的逐步完善和开放,互联网和企业都将建立起完善的大数据服务基础架构及商业化模式,从数据的存储、挖……
- 盘点2010年代这10年的重大网络安全事件 二十一世纪的第2个十年即将过去,在过去十年里有很多的重大网络安全事件发生,我们见证了过去十年,大量的数据……
- 移动互联网的后时代是小程序互联网吗? 中国移动互联网经历过去 10 年发展,近乎完美地将十亿计用户使用习惯培养起来,尤其是消费互联网,更是被开垦成……
SEO优化 更多>>
-
网站点击率对关键词排名到底有没有
网站的总流量对排名并没有太大的直接影响,但…… -
淘宝客该如何做推广?
“淘宝客”是指帮助淘宝卖家推广商品赚取佣金…… -
快速收录上线公告
今天,百度搜索发布了一条最新公告,声称由于…… -
百度贴吧发帖的方法技巧
百度贴吧的引流效果毋庸置疑,这里的流量大的…… -
Google搜索质量小组专业解答的25个SE
2013年对于众多站长和SEO可以说是最为波折的一年…… -
如何正确设置多样性的404页面?
404页面 就是当用户输入了错误的链接时,返回的…… -
实例解析丰富网页摘要的三大标记格
丰富网页摘要英文名称为Rich Snippets,通俗的来讲…… -
医院网络部该如何开展网络营销推广
医疗行业的网络部是承担医院的网络营销和对外……