今天发现如此无耻的哪吒网,除了公布他的恶行让大家小心外,还得解决这个问题,要解决这个问题,就需要解决哪吒网的访问,解决过程和方法如下:
- 整理拒绝无耻的哪吒网访问的方法
想了一下,最终选择屏蔽该网站访问的IP的方法,这样的方法实现起来简单,效果好 - 提取IIS日志
所有通过IIS访问的记录都会被IIS记录下来,可以从日志中获取第一手的访问记录 - 分析IIS日志
通过分析哪吒网的形式,应该是访问feed文件,聚友博客的feed文件是rss.xml,就查找该文件的访问记录 - 排除法获得哪吒网的IP
通过客户端信息,排除了Feedfetcher-Google、msnbot、Technoratibot、YoudaoBot-Reader等客户端,排除后就剩下非常有限的几个IP了 - 根据访问时间确定IP
以上午发布的内容在哪吒网上显示的时间为基点,哪吒网上最后一个显示的是9点36分,那就查找9点20分到9点36分之间一点点的访问记录,该时间段只有一个IP访问了rss.xml,基本确定 - 初次验证
拿这个IP查询一下地区,来自浙江金华,再看一下哪吒网主站的IP,也是浙江金华,基本可以肯定就是这个IP了 - 最终验证
通过技术手段屏蔽了该ip,再到博客发了一篇文章,过了好久,再看哪吒网,还是没有更新,由此可以确定这个IP就是哪吒网的IP - 公布IP
60.191.222.218
广大站长可以通过禁止这个IP访问来达到禁止哪吒网非常建立镜像的问题。该IP可能随时变动,到时候再根据这样的方法屏蔽他,让这样的无耻网站没有来源。
<meta name="description" content="内容聚合">
对搜索引擎来说,哪吒仍然是原创,我等仍然是镜像(虽然我的PR也有4)。
哪吒即使取消了nofollow,仍然是寄生虫,访客从搜索引擎过来不大可能进行二次点击到达原站。