拒绝哪吒网蜘蛛访问

今天发现如此无耻的哪吒网,除了公布他的恶行让大家小心外,还得解决这个问题,要解决这个问题,就需要解决哪吒网的访问,解决过程和方法如下:

  1. 整理拒绝无耻的哪吒网访问的方法
    想了一下,最终选择屏蔽该网站访问的IP的方法,这样的方法实现起来简单,效果好
  2. 提取IIS日志
    所有通过IIS访问的记录都会被IIS记录下来,可以从日志中获取第一手的访问记录
  3. 分析IIS日志
    通过分析哪吒网的形式,应该是访问feed文件,聚友博客的feed文件是rss.xml,就查找该文件的访问记录
  4. 排除法获得哪吒网的IP
    通过客户端信息,排除了Feedfetcher-Google、msnbot、Technoratibot、YoudaoBot-Reader等客户端,排除后就剩下非常有限的几个IP了
  5. 根据访问时间确定IP
    以上午发布的内容在哪吒网上显示的时间为基点,哪吒网上最后一个显示的是9点36分,那就查找9点20分到9点36分之间一点点的访问记录,该时间段只有一个IP访问了rss.xml,基本确定
  6. 初次验证
    拿这个IP查询一下地区,来自浙江金华,再看一下哪吒网主站的IP,也是浙江金华,基本可以肯定就是这个IP了
  7. 最终验证
    通过技术手段屏蔽了该ip,再到博客发了一篇文章,过了好久,再看哪吒网,还是没有更新,由此可以确定这个IP就是哪吒网的IP
  8. 公布IP
    60.191.222.218

广大站长可以通过禁止这个IP访问来达到禁止哪吒网非常建立镜像的问题。该IP可能随时变动,到时候再根据这样的方法屏蔽他,让这样的无耻网站没有来源。

未经允许不得转载:聚友 » 拒绝哪吒网蜘蛛访问

赞 (0) 打赏

评论 3

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. 花园支持一下
    聚友 于 2009-2-11 21:55:57 回复
    哈哈,谢谢支持
    回复
  2. 哪吒客服上周二发布的哪吒2009新版,已经彻底的解决哪吒网订阅源预览页面之前的存在的问题,希望有时间去看看。
    聚友 于 2009-3-16 7:05:59 回复
    已经在使用的,呵呵
    回复
  3. 布谷鸟哪吒网仍然很无耻,依然在做内容聚合,
    <meta name="description" content="内容聚合">

    对搜索引擎来说,哪吒仍然是原创,我等仍然是镜像(虽然我的PR也有4)。

    哪吒即使取消了nofollow,仍然是寄生虫,访客从搜索引擎过来不大可能进行二次点击到达原站。 回复

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏