allwiki首页  
天下维客 你可以修改的网络知识库
首页最近更改优秀条目专题展示电脑科技词典软件学习网络知识电脑安全明星时尚天下百科
 

Twiceler

天下维客,你可以修改的网络知识库

Jump to: navigation, search

twiceler是一个爬虫程序,据说是美国斯坦福大学研究搜索引擎的一个学生项目。

爬虫信息

  • 爬虫名称:Twiceler
  • HTTP User Agent:
Mozilla/5.0 (Twiceler-0.9 <a href="http://www.cuill.com/twiceler/robot.html" class="external free" target="_blank" title="http://www.cuill.com/twiceler/robot.html" rel="nofollow">http://www.cuill.com/twiceler/robot.html</a>)
  • 抓取强度:高
  • 推广效果:未知
  • 来访IP:38.99.13.122 64.1.215.164 (均为美国IP

禁止twiceler访问

twiceler是一个中低强度的爬虫,遵循robots.txt爬行标准。如果你觉得它占用了服务器资源,可以屏蔽这个爬虫。方法为在服务器上的网站根目录建立robots.txt,包含以下内容:

User-agent: twiceler
Disallow: / 

上面在全站之内禁止twiceler爬行。或者禁止爬行某个目录:

User-agent: twiceler
Disallow: /somedir/

相关资料

官方页面
http://www.cuill.com/twiceler/robot.html
相关条目
网络爬虫 - 搜索引擎爬虫程序一览表 - robots.txt(爬虫屏蔽规范)
外部链接
关于twiceler的资料
常见爬虫的特性 GoogleBot Mediapartners Yahoo! Slurp Yahoo! Slurp China YodaoBot
爬虫程序 ia_archiver iask iearthworm DigExt Indy Library
网络爬虫的名称 爬虫程序的屏蔽 .htaccess robots.txt 更多爬虫
Personal tools
工具
金银币拍卖 金币拍卖预展  金银币网店 熊猫金银币 生肖金银币