allwiki首页  
天下维客 你可以修改的网络知识库
首页最近更改优秀条目专题展示电脑科技词典软件学习网络知识电脑安全明星时尚天下百科
 

Indy Library

天下维客,你可以修改的网络知识库

Jump to: navigation, search

Indy Library最初是一个关于网络操作的开源程序库,可在 http://www.nevrona.com/Indyhttp://indy.torry.net 找到。这个程序库被Borland Delphi 6、 7、 C++Builder 6,以及所有 Kylix 版本所引用。

不幸的是,这个程序库被强制破解(hi-jacked)并被滥用于一些中国的spam bots中。近期所见使用“Indy Library”字串作为User Agent信息的访问,大多是这些中国“原创作品”。

是开源项目Indy的一部分,是关于网络操作的一个程序库。

爬虫信息

  • 爬虫名称: Indy Library
  • HTTP User Agent:
Mozilla/3.0 (compatible; Indy Library)
  • 抓取强度: 不一定,很多服务器上较少出现,但也有部分服务器被大量访问
  • 搜索引擎推广效果:无!
  • 来访IP:无规律,很杂乱

对Indy Library爬虫进行控制

Indy Library只是一个程序库,很多使用它的用户并不遵循robots.txt抓取规范,可能抓取你服务器上声明禁止访问的内容!。如果此类爬虫对您的服务器造成困扰,您可以:

参考资料

官方网站
http://www.indyproject.org/ 关于Indy Library项目的官方信息
相关条目
搜索引擎收录 - 网站登录 - SiteMaps - 网站推广
网络爬虫 - 搜索引擎爬虫程序一览表
robots.txt(爬虫屏蔽规范) - Meta robots标签nofollow/noindex) - nocontent
外部链接
关于Indy Library的恶意使用 http://www.flarp.net/misc/indylib.php
★★★★★捕获恶意bot,以及Indy Library的信息 http://www.kloth.net/internet/bottrap.php
常见爬虫的特性 GoogleBot Mediapartners Yahoo! Slurp Yahoo! Slurp China YodaoBot
爬虫程序 ia_archiver iask iearthworm DigExt Indy Library
网络爬虫的名称 爬虫程序的屏蔽 .htaccess robots.txt 更多爬虫
Personal tools
工具