• 授权协议:Apache
  • 开发厂商:-
  • 软件语言:Google Go
  • 更新日期:2017-03-27
ProxyPool

代理获取接口,目前有6个免费代理源,每调用一次就会抓取这个6个网站最新的100个代理放入Channel,可自行添加额外的代理获取接口;临时存放采集来的代理,通过访问稳定的网站去验证代理的有效性,有效则并存入数据库;用定时的计划任务去检测数据库中代理IP的可用性,删除不可用的代理。代理池的访问接口,提供get接口输出JSON,方便爬虫直接使用。数据库相关代码,数据库采用Mongo;定时任务,目前在main.go中以轮询方式实现,后期会改进;

ProxyPool Golang 实现的 IP 代理池 项目简介

采集免费的代理资源为爬虫提供有效的代理1、代理池设计代理池由四部分组成:Getter:代理获取接口,目前有6个免费代理源,每调用一次就会抓取这个6个网站最新的100个代理放入Channel,可自行添加额外的代理获取接口;Channel:临时存放采集来的代理,通过访问稳定的网站去验证代理的有效性,有效则并存入数据库;Schedule:用定时的计划任务去检测数据库中代理IP的可用性,删除不可用的代理。同时也会主动通过Getter去获取最新代理;Api:代理池的访问接口,提供get接口输出JSON,方便爬虫直接使用。2、代码实现Api:api接口相关代码,提供get接口,输出JSON;Storage:数据库相关代码,数据库采用Mongo;Getter:代理获取的相关代码,目前抓取:快代理、代理66、IP181、有代理、西刺代理、guobanjia这个六个网站的免费代理,经测试这些网站每天更新的可用代理只有六七十个,当然也支持自己扩展代理接口;Schedule:定时任务,目前在main.go中以轮询方式实现,后期会改进;Util:存放一些公共的模块、方法或函数,包含Config:读取配置文件config.json;其他文件:配置文件:config.json,数据库配置和代理获取接口配置;{
    "mongo": {
        "addr": "mongodb://127.0.0.1:27017/",
        "db": "temp",
        "table": "pool",
        "event": "event"
    },
    "host": ":8080"
}3、安装及使用下载代码:go get -u github.com/henson/ProxyPool配置好相应的config.json并启动:go build

./ProxyPool使用:访问:http://localhost:8080/v1/ip

ProxyPool Golang 实现的 IP 代理池 评论内容