标星 1700+ 的链家网全国房源爬虫工具,这是你节省房租的好工具
之前介绍过一个买房相关的项目:
程序员用 GitHub 分享买房指南
上边这个项目是作者的亲身体验,跑了不少盘,总结了很多经验,写的可以说是面面俱到。
但在信息飞速更新的今天,跑盘能获取的信息可能有些滞后,这就需要发挥我们程序员的优势了。
今天推荐的这个项目是:lianjia-scrawler,是一个链家网全国房源爬虫工具,不仅可以爬取链家二手房、租房在线数据,存量房交易服务平台数据,还可以爬取我爱我家成交房源库。
该项目的实现和相关说明如下:
- 该项目数据存储目前支持 Mysql、Sqlite 和 Postgres,非常方便转化成 csv 等格式文件。
- 利用 Python Pandas (source code) 分析链家在线房源数据,本项目提供了一个例子可以参考。
- 由于链家的反爬虫机制,所以该项目限制了爬虫速度。
- 此代码仅供学习与交流,请勿用于商业用途,后果自负。
下图为利用爬虫数据做的可视化分析网站,但由于怕引起法律问题,不公开网站地址,感兴趣可私下与作者交流。
买房、租房前,别急着去跑盘,先看看数据,数据往往更具有说服力。
开源项目地址:https://github.com/XuefengHuang/lianjia-scrawler
开源项目作者:Xuefeng
推荐阅读:
标星13k的动画视频引擎,到底有多牛,屌爆了
GitHub 上周排行精选
牛逼,送大家一个网络共享的必备梯子,你懂得
今天的推荐不知道大家喜欢吗?如果你喜欢,请在文章底部留言和点赞,以表示对我的支持,你们的留言、点赞和转发关注是我持续更新的动力哦!