来自「正义」程序员的反击之 star 净网行动

来自「正义」程序员的反击之 star 净网行动

导语:这是来自我们「正义」程序员的反击,正义可能会迟到,但是从来不会缺席。

我记得从7月2号,我在公众号上写了一篇文章

《中国内地 GitHub 造假呈指数级增长,其背后是……》

爆料了 GitHub 上刷 star 的乱象,淘宝上竟然有公开代刷 star 和 fork 的,竟然明码标价,再到 8 月 25 号我写的文章

《GitHub 被国人玩出新高度,这是耻辱啊!》

,上面竟然发现 GitHub 账号可以被交易,简直刷新了我们的认知和新高度,GitHub 注册日期越早越贵。虽然我在这两篇文章上对此行为进行了强烈的抨击,不仅仅是造假,更严重的问题是破坏了 GitHub 上的生态,以后真正好的开源库和开源项目就很难分辨了。

但是,就在9月3号一篇文章《石锤 github 买 star 行为》火了,引起了大家的强烈讨论和反应。文章中有理有据的对此行为进行了抨击。但是这可能还不够吧!

就在今天我浏览掘金社区的时候,竟然发现有人做了一个开源项目,并写了一篇文章,叫:《GitHub 虚假 Star 净网行动》,作者是杨萧玉。那我们就一起来看看这个开源项目的作者是如何利用技术来实现净网行动的?

该开源项目的作者在文章中写道:

这条黑产背后到底隐藏着什么?GitHub 上还有哪些大笨蛋也曾靠买 Star 蒙蔽了大神们的双眼呢?我写了个简单的程序用于挖掘基于 Star 的关系链,并进行聚类分析。然后从 CocoaDebug 这个 repo 入手,沿着关系链一层层深挖下去。

所以作者,就有了净网行动的思路,大致如下:

来自「正义」程序员的反击之 star 净网行动

利用的技术栈就是:python3 + GraphQL。大致内容如下:

来自「正义」程序员的反击之 star 净网行动

说简单点就是作者用 Python 爬虫技术,递归访问每个用户的 repo 库的情况,进行数据分析及用户关注情况,来作出判断,是否有刷 star 和 fork 数的行为。

当然,是利用技术和数据进行分析,也会有分析错的地方,所以结果并不一定非常准确,仅供参考,存在一定的误判。

通过这个作者在文中的描述,可以知道,改开源项目的作者利用的技术都是现学现卖,应该是刚刚学习了该项技术,在这里仅仅是做实验,拿出来分享罢了。

看到这里我不禁感慨,看看人家这位开源作者,再看看那些刷量,刷 star 的人,人家在学完技术的时候,利用技术做一些开源项目分享给大家,去净网逮你们,而你们呢?培训完编程,就知道去刷量,为什么不实实在在的做个项目去提高自己呢?扎扎实实的提高技术才是真本事。

作为程序员就应该好好学习技术,利用技术,使用技术,技术本身就是单纯的,程序员更单纯。不要去做那些偷鸡摸狗祸害程序员形象的行为。

最后,该开源项目的地址是:https://github.com/yulingtianxia/FuckFakeGitHubStars

而作者博客文章《GitHub 虚假 Star 净网行动》的地址是:http://yulingtianxia.com/blog/2018/09/16/Fuck-Fake-GitHub-Stars/

关于该开项目的具体介绍和使用情况,请看原作者的博客文章。