可以抛弃 Python?Google 开源 Swift for TensorFlow 意味什么
Google开源Swift for TensorFlow无疑是对热衷于喜爱Swift编程语言的开发者的一种特殊福利。这也不由得让我更加钦佩Swift之父Chris Lattner此举的伟大。
此前,Lattner在苹果领导开发的Swift不仅速度快,可用性高,在开发者群体中极受欢迎,随后,在Tesla短暂停留的六个月之后,Lattner于2017年8月选择加盟Google Brain,专攻机器学习和人工智能,目前来看,Swift for TensorFlow应该其加入Google之后的第一个大动作。
上个月底,在TensorFlow举办的开发者峰会上,Google重磅发布了许多产品。除了TensorFlow.js的发布之外,还有一个就是宣布了即将开源的Swift for TensorFlow。昨日,Google的承诺如期兑现,也再次将人工智能和深度学习相关项目研发的从业者对TensorFlow的喜爱推向高潮。据了解,Swift for TensorFlow在GitHub上开源,链接为:https://github.com/tensorflow/swift。
可以说截止目前,TensorFlow已经满足了包括Python、Java、Swift、Go、C等多种编程语言的支持。
据TensorFlow官方介绍,
“Swift for TensorFlow 为 TensorFlow 提供了一种新的编程模型,将 TensorFlow 计算图与 Eager Execution 的灵活性和表达能力结合在了一起,同时还注重提高整个软件架构每一层的可用性。
此外,TensorFlow还编写了一些文档,其中详细介绍了其理论和实现,存放在README 文件中,链接:https://github.com/tensorflow/swift/blob/master/README.md。
第一个必读文档是“Swift for TensorFlow 设计总览”,这里介绍了项目的主要组成部分以及结合方式。
另外,TensorFlow还详细介绍项目的几个重要领域,通过“Graph Program Extraction”的算法,可以让开发者用 Eager Execution 式的编程模型来实现代码,同时保留 TensorFlow 计算图的高性能优势。并且,这个项目还允许开发者直接通过Swift代码任意使用Python API。
当然,TensorFlow官方还提到,之所以选择Swift作为主语言,目的在于“实现可靠的 Graph Program Extraction 算法对于编程语言的设计有很高的要求”。
总的来讲,自从Tensorflow开源之后,其提供的API对搭建神经网络有着足够的自由度,很大程度上为开发者们搭建和实现功能解决了后顾之忧,但另一方面,鉴于使用TensorFlow的基本模型,Python作为数据科学家专用的最舒适的语言,与TensorFlow也是一个很自然的契合。甚至连fast.ai创始人、前任Kaggle总裁Jeremy Howard在看到此次项目之后曾在Twitter上评论:“我们是不是终于可以放下Python了?”
Jeremy Howard在Twitter上的回复
此前,TensorFlow官方曾给出一个特别的提示:“现在使用Swift for TensorFlow重写你的深度学习模型还为时尚早。”
那么,我们何时需要开始真得需要并投入到Swift中来呢?
近期,来自Fritz.ai联合创始人兼CEO Jameson Toole发表一篇标题为《为什么数据科学家应该开始开始学习Swift》(Why data scientists should start learning Swift),其中,他谈到了Swift for Tensorflow以及机器学习发展的未来。
他表示,不要将Swift视为TensorFlow的简单包装,以便其更易于在iOS设备上使用。其意义远不止如此。该项目改变的将是整个机器学习和数据科学生态系统使用的默认工具。
为什么这么讲呢?
他继续谈到:
“在此背景之下,可以看到两种趋势正慢慢渗透:一个是通过神经网络和深度学习掀起的人工智能复兴;一个是向数十亿智能手机和物联网设备上运行的移动为先应用的转变。这两种技术都需要高性能计算能力,这种情况下Python就显得尤为不适了。
一方面,深度学习在算力上非常昂贵,需要通过张量运算的长链传递巨大的数据集。为了快速执行这些计算,软件必须将数以千计的线条和内核与专用处理器进行编译。在移动设备的功耗和热量被得以真正关注的情况下,这些问题开始加剧了。相对来讲,以更少的内存换来更为高效的处理器以优化应用,这都是一个不小的挑战。显然,迄今为止,Python依然不再是一个很好的解决方案。
而对数据科学家和机器学习研究人员来讲,这就是很大的问题。因为,我们不再诉诸于让GPU承受大量工作负载,但多数人又深陷移动应用开发的泥潭,再耗费时间学习一门新的编程语言似乎不太现实,但这种转换成本实在太高了。例如Node.js这样的JavaScript项目和React Native这样的跨平台抽象工具。现在,我很难在Python的环境下完成项目。
在由机器学习和边缘计算主导的世界中,Python无法成为端到端语言,主要还是因为Swift for TensorFlow的推动。Chris Lattner认为,Python作为一种动态型语言,无法带领我们走得更远。用他的话来讲,工程师需要一种把机器学习当做‘一等公民’的编程语言。当然,虽然他深刻阐述了为什么采用新的编译分析与改变利用TensorFlow搭建项目的方式息息相关,但是他最为引人瞩目的还对编程过程的理解。”
Chris Lattner提出了构建机器学习系统的一种新的方式
Jameson Toole做出构想,任何一种能够方便机器学习的编程语言所具有的特征:
可读、高效语法
脚本功能
类似于Notebook界面
大型、活跃的社区可构建第三方机构
从TPU到移动芯片等专业硬件,可提供干净、自动化的编码方式
移动设备上的本机执行
性能更接近于C
写到最后,Jameson Toole还表示:Lattner和他的团队正在用Swift for TensorFlow一一核实这些特性。首先,其语法几乎与Python一模一样。有一个用于脚本和笔记本的编译器。最重要的是,它们能通过运行任意Python代码来帮助迁移,而且由于Swift现在是iOS应用开发的默认选项,因此部署到移动端非常容易。Swift的开放源代码编译器和静态类型使得定位特定AI芯片组成为可能。