学会像一个函数式程序员那样思考
你可能联想到了用函数式编程来代替故事中的电锯。但是问题在于函数式编程是一种全新的编程模式,而不是一门新的语言,语法只是一个细节问题。而最不同的地方是要如何以不同的方式去思考。而我作为一名“电锯演示者”和一个函数式程序员来到了这里。
欢迎来到函数式思维专栏。这个系列将探索函数式编程的话题,但是并不仅仅局限在函数式编程语言有关的内容上。正如我描绘的那样,以函数式的方法来写代码涉及到了设计,权衡,代码重用和其他一系列的观点。我会尝试着以Java(或是类Java语言)的方式尽可能多的展示函数式编程的概念, 进而演示一些其他语言的能力-那些Java不具有的能力。当然我不会直接切入的非常深,然后讨论一些时髦的事物。取而代之的是,我会逐渐演示一种新的思考问题的方式(或许你已经在某些地方用了,但还没有意识到)。
在接下来的两部分里,你可以把它当作是有关于函数式编程话题的一个旅行。其中的某些概念将会有大量的细节,在这个系列中我会用更多的情景和细节去描述。在旅程开始前,我将带你看一下一个相同问题的两个不同实现,一个用传统的方式来写,另一个使用更多的函数式方式。
数字归类
谈论两种不同的编程模式,你必须用代码来做比较。第一个例子是我另一本书《The Productive Programmer》和《测试驱动设计1,2》两篇文章中的一个变体。我选取了少量的代码,因为在这两篇文章里已经深入的分析了这段代码。这些文章对这个设计所做的称赞并没有错,但我想在这里进一步提供一个不同的设计意图。
问题的需求是这样的:假设给定任意一个正整数都大于1,你必须按照完美的,过剩的和不足的进行归类。一个完美数正好是它所有整除因子的总和。同样地,一个过剩数的所有整除因子总和大于该数,而一个不足数的所有整除因子总和小于该数。
快速数字归类器
列表1中的类(NumberClassifier)满足所有这些需求:
public class Classifier6 { private Set<Integer> _factors; private int _number; public Classifier6(int number) { if (number < 1) throw new InvalidNumberException("Can't classify negative numbers"); _number = number; _factors = new HashSet<Integer>>(); _factors.add(1); _factors.add(_number); } private boolean isFactor(int factor) { return _number % factor == 0; } public Set<Integer> getFactors() { return _factors; } private void calculateFactors() { for (int i = 1; i <= sqrt(_number) + 1; i++) if (isFactor(i)) addFactor(i); } private void addFactor(int factor) { _factors.add(factor); _factors.add(_number / factor); } private int sumOfFactors() { calculateFactors(); int sum = 0; for (int i : _factors) sum += i; return sum; } public boolean isPerfect() { return sumOfFactors() - _number == _number; } public boolean isAbundant() { return sumOfFactors() - _number > _number; } public boolean isDeficient() { return sumOfFactors() - _number < _number; } public static boolean isPerfect(int number) { return new Classifier6(number).isPerfect(); } }
这段代码有几处地方需要关注一下:
它拥有大范围的测试(有一部分我是为了讨论测试驱动开发而写的)注:这条所说的测试位于作者另一篇文章中。
这个类由大量的紧耦合方法组成,在它的构造函数中拥有测试驱动开发的边际效应。
在calculateFactors()方法里内嵌了性能优化算法。这个类的主体是由采集因子组成,因此我可以在之后对它们进行求和并进行最终的归类。整除因子总是以成对的形式被获取。例如,如果这个数是16,当我采集的因子为2时,我就能得到另一个因子为8,因为8x2=16。如果我获得的因子是成对的,那么我只需要去检查那些有平方根的数,这就是calculateFactors()方法所做的事情。
更多的功能归类
使用相同的测试开发技术,我创建了一个修改后的版本。列表2,更丰富的功能数字归类器
public class NumberClassifier { static public boolean isFactor(int number, int potential_factor) { return number % potential_factor == 0; } static public Set<Integer> factors(int number) { HashSet<Integer> factors = new HashSet<Integer>(); for (int i = 1; i <= sqrt(number); i++) if (isFactor(number, i)) { factors.add(i); factors.add(number / i); } return factors; } static public int sum(Set<Integer> factors) { Iterator it = factors.iterator(); int sum = 0; while (it.hasNext()) sum += (Integer) it.next(); return sum; } static public boolean isPerfect(int number) { return sum(factors(number)) - number == number; } static public boolean isAbundant(int number) { return sum(factors(number)) - number > number; } static public boolean isDeficient(int number) { return sum(factors(number)) - number < number; } }
这两个版本的类尽管差别细微但是很重要。最主要的区别是例2的版本缺少了状态共享。消除状态共享在函数式编程中是比较受欢迎的一种抽象手法。作为跨方法共享状态的替代方案,我采用直接调用的方式来消除状态共享。从设计的角度来说,它让factors()方法变的更长,但是它也防止了factors字段暴漏到方法之外。注意,例2是完全由静态方法组成的。在方法间不存在知识共享的问题,因此我可以在更少函数范围上做封装。一旦你给它们输入参数和期待值,这些方法都会工作的很好(这个是一个纯函数例子,这个概念我在将来会进一步探索它)。
函数
函数式编程属于一个宽泛的计算机科学范畴,它已经受到了极大的关注。有新的基于JVM上开发的函数式语言(如scala和clojure)和框架(如Functional Java和Akka),它们都声称能够带来更少的缺陷,更高的生产力,更易读,更赚钱等等。相比驻足门外的去解决函数式编程这一大话题,我更愿意将注意力放在一些概念以及这些概念衍生出来的话题上。
函数式编程的核心就是函数, 正如在面向对象语言里面类是主要的抽象那样。函数形成了处理过程的基础,同时它具有其他传统语言没有的一系列特性。
高阶函数
高阶函数可以将其他函数作为参数或者作为返回结果。这在Java语言中是无法想像的。最接近的方案是你使用一个类(通常是匿名类)作为执行方法的“持有者”。Java没有独立的函数(或方法),因此它们不能作为返回值或参数出现。
这个能力对函数式语言来说很重要的原因有两点:第一,拥有高阶函数就意为着你可以在如何连结语言元素上作出一个假设。例如,你可以构建一个机制来消除一个类继承体系上的一大堆方法,通过遍历列表并对每一个元素应用一个(或多个)高阶函数来实现。(我将展示一个简短的例子给你)第二,通过将函数作为返回值,你有机会去创建一个高动态,适应性的系统。
通过使用高阶函数我们就可以使问题服从于方案,但高阶函数对函数式语言来说并不是唯一的。因此,当你在使用函数式思维的时候, 你解决问题思路就会不一样。考虑一下列表3中的例子,一个保护数据访问的方法:
public void addOrderFrom(ShoppingCart cart, String userName, Order order) throws Exception { setupDataInfrastructure(); try { add(order, userKeyBasedOn(userName)); addLineItemsFrom(cart, order.getOrderKey()); completeTransaction(); } catch (Exception condition) { rollbackTransaction(); throw condition; } finally { cleanUp(); } }
列表3中的代码执行初始化等具体任务,如果所有操作都成功就完成事务,反之回滚,并在最后清理掉资源。很明显,代码有一部分可以被重用,并且我们在面向对象语言中也常常创建这样的结构。在这个例子中,我组合使用了两个“四人团”的设计模式:模版方法和命令模式。模版方法建议我应该移动一些通用的模版代码到继承体系中,并推迟算法细节到子类。命令行模式提供了一个方法以众所周知的执行语义来封装行为到类,列表4就是列表3代码应用这两个模式之后的样子:
列表4 重构顺序后的代码
public void wrapInTransaction(Command c) throws Exception { setupDataInfrastructure(); try { c.execute(); completeTransaction(); } catch (Exception condition) { rollbackTransaction(); throw condition; } finally { cleanUp(); } } public void addOrderFrom(final ShoppingCart cart, final String userName, final Order order) throws Exception { wrapInTransaction(new Command() { public void execute() { add(order, userKeyBasedOn(userName)); addLineItemsFrom(cart, order.getOrderKey()); } }); }
在列表4中,我提取了一部分通用的代码到wrapInTransaction()(这个样式你可能认识-这是最简单的Spring事务模版的版本)方法中,传递一个命令对象作为工作单元。addOrderFrom()方法包含了一个匿名内部类的创建,这个类以命令模式封装了两个工作单元。
封装行为纯粹是Java的设计产物,我需要用到一个不包含任何形式的,独立行为的命令类。Java中所有的行为都必须驻留在一个类中。甚至语言的设计者很早的就看到了这个不足,但是显然在发布后再去考虑不将行为联接到类上就有些晚了。因此在JDK1.1中纠正了这个缺陷,通过添加匿名内部类的方式来实现。这只是以一种语法糖的方式来为少量的方法创建一大堆小类,这样做仅仅是从纯功能角度出发,而非从结构上。如果想看有关Java这方面有趣的文章,请看Steve Yegge’s的《Execution in the Kingdom of Nouns》。
尽管我非常想要类里面的这个方法,但Java还是强制我去创建一个命令类的实例。这个类本身没有任何用处:它没有字段,没有构造器(这个由java自动生成),并且也没有状态。它纯粹的目的就是为了在方法里包装行为。在函数式语言里,我们通过高阶函数来取代这个模式。
如果我不准备用Java的类,那么我可能采用最接近的语义是函数式编程里面的闭包。列表5显示了重构后的例子,但是使用Groovy代替了Java。
列表5, 使用Groovy的闭包代替命令类
def wrapInTransaction(command) { setupDataInfrastructure() try { command() completeTransaction() } catch (Exception ex) { rollbackTransaction() throw ex } finally { cleanUp() } } def addOrderFrom(cart, userName, order) { wrapInTransaction { add order, userKeyBasedOn(userName) addLineItemsFrom cart, order.getOrderKey() } }
在Groovy里面,任何位于大括号{}之间的东西都是一个代码块,并且代码块可以被当作参数来模仿一个高阶函数。在这种情景下,Groovy为你实现了命令模式。Groovy中的每一个闭包块就是一个Groovy的闭包类型,它包含一个call()方法。当你把一对空括号放到变量后面用于保存闭包实例时,该方法会被自动调用。Groovy启用了一些类函数式编程的行为,通过在语言本身使用相应的语法糖来构建适当的数据结构。正如我将会逐步展示的那样,Groovy也包含其他函数式语言的能力。我将在下面的部分继续对闭包和高阶函数做一些有意思的比较。
第一级函数
函数被认为是函数式语言里面的一等公民,这就意味着函数可以出现在任何地方,正如其他语言的构造体(如变量)那样。在思考不同解决方案的时候,第一级函数的存在允许函数以一种特别的方式来使用,如应用同样的比较操作到相同的数据结构上。这就体现了函数式语言的一个基本思考原则:关注结果,而不是过程。
在命令式的编程语言里,我必须考虑算法的每一个原子操作。如列表1的代码显示的那样。为了实现数字归类器,我不得不精确的识别如何去采集整除因子,这就意为着为了确定一个因子,我不得不写代码去遍历所有数字。但是像遍历列表,然后对每一个元素实施操作,这听起来像是很通用的东西。考虑使用Functional Java框架来重新实现数字归类器的代码,代码如列表6所示:
列表6. 函数式的数字归类器
public class FNumberClassifier { public boolean isFactor(int number, int potential_factor) { return number % potential_factor == 0; } public List<Integer> factors(final int number) { return range(1, number+1).filter(new F<Integer, Boolean>() { public Boolean f(final Integer i) { return number % i == 0; } }); } public int sum(List<Integer> factors) { return factors.foldLeft(fj.function.Integers.add, 0); } public boolean isPerfect(int number) { return sum(factors(number)) - number == number; } public boolean isAbundant(int number) { return sum(factors(number)) - number > number; } public boolean isDeficiend(int number) { return sum(factors(number)) - number < number; } }
列表6和列表2的不同在于两个方法:sum()和factors()。在Functional Java里, Sum()方法具有List类的foldLeft()方法优势。列表操作概念上的一个具体变化就是被称之为catamorphism,它是列表折叠上的一般化。在这里“向左折叠”的意思是:
1.携带一个初始值并组合它到列表的第一个元素上
2.携带结果并应用相同的操作到下一个元素上
3.一直操作直到列表结束
注意当你对一堆数求和的时候,所做的事情是非常明显的:从零开始,加上第一关元素,携带结果去加第二个,重复这个过程直到所有列表的元素都被处理。Functional Java提供高阶函数(在这个例子里就是Intergers.add枚举器)并小心翼翼的为你的代码启用它。(当然Java真的没有高阶函数,但是你可以通过限制具体的数据结构和类型来写一个较类似的东西)。
在列表6里面另一奇妙的方法是factors(),它充分说明了我关于“关注结果,而不是过程”的建议。发现一个数的整除因子这个问题的本质是什么?换个方式来说,给出一个到目标数的所有可能数的列表。那么我该如何确定哪个数是这个数的整除因子?这里的建议是进行一次过滤操作 – 我能过滤整个列表,消除那些不符合我标准的数。这个方法基本上就如同以下描述:取得1到这个数的范围;用f()方法来过滤这个列表,Functional Java的方式将允许你创建一个具有特殊数据类型的类,并返回结果。
这段代码同时也描绘了一个更大的概念,一个编程语言的趋势。回到过去,开发人员不得不处理一大堆烦人的东西,如内存分配,垃圾回收和指针。随着时间的推移,语言本身背负起了更多这方面的职责。就像计算机越来越强大一样,我们把越来越多的现实任务丢给了语言和运行时。作为一名Java开发者,我比较倾向于把所有的内存问题都交给语言处理。函数式编程扩大了这个需求,并包含了更多的细节。随着时间的推移,我们将花费更少的时间去关心每一个步要解决的问题和思考的过程。随着本系列的进展,我将展示更多相关的例子。
结论