为什么我如此迷恋Lisp语言?
本文是从 Why I love Lisp 这篇文章翻译而来。
这篇文章是我在Simplificator——我工作的地方——的一次座谈内容的摘录,座谈的题目叫做“为什么我喜欢Smalltalk语言和Lisp语言”。在此之前,我曾发布过一篇叫做“ 为什么我喜欢Smalltalk?”的文章。
大漠黄沙 by Guilherme Jófili
Lisp是一种很老的语言。非常的老。Lisp有很多变种,但如今已没有一种语言叫Lisp的了。事实上,有多少Lisp程序员,就有多少种Lisp。这是因为,只有当你独自一人深入荒漠,用树枝在黄沙上为自己喜欢的Lisp方言写解释器时,你才成为一名真正的Lisp程序员。
目前主要有两种Lisp语言分支:Common Lisp 和 Scheme,每一种都有无数种的语言实现。各种Common Lisp实现都大同小异,而各种Scheme实现表现各异,有些看起来非常的不同,但它们的基本规则都相同。这两种语言都非常有趣,但我却没有在实际工作中用过其中的任何一种。这两种语言中分别在不同的方面让我苦恼,在所有的Lisp方言中,我最喜欢的是Clojure语言。我不想在这个问题上做更多的讨论,这是个人喜好,说起来很麻烦。
Clojure,就像其它种的Lisp语言一样,有一个REPL(Read Eval Print Loop)环境,你可以在里面写代码,而且能马上得到运行结果。例如:
5 ;=> 5 "Hello world" ;=> "Hello world"
通常,你会看到一个提示符,就像user>,但在本文中,我使用的是更实用的显示风格。这篇文章中的任何REPL代码你都可以直接拷贝到Try Clojure运行。
我们可以像这样调用一个函数:
(println "Hello World") ; Hello World ;=> nil
程序打印出“Hello World”,并返回nil。我知道,这里的括弧看起来好像放错了地方,但这是有原因的,你会发现,他跟Java风格的代码没有多少不同:
println("Hello World")
这种Clojure在执行任何操作时都要用到括弧:
(+ 1 2) ;=> 3
在Clojure中,我们同样能使用向量(vector):
[1 2 3 4] ;=> [1 2 3 4]
还有符号(symbol):
'symbol ;=> symbol
这里要用引号('),因为Symbol跟变量一样,如果不用引号前缀,Clojure会把它变成它的值。list数据类型也一样:
'(li st) ;=> (li st)
以及嵌套的list:
'(l (i s) t) ;=> (l (i s) t)
定义变量和使用变量的方法像这样:
(def hello-world "Hello world") ;=> #'user/hello-world hello-world ;=> "Hello world"
我的讲解会很快,很多细节问题都会忽略掉,有些我讲的东西可能完全是错误的。请原谅,我尽力做到最好。
在Clojure中,创建函数的方法是这样:
(fn [n] (* n 2)) ;=> #<user$eval1$fn__2 user$eval1$fn__2@175bc6c8>
这显示的又长又难看的东西是被编译后的函数被打印出的样子。不要担心,你不会经常看到它们。这是个函数,使用fn操作符创建,有一个参数n。这个参数和2相乘,并当作结果返回。Clojure和其它所有的Lisp语言一样,函数的最后一个表达式产生的值会被当作返回值返回。
如果你查看一个函数如何被调用:
(println "Hello World")
你会发现它的形式是,括弧,函数,参数,反括弧。或者用另一种方式描述,这是一个列表序列,序列的第一位是操作符,其余的都是参数。
让我们来调用这个函数:
((fn [n] (* n 2)) 10) ;=> 20
我在这里所做的是定义了一个匿名函数,并立即应用它。让我们来给这个函数起个名字:
(def twice (fn [n] (* n 2))) ;=> #'user/twice
现在我们通过这个名字来使用它:
(twice 32) ;=> 64
正像你看到的,函数就像其它数据一样被存放到了变量里。因为有些操作会反复使用,我们可以使用简化写法:
(defn twice [n] (* 2 n)) ;=> #'user/twice (twice 32) ;=> 64
我们使用if来给这个函数设定一个最大值:
(defn twice [n] (if (> n 50) 100 (* n 2))))
if操作符有三个参数:断言,当断言是true时将要执行的语句,当断言是 false 时将要执行的语句。也许写成这样更容易理解:
(defn twice [n] (if (> n 50) 100 (* n 2)))
非常基础的东西。让我们来看一下更有趣的东西。
假设说你想把Lisp语句反着写。把操作符放到最后,像这样:
(4 5 +)
我们且把这种语言叫做Psil(反着写的Lisp...我很聪明吧)。很显然,如果你试图执行这条语句,它会报错:
(4 5 +) ;=> java.lang.ClassCastException: java.lang.Integer cannot be cast to clojure.lang.IFn (NO_SOURCE_FILE:0)
Clojure会告诉你4不是一个函数(函数是必须是clojure.lang.IFn接口的实现)。
我们可以写一个简单的函数把Psil转变成Lisp:
(defn psil [exp] (reverse exp))
当我执行它时出现了问题:
(psil (4 5 +)) ;=> java.lang.ClassCastException: java.lang.Integer cannot be cast to clojure.lang.IFn (NO_SOURCE_FILE:0)
很明显,我弄错了一个地方,因为在psil被调用之前,Clojure会先去执行它的参数,也就是(4 5 +),于是报错了。我们可以显式的把这个参数转化成list,像这样:
(psil '(4 5 +)) ;=> (+ 5 4)
这回它就没有被执行,但却反转了。要想运行它并不困难:
(eval (psil '(4 5 +))) ;=> 9
你开始发现Lisp的强大之处了。事实上,Lisp代码就是一堆层层嵌套的列表序列,你可以很容易从这些序列数据中产生可以运行的程序。
如果你还没明白,你可以在你常用的语言中试一下。在数组里放入2个数和一个加号,通过数组来执行这个运算。你最终得到的很可能是一个被连接的字符串,或是其它怪异的结果。
这种编程方式在Lisp是如此的非常的常见,于是Lisp就提供了叫做宏(macro)的可重用的东西来抽象出这种功能。宏是一种函数,它接受未执行的参数,而返回的结果是可执行的Lisp代码。
让我们把psil传化成宏:
(defmacro psil [exp] (reverse exp))
唯一不同之处是我们现在使用defmacro来替换defn。这是一个非常大的改动:
(psil (4 5 +)) ;=> 9
请注意,虽然参数并不是一个有效的Clojure参数,但程序并没有报错。这是因为参数并没有被执行,只有当psil处理它时才被执行。psil把它的参数按数据看待。如果你听说过有人说Lisp里代码就是数据,这就是我们现在在讨论的东西了。数据可以被编辑,产生出其它的程序。这种特征使你可以在Lisp语言上创建出任何你需要的新型语法语言。
在Clojure里有一种操作符叫做macroexpand,它可以使一个宏跳过可执行部分,这样你就能看到是什么样的代码将会被执行:
(macroexpand '(psil (4 5 +))) ;=> (+ 5 4)
你可以把宏看作一个在编译期运行的函数。事实上,在Lisp里,编译期和运行期是杂混在一起的,你的程序可以在这两种状态下来回切换。我们可以让psil宏变的罗嗦些,让我们看看代码是如何运行的,但首先,我要先告诉你do这个东西。
do是一个很简单的操作符,它接受一批语句,依次运行它们,但这些语句是被整体当作一个表达式,例如:
(do (println "Hello") (println "world")) ; Hello ; world ;=> nil
通过使用do,我们可以使宏返回多个表达式,我们能看到更多的东西:
(defmacro psil [exp] (println "compile time") `(do (println "run time") ~(reverse exp)))
新宏会打印出“compile time”,并且返回一个do代码块,这个代码块打印出“run time”,并且反着运行一个表达式。这个反引号`的作用很像引号',但它的独特之处是你可以使用~符号在其内部解除引号。如果你听不明白,不要担心,让我们来运行它一下:
(psil (4 5 +)) ; compile time ; run time ;=> 9
如预期的结果,编译期发生在运行期之前。如果我们使用macroexpand,或得到更清晰的信息:
(macroexpand '(psil (4 5 +))) ; compile time ;=> (do (clojure.core/println "run time") (+ 5 4))
可以看出,编译阶段已经发生,得到的是一个将要打印出“run time”的语句,然后会执行(+ 5 4)。println也被扩展成了它的完整形式,clojure.core/println,不过你可以忽略这个。然后代码在运行期被执行。
这个宏的输出本质上是:
(do (println "run time") (+ 5 4))
而在宏里,它需要被写成这样:
`(do (println "run time") ~(reverse exp))
反引号实际上是产生了一种模板形式的代码,而波浪号让其中的某些部分被执行((reverse exp)),而其余部分被保留。
对于宏,其实还有更令人惊奇的东西,但现在,它已经很能变戏法了。
这种技术的力量还没有被完全展现出来。按着" 为什么我喜欢Smalltalk?"的思路,我们假设Clojure里没有if语法,只有cond语法。也许在这里,这并不是一个太好的例子,但这个例子很简单。
cond 功能跟其它语言里的switch 或 case 很相似:
(cond (= x 0) "It's zero" (= x 1) "It's one" :else "It's something else")
使用 cond,我们可以直接创建出my-if函数:
(defn my-if [predicate if-true if-false] (cond predicate if-true :else if-false))
初看起来似乎好使:
(my-if (= 0 0) "equals" "not-equals") ;=> "equals" (my-if (= 0 1) "equals" "not-equals") ;=> "not-equals"
但有一个问题。你能发现它吗?my-if执行了它所有的参数,所以,如果我们像这样做,它就不能产生预期的结果了:
(my-if (= 0 0) (println "equals") (println "not-equals")) ; equals ; not-equals ;=> nil
把my-if转变成宏:
(defmacro my-if [predicate if-true if-false] `(cond ~predicate ~if-true :else ~if-false))
问题解决了:
(my-if (= 0 0) (println "equals") (println "not-equals")) ; equals ;=> nil
这只是对宏的强大功能的窥豹一斑。一个非常有趣的案例是,当面向对象编程被发明出来后(Lisp的出现先于这概念),Lisp程序员想使用这种技术。