浅析Lua下实现抢占式多线程

dobests

2011-08-29

浅析Lua下实现抢占式多线程是本文要介绍的内容，主要是来学习lua的多线程。Lua 5.2 的开发进度可以回溯到 2010 年 1 月。漫长的流程到今天已经快两年过去，终于等到了 beta 版。我十分期待它可以在 2011 年内正式发布。在这几经折腾的两年里，许多新特性企图挤进 5.2 版，又最终被否决。

当我们审视改进列表，似乎看不到太多耳目一新的东西。但如果仔细阅读一下源代码，就会发现，大部分地方都重新实现过了，以配合这些表面上看起来不大的修改。如果你对 Lua 有足够理解，会发现，这次最激动人心的改进是 "yieldable pcall and metamethods" 。官方也把之列为 Main changes 第一条。语言上的重大新特性 goto 却被列在末尾。

当然，这只是我粗浅的理解而已。没有经过实践使用 5.2 一段时间，下这样的论断有点太草率。不过我还是想谈谈，这点改进可以给我们的开发带来什么。

coroutine 的 yield 现在几乎可以在任何地方使用了。我用了几乎，是因为它依然有一些限制。这些限制不大容易说的很清楚，为了理解其限制，我花了一整天实现阅读 lua 5.2 beta 版的源代码。这个话题下次有机会我再另写一篇 blog 总结一下。今天只谈应用。

我们知道 coroutine 可以实现一个协同多线程模型。即，每个线程(coroutine) 只在用户期望的地方跳出来，并可以在以后跳回去（保持当初跳离的状态）。这解决了许多抢占式多线程的麻烦。lua 的发明人在一篇访谈中谈到了 coroutine 解决并发的问题。

但是，让用户不厌其烦的写 yield 是件很讨厌的事情。往往框架会把 yield 调用藏起来。如果我没记错，我读过的早期的 kepler 框架就是把 yield 藏在 html 的输出里的。能够想到的更漂亮的做法是编写一个 lua debug hook ，在 hook 里调用 yield 。这样就可以让 lua vm 每跑几行 lua byte code 就自动做 yield 一次。

可惜的是，lua 5.1 以前的版本不支持这个。因为 yield 限制太多了。如果恰巧 yield 发生在一次 metamethod 调用内部，或 pcall 内部，就会失败。这和 C/Lua 函数嵌套有关。lua vm 在实现 pcall 及 metamethod 机制时，不断的在 C 函数以及 lua 函数间跳转。

一旦 yield 发生在多层 C 函数与 lua 函数嵌套调用的内部。用 longjmp 返回的 yield 机制，会丢失 C 函数调用的 stack frame 。也就是说，lua vm 本身的状态可以保留在 L 中，但 C 函数的状态却丢失了，无法正确返回。Lua 5.2 为了解决这个问题，引入了新的 api ，有兴趣可以阅读新的文档的 4.7 – Handling Yields in C 。不过真的想全部搞清楚，还是推荐阅读一下源代码。

只使用系统自带的 debug 库是不够的。用 lua 的 debug.sethook 设置一个 lua 函数做 hook ，里面依然不能调用 coroutine.yield 。这还是受到了 lua 实现的限制。正确的方法是直接使用 C api lua_sethook，把这样一个 hook 函数设进去：

static void  


 


hook(lua_State *L, lua_Debug *ar)  


{  


    lua_yield(L,0);  


}

至于你想让它每隔几行 lua 代码 yield 一次，还是让它发生在函数调用的时候，这看你的喜好。但一旦设置成功，一段 lua 代码就可以透明的定期 yield 出来了。

这些有什么用？我设想了两种用法，

一、是用 lua 做一个调度器，模拟出一个抢占式的多线程库。本质上，这个库是基于 coroutine 实现的。但切换线程是利用的 debug hook 定期强制切换。基于这个库，可以把以前我写过的这个小玩意改进一下。做的更易用一些。

二、是在一个 os 进程内启动多个独立的 lua state ，每个 lua state 并不包含多个 coroutine ，而只用一个 main thread 。设置 debug hook ，让 main thread 可以每跑一个阶段就 yield 出来，把控制权交还到上层的 C 代码。在 C 层次写一个有效的调度器。对 lua state 来说，每个都是独立的，它们之间可以通过 zeromq 这样的库通讯。lua state 还可以部署到多个 os thread 上，实现一个 M:N 的线程模型。它的调度器会比 os 来的更为高效。（关于在语言级实现 M:N 线程模型和 OS 级实现 M:N 线程序模型的性能差异，上个月 7 月 12 日我们在 google+ 上做过一次讨论。可惜是在有限圈子里做的，暂时没找到方法公开）且少占用大量的堆栈资源。

话说到这里，再看看，其实这不就是 Erlang 的模型么？:)

ps. 其实 lua 的早期版本也可以通过 lua coco 实现无限制的 yield 操作。但 coco 使用了 OS 的 fiber 库这比 5.2 版的 lua 实现多出了额外的堆栈开销。

多线程 lua 编程语言 yield

安科网

浅析Lua下实现抢占式多线程

dobests

dobests

相关推荐

Java+Linux，深入内核源码讲解多线程之进程

深究 Linux 多线程中的信号量 Semaphore

多线程真的比单线程快？

怎么理解分布式、高并发、多线程

Chrome的下载实在太蛋疼！教你如何改善它

多线程中如何使用gdb精确定位死锁问题

Linux平台服务器多线程开发（一）

Linux平台服务器多线程开发（一）

JUnit5实现并发执行用例

Python多线程

python 多线程 QTimer实现多线程

C语言多线程

C++并发编程实战：如何为多线程性能设计数据结构？

C# 多线程的阻塞和继续

什么叫线程安全？servlet 是线程安全吗?

JAVA JVM垃圾回收 JVM调优

浅谈linux模拟多线程崩溃和多进程崩溃

Python-多线程

MYSQL查看多线程复制报错详情

Ruby 多线程

dobests