浅析Hello World源码是如何被Mono执行
本文目的很简单,简单分析一下下面语句是如何被Mono Runtime执行的:
public class Hello1 { public static void Main() { System.Console.WriteLine("Hello, World!"); } }
由于自己也是刚接触Mono源码,以前一直停留于简单的应用之上,所以本文的分析不全面,只是为了能大致的了解Mono的执行流程,对基本的函数和流程有所了解,所以本文的风格为流水帐。
一、先简单的看下Mono源码的目录中的几个重要文件夹:
我这里使用的是不知道什么时候下载的某个历史版本2.6.7,目前我觉得重要的就3个文件夹,mcs为base framework这里除了常见的System namespace下的各种重要程序集之外还有以Mono作为namespace的一些程序集,听雨痕说玩Mono不能错过这些程序集,有空看下;libgc文件夹里貌似是提供GC的支持库;最重要一个文件夹就是mono了,下面着重看下这个目录,这里实现的是Mono Runtime,本文调试的代码也主要是这里的。
1.arch:此目录放了各种不同处理器的差异代码,看下x86里面就两个文件x86-codegen.h和tramp.c,这个tramp.c通过调用x86-codegen.h里的各种奇怪的宏提供了两个方法mono_arch_create_method_pointer和mono_arch_create_trampoline,依这个名字看是由MonoMethod *method生成一个本机代码的指针。。。不过这两个方法太过抽象还没看懂,先放到一边。
2.io-layer:从这个目录下的各个文件名来看,这个是和操作系统打交道的,比如posix,socket,threads,semaphores,io等等,这个我很感兴趣,特别是P/Invoke是如何和这些打交道的,这一块在以后也可以做深入的分析。
3.metadata:这一块是实现cli的,比如appdomain,assembly,class&object,cominterop,exception等等,不过还有gc,coree,filewatcher等等,看来这里不只是cli的实现,还有一堆其他的东西。
4.mini:这个名字起的很奇怪,为啥叫mini呢?我猜可能是为了和mono对应吧。。。其实这里是Mono Runtime里最基础的部分,比如aot,Linear IR的jit,debugger等等,当然main函数也再这里。
5.utils和其他:utils提供一些基础设施方面的功能,比如内存分配方面的,常见的数据结构实现,以及各种工具方法。其他的几个文件夹我暂时没发现有价值的东西,先搁在一边。
二、切入正题,打断点分析源码
1.第一步尝试:找出编译的步骤和执行的入口,单步来分析执行流程。在mono_main() at driver.c里找到了main_thread_handler方法,这个是mono在解析完一系列args后的调用,这个方法是入口,接着往下看,由于没有使用mono_compile_aot,所以直接使用mono_domain_assembly_open打开程序集,执行mono_jit_exec。。。。具体的细节就不再写下去了,因为我发现这样写分析的方法没有人能看懂,我自己都懒得看。但是结果得说一下,通过这种方式我最终也没有找到再哪点输出了Hello World!把我记的笔记贴出来,换一种方法
mono_main:driver.c main_thread_handler:driver.c mono_jit_exec :driver.c mono_runtime_run_main:object.c mono_runtime_exec_main:object.c mono_runtime_invoke:mini.c runtime_invoke:指针。 mono_custom_attrs_from_method:reflection.c,原来是取是否要线程安全的。 mono_jit_compile_method_with_opt:mini.c mono_jit_compile_method_inner:MONO_USE_AOT_COMPILER mono_compile_create_vars这个创建私有作用域的变量吗? mono_method_get_header获取_MonoMethodHeader是做什么的? mono_arch_create_vars指定特定arch的操作。 mono_method_to_ir:mono_method_to_ir.c这个好生疏阿。Translate the .net IL into linear IR mono_method_to_ir是一个很重要的方法,在这里实现了il的解析。 mono_optimize_branches:优化分支,开始执行代码优化了,编译理论书上写的没错。
2.第二次尝试:找到在哪执行了向stdout上写hello world! 这一次直接一点,直接去找最终的执行函数,中间的无数步骤先忽略。最初我再源码里翻出了console-io.h这个头文件,发现这里有操作console的,然后就断点阿,每个相关的函数都断上,执行的最后只有初始化函数命中了,尝试失败。那么到底再哪点往stdout写数据呢?我再次尝试一种方法,在执行时加上--trace选项(即再terminal里执行mono --trace hello.exe >> hello.trace.out),把执行流程重定向的一个文本文件中,输出了700多行,恩,我想从这里找出点线索。
1.首先在hello.trace.out文件里搜索Hello, World!字符串,找到几个匹配的地方,其中有一个是 [0xb75616f0: 0.02866 1] ENTER: System.Console:WriteLine (string)([STRING:0x53fa0:Hello, World!], ) 从这个trace的结果上可以看出,[]包括的是地址和时间,后面跟着ENTER:,于是我就再代码里搜索ENTER:,找到/mono/mini/trace.c的342行,加上条件断点:fname = "System.Console:WriteLine",执行一下,ok,命中断点,堆栈信息如下。
Thread [1] 8643 (Suspended : Breakpoint) mono_trace_enter_method() at trace.c:342 0x80dbe6c 0xfb817c 0xfb8225 0xfb80f8 mono_jit_runtime_invoke() at mini.c:4,789 0x8065cc1 mono_runtime_invoke() at object.c:2,613 0x8195d35 create_exception_two_strings() at exception.c:133 0x81e6a9f mono_exception_from_name_two_strings() at exception.c:156 0x81e6adf create_exceptions() at appdomain.c:185 0x818b9e4 mono_runtime_init() at appdomain.c:262 0x818bc0d mini_init() at mini.c:5,520 0x806734a mono_main() at driver.c:1,623 0x80ec127 main() at main.c:34 0x805b950
再看看后面几个的调用
System.IO.SynchronizedWriter:WriteLine System.IO.TextWriter:WriteLine System.IO.UnexceptionalStreamWriter:Write System.IO.StreamWriter:Write ...... System.IO.MonoIO:Write
都是同样的调用堆栈,另外有关于这些System.Console相关的函数都在mono-2.6.7/mcs/class/corlib/System/Console.cs里,这个代码里有MonoLimitation和#if NET_2_1 && !MONOTOUCH部分符号,有点意思。
2.现在可以大致确定每个clr的方法调用都是由mono_jit_runtime_invoke发出的,但是我有点不解的是有三个函数没有symbol,直接显示的是函数地址,这给我的进一步分析带来了难度,来看看是为什么。执行函数返回退回到堆栈mono_jit_runtime_invoke,可以看到那几个没有符号信息的地址是由runtime_invoke这个函数执行的。转到定义,可见
MonoObject *(*runtime_invoke) (MonoObject *this, void **params, MonoObject **exc, void* compiled_method); ...... if (!info->dyn_call_info) info->runtime_invoke = mono_jit_compile_method (invoke); ...... runtime_invoke = info->runtime_invoke; ...... return runtime_invoke (obj, params, exc, info->compiled_method);
可见runtime_invoke是由mono_jit_compile_method这个方法进行jit生成的代码,怪不得找不到符号了。