Java开源工具在linux上的源码分析(六)：符号表的读取

staticnetwind

2012-03-02

通常我们使用jmap,jstack 去检查堆栈信息的时候，是不会使用-f参数的，但有的时候系统在无法打印出堆栈信息的时候，会建议你使用参数-F。

关于-F参数与非-F参数的区别笔者已经在前面的博客中讲述（http://blog.csdn.net/raintungli/article/details/7023092），简单的说也就是一种是让jvm进程自己打印出堆栈信息，另有一种是直接访问jvm的堆栈区通过固定的结构找出我们需要的信息。

1. Linux-F参数的实现

在linux中可以使用ptrace的系统调用去访问运行中的进程的内存信息，具体如何实现可以参考笔者的博客（http://blog.csdn.net/raintungli/article/details/6563867）

在java中使用动态加载的方式加载jvm自己的链接共享库，jvm的核心链接共享库是libjvm.so，linux中如何动态加载可以参考（http://www.ibm.com/developerworks/cn/linux/l-dynamic-libraries/#dynamiclinking）

因为是动态共享库，当想查找具体的参数的值，内存的信息的时候，就需要计算出正确的参数或者函数的地址。

2. 共享库中的符号相对地址偏移

可运行程序，共享库使用ELF格式，当运行一个程序的时候，内核会把ELF加载到用户空间，里面记录了程序的函数和数据的地址和内容，elf文件格式就不具体描述了。

在linux 中可以使用结构体ELF_EHDR，ELF_PHDR，ELF_SHDR读出elf 的program header, section header, section data.

在jvm中源码具体实现请参考 /hotspot/agent/os/linux/salibelf.c

在linux中本身就自带一个读取elf格式的工具，readelf 你可以使用不同的参数读取不同的内容。

readelf -s libjvm.so

显示共享库中的方法参数的虚拟地址，类型，名字

readelf -l libjvm.so

读取program headers，其中出现2个LOAD的类型，第一个是程序的指令虚拟的起始地址，另一个是程序数据的起始地址。

通过2个地址我们就能找到共享库中的参数，函数的相对地址的偏移。

3. 进程中的符号地址

在第二章节中，得到的只是相对的地址偏移，并不是真实运行中的进程的符号地址，如何得到真实的地址在linux中就相对比较简单。

cat /proc/$processid/maps

在maps里详细记录了进程的堆栈分配的地址，包括共享库的地址，那么起始地址就是这个库分配的最小地址

进程中共享库分配的最小地址+相对地址的偏移 =真实的进程中该函数或变量的真实地址

4. Java tool 保存的符号表

在jmap/jstack 中，为了提高读取符号地址的性能，避免每一次要找符号的地址从elf文件中查找，只是在初始话的时候将符号表保存成哈希表，其中key是符号的名字，内容是符号的地址，长度。

具体实现可以参考 /hotspot/src/os/linux/symtab.c build_symtab_internal 函数。

符号表 linux系统地址堆栈

安科网

Java开源工具在linux上的源码分析(六)：符号表的读取

staticnetwind

staticnetwind

相关推荐

编译原理

指针与数组

编译原理--引论（二）

PHP extract() 函数

Linux模块的一点事情

C++ const 分析

JVM：早期（编译期）优化

PHP垃圾回收机制

一文让你学会所有的python模块使用

JVM学习笔记之常见JVM机制

Linux strip命令的用法

Linux模块编程框架

Linux入门教程：Linux内核符号表字符信息

JVM-程序编译与代码早期（编译期）优化

GDB如何调试没有符号表(未加-g选项的编译)的程序

关于PHP关联数组相关知识介绍

简单谈谈PHP的垃圾回收机制

php 数组处理函数extract详解及实例代码

iOS符号表恢复&逆向支付宝

基于linux程序中段的学习总结详解

staticnetwind