C/C++的参数传递机制

涂有薄技涂宗勋

2015-01-11

近来公司招人较多，由此面试了非常多的C++程序员。面试时，我都会问到参数传递的相关问题，尤其侧重指针。因为指针毕竟是C/C++最重要的一个优势(在某种情况下也可以说是劣势)。但其结果是，1/3的人基本上讲错了，1/3的知其然却不知其所以然。所以我觉得有必要把这些知识点梳理下，分享出来。(下面的讨论都是基于VS和GCC的默认编译方式，其他特殊编译方式不在本文作用范围内。)

C/C++函数参数的传递方式有三种：值传递（pass by value）、指针传递（pass bypointer）、引用传递（pass by reference）。

C/C++函数参数的传递通道是通过堆栈传递，默认遵循__cdecl(C声明方式)，参数由调用者从右往左逐个压入堆栈，在函数调用完成之后再由调用者恢复堆栈。(Win32API遵循stdcall传参规范的,不在本文讨论范围)

下面是测试代码

void Swap(__int64* _pnX, __int64* _pnY)
{
__int64 nTemp = *_pnX;
*_pnX = *_pnY;
*_pnY = nTemp;
}

void Swap(__int64& _nX, __int64& _nY)
{
__int64 nTemp = _nX;
_nX = _nY;
_nY = nTemp;
}

void SetValue(__int64 _nX)
{
__int64 nTemp = _nX;
}

// Test001
void GetMemory(__int64* _pBuff)
{
_pBuff = new __int64[4];
}

// Test002
void GetMemory(__int64** _ppBuff)
{
*_ppBuff = new __int64[4];
}

int _tmain(int argc, _TCHAR* argv[])
{
__int64 nA = 0x10;
__int64 nB = 0x20;

// Test to pass by pointer
Swap(&nA, &nB);

// Test to pass by reference
Swap(nA, nB);

// Test to pass by value
SetValue(nA);

// Test the pointer that points the pointer
__int64* _pArray = NULL;
GetMemory(&_pArray);
delete[] _pArray;
_pArray = NULL;

// Test the pointer
GetMemory(_pArray);

return 0;
}

指针传递和引用传递

// 下面看一下对应的反汇编的代码(VS版）
__int64 nA = 0x10;
0041370E mov dword ptr [nA],10h
mov dword ptr [ebp-8],0
__int64 nB = 0x20;
0041371C mov dword ptr [nB],20h
mov dword ptr [ebp-18h],0

// Test to pass by pointer
Swap(&nA, &nB);
0041372A lea eax,[nB]
0041372D push eax
0041372E lea ecx,[nA]
push ecx
call Swap (4111E5h)
add esp,8

// Test to pass by reference
Swap(nA, nB);
0041373A lea eax,[nB]
0041373D push eax
0041373E lea ecx,[nA]
push ecx
call Swap (4111E0h)
add esp,8

// GCC版
0x00401582 <+30>: lea eax,[esp+0x18]
0x00401586 <+34>: mov DWORD PTR [esp+0x4],eax
0x0040158a <+38>: lea eax,[esp+0x1c]
0x0040158e <+42>: mov DWORD PTR [esp],eax
0x00401591 <+45>: call 0x401520 <Swap(int*, int*)>
0x00401596 <+50>: lea eax,[esp+0x18]
0x0040159a <+54>: mov DWORD PTR [esp+0x4],eax
0x0040159e <+58>: lea eax,[esp+0x1c]
0x004015a2 <+62>: mov DWORD PTR [esp],eax
0x004015a5 <+65>: call 0x401542 <Swap(int&, int&)>

通过上面的反汇编代码，我们可以看出指针传递和引用传递在机制是一样的，都是将指针值(即地址)压入栈中，调用函数，然后恢复栈。Swap(nA, nB)和Swap(&nA, &nB);在实际上的汇编代码也基本上一模一样，都是从栈中取出地址来。由此可以看出引用和指针在效率上是一样的。这也是为什么指针和引用都可以达到多态的效果。指针传递和引用传递其实都是改变的地址指向的内存上的值来达到修改参数的效果。

值传递

下面是值传递对应的反汇编代码

// Test to pass by value

SetValue(nA);

0041374A mov eax,dword ptr [ebp-8]

0041374D push eax

0041374E mov ecx,dword ptr [nA]

00413751 push ecx

00413752 call SetValue (4111EAh)

00413757 add esp,8

因为我的机器是32位的CPU,从上面的汇编代码可以看64Bit的变量被分成2个32Bit的参数压入栈中。这也是我们常说的，值传递会形成一个拷贝。如果是一个自定义的结构类型，并且有很多参数，那么如果用值传递，这个结构体将被分割为非常多个32Bit的逐个拷贝到栈中去，这样的参数传递效率是非常慢的。所以结构体等自定义类型，都使用引用传递，如果不希望别人修改结构体变量，可以加上const修饰，如(const MY_STRUCT& _value);

下面来看一下Test001函数对应的反汇编代码的参数传递

__int64* _pArray = NULL;
004137E0 mov dword ptr [_pArray],0
// Test the pointer
GetMemory(_pArray);
mov eax,dword ptr [_pArray]
push eax
call GetMemory (411203h)
0041381B add esp,4

从上面的汇编代码可以看出，其实是0被压入到栈中作为参数，所以GetMemory(_pArray)无论做什么事，其实都与指针变量_pArray无关。GetMemory()分配的空间是让栈中的临时变量指向的，当函数退出时，栈得到恢复，结果申请的空间没有人管，就产生内存泄露的问题了。《C++ Primer》将参数传递分为引用传递和非引用传递两种，非引用传递其实可以理解为值传递。这样看来，指针传递在某种意义上也是值传递，因为传递的是指针的值(1个4BYTE的值)。值传递都不会改变传入实参的值的。而且普通的指针传递其实是改变的指针变量指向的内容。

下面再看一下Test002函数对应的反汇编代码的参数传递

__int64* _pArray = NULL;
004137E0 mov dword ptr [_pArray],0
GetMemory(&_pArray);
004137E7 lea eax,[_pArray]
004137EA push eax
004137EB call GetMemory (4111FEh)

004137F0 add esp,4

从上面的汇编代码lea eax,[_pArray] 可以看出，_pArray的地址被压入到栈中去了。

然后看一看GetMemory(&_pArray)的实现汇编代码。

0x0040159b <+0>: push ebp

0x0040159c <+1>: mov ebp,esp

0x0040159e <+3>: sub esp,0x18

0x004015a1 <+6>: mov DWORD PTR [esp],0x20

0x004015a8 <+13>: call 0x473ef0 <_Znaj>

0x004015ad <+18>: mov edx,DWORD PTR [ebp+0x8]

0x004015b0 <+21>: mov DWORD PTR [edx],eax

0x004015b2 <+23>: leave

0x004015b3 <+24>: ret

蓝色的代码是分配临时变量空间，然后调用分配空间函数分配空间,得到的空间指针即eax.

然后红色的汇编代码即从ebp+0x8的栈上取到上面压入栈中的参数_pArray的地址.

mov DWORD PTR [edx],eax即相当于把分配的空间指针eax让edx指向，也即让_pArray指向分配的空间eax.

总之，无论是哪种参数传递方式，参数都是通过栈上的临时变量来间接参与到被调用函数的。指针作为参数，其本身的值是不可能被改变的，能够改变的是其指向的内容。引用是通过指针来实现的，所以引用和指针在效率上一样的。

将C语言梳理一下，分布在以下10个章节中：

Linux-C成长之路（一）：Linux下C编程概要 http://www.linuxidc.com/Linux/2014-05/101242.htm
Linux-C成长之路（二）：基本数据类型 http://www.linuxidc.com/Linux/2014-05/101242p2.htm
Linux-C成长之路（三）：基本IO函数操作 http://www.linuxidc.com/Linux/2014-05/101242p3.htm
Linux-C成长之路（四）：运算符 http://www.linuxidc.com/Linux/2014-05/101242p4.htm
Linux-C成长之路（五）：控制流 http://www.linuxidc.com/Linux/2014-05/101242p5.htm
Linux-C成长之路（六）：函数要义 http://www.linuxidc.com/Linux/2014-05/101242p6.htm
Linux-C成长之路（七）：数组与指针 http://www.linuxidc.com/Linux/2014-05/101242p7.htm
Linux-C成长之路（八）：存储类，动态内存 http://www.linuxidc.com/Linux/2014-05/101242p8.htm
Linux-C成长之路（九）：复合数据类型 http://www.linuxidc.com/Linux/2014-05/101242p9.htm
Linux-C成长之路（十）：其他高级议题

c++ 堆栈

安科网

C/C++的参数传递机制

涂有薄技涂宗勋

涂有薄技涂宗勋

相关推荐

属于新十年的开发语言：Go语言可能很快会取代Python

Python曾是程序员的“瑞士军刀”，而如今正被慢慢取代

看完这篇你还能不懂C语言/C++内存管理？

全面的数据科学C/C++机器学习库整理，再也不用百度搜了

假如C++是一只箭，你会用它来射哪只雕？

Java基础知识回顾，还记得吗？

详细介绍下C/C++时间相关的那些函数

如果编程语言是一门武功绝学

为什么Unix不用功能更强大的C++而是用C编写

NVIDIA C++标准库Libcu++现已通过GitHub发布

2020年9月编程语言排行榜：C++成最大赢家，Java形势严峻

C++ Core Check：安全编码准则更新

最近C++又有什么新花样？六款新上线的C++开源项目推荐

C++的替补选手：微软是如何应用Rust的？

源码分析C++的string的实现

Chrome 团队正探索 Rust 与 C++ 的互操作性

9个2020年超火的编程语言，快来看看哪个好

C++ 之父 Bjarne Stroustrup 被冻结 reddit 帐号

C+、Java、Python选择哪个编程语言?

C++中是如何调用C接口的？

涂有薄技涂宗勋