深入理解C语言
语言只是一种工具,任何语言之间都是相通的,一通则百通,关键是要理解语言背后的思想,理解其思想,任何语言,拿来用就行了。语言没有好坏之分,任何语言既然存在自然有它存在的价值。
在一个到处是OOP的年代,为何面向过程的C语言依然可以如此活跃?这主要得益于C语言本身的语言特性。C语言小巧灵活,而且还有一个直接与硬件打交道的指针的存在,所以它是嵌入式开发唯有的高级语言;正因为他的小巧灵活,我们可以用它来开发一系列的小工具,Unix/Linux就是由这些小工具组成的操作系统;同时用C语言可以开发高性能的应用程序。
1、数据类型。C是一门面向过程的语言,但它依旧可以实现大多数面向对象所能完成的工作。比如面向对象的三大特性:封装、继承、多态。
封装:C中有一种复杂的数据结构叫做struct。struct是C里面的结构体。
假如我们要对person进行封装,person可能包括姓名、性别、年龄、身高、体重等信息。我们就可以对它封装如下:
struct Person{
char name[20];//姓名
char gender; //性别
int age; //年龄
int height; //身高
int weight; //体重
};
当我们要像OOP那样新建一个对象时,我们就可以:
struct Person p;
我们就可以直接对p进行赋值:
p.name = "whc";
p.gender = 'b'; //'b' = boy; 'g' = girl
p.age = 25;
p.height = 175;
p.weight = 65;
继承:同样利用struct,我们来创建一个学生结构,同时继承结构体Person,如下:
struct Student{
struct Person p;
char number[20]; //学号
int score; //成绩
};
对Student进行创建对象,并赋值:
struct Student s;
s.p.name = "whc";
s.p.gender = 'b';
s.p.age = 25;
s.p.height = 175;
s.p.weight = 65;
s.number = "20150618";
s.score = 90;
多态:C中对于多态的实现可以借助函数指针来实现。为了简单起见,我们假设Person这个结构体中,只有一个函数指针。
struct Person{
void (*print)(void *p);
};
struct Student{
struct Person p;
};
而Person和Student这两个结构体的print函数实现如下:
void printPerson(void *person){
if(NULL == person)
return ;
struct Person *p = (struct Person *)person;
printf("run in the person!!\n");
}
void printStudent(void *person){
if(NULL == person)
return ;
struct Person *p = (struct Person *)person;
printf("run in the student!!\n");
}
我们写一个函数来调用他们:
void print(void *person){
if(NULL == person)
return ;
struct Person *p = (struct Person *)person;
p->print(person);
}
int main(){
struct Person person;
struct Student student;
person.print = printPerson;
student.p.print = printStudent;
print(&person); //实参为Person的对象
print(&student); //实参为Student的对象
return 0;
}
他们的输出为:
其实这个也不难理解,无论是Person还是Student,他们在内存中只有一个变量,就是那个函数指针,而void*表示任何类型的指针,当我们将它强制转换成struct Person*类型时,p->print指向的自然就是传入实参的print地址。
2、 指针和内存管理
无论问哪一个C工程狮:C语言中最容易出错的地方在哪?我们基本上会得到同一个答案,那就是指针和内存溢出。那么指针是什么,指针其实就是一个地址,这个地址可以是一个变量的地址,也可以是一个函数的地址,不管是什么,反正都是内存中的一个地址。
例如有一个变量a,我们定义一个指针来保存变量a的地址:
int a = 0;
int *p = &a;
如果是一个函数呢?我们定义一个函数,然后用一个函数指针来保存这个函数地址:
int min(int a,int b){
return a<b?a:b;
}
int (*f)(int,int);
f = min;
可能我们有时候会想,难道我们只能先定义一个变量或者函数,然后把它的地址给指针么?不能直接使用指针,或者直接给指针赋一个常量么?首先,我们不知道内存中哪些是可用的地址,哪些是不可用的,每当我们定义一个指针时,这个指针指向的是一个未定义的内存,这个就是传说中的野指针。如果我们给这个指针所指向的内存赋值,就有可能覆盖了一些很重要的数据,所以每当我们定义一个指针时,最好给它赋一个初始地址或者NULL;如果我们给一个指针赋常量,同样的道理。
指针的类型要与变量的类型一致(如果我们不是故意要他们不一致),所谓类型,只是变量的一直表现形式,其实在内存中,他们不过是0101的二进制,当我们用32bits的原码表示时,它就是unsigned;当我们用32bits补码表示时,就是signed;当用浮点表示时就是float;当用更复杂的自定义表示时就是struct;用union可以很好的理解这些。
现在我们来讲一下内存,这里我们只讨论用户内存区域:
一般分为5个区域:
(1)程序代码区:存放代码指令的地方
(2)全局(静态)变量区:包括初始化、未初始化的全局变量和静态变量
(3)字符常量区:存放一些字符串常量,在C语言里面,这个很容易与栈中定义的字符数组搞混,当我们定义如下:
int main(){
char *str0 = "Hello World!"; //字符常量区
char str1[] = "Hello World!"; //栈区
return 0;
}
str0所指向的字符串就是在字符常量区,但是str0本身的这个指针变量是在栈区的,这个变量存放的是字符常量区中"Hello World!"的首地址。
str1是字符数组,所以str1中所存放的字符串是在栈区,这里利用的不过是字符数组初始化的一种形式,其实它可以写成如下形式:
char str1[] = {'H','e','l','l','o',' ','W','o','r','l','d','!','\0'};
(4)栈区:局部变量,形参,函数返回地址等,由系统来管理,在内存里面是由高地址往低地址生长,所以栈空间大小是有限的,当在栈中定义一个很大的数组或者使用很深的递归调用时,就有可能栈溢出。
(5)堆区:由malloc、calloc、realloc函数分配的空间,由我们自己来管理,每次用完之后,必须用free释放内存,否则,就会产生内存泄漏,每次释放内存后,虽然不再占用着这块内存中,但是对应的指针依然指向这块区域,这个指针就是野指针,所以释放内存后,建议给指针赋NULL。如下:
int main(){
int *p = (int*)malloc(100*sizeof(int));
/*
执行语句
*/
free(p);//这时p依然指向那块内存,成了野指针
p = NULL; //对p赋值NULL
return 0;
}
3、C语言的I/O输入输出
C语言本身并不带有输入输出的特性,所以它的所有I/O操作都是通过系统调用来实现。幸运的是C标准库,已经给我们封装好了一系列的I/O操作的函数。
putchar ():把变量中的一个字符常量输出到显示器屏幕上;
getchar ();从键盘上输入一个字符常量,此常量就是该函数的值;
printf ();把键盘中的各类数据,加以格式控制输出到显示器屏幕上;
scanf ();从键盘上输入各类数据,并存放到程序变量中;
puts ():把数组变量中的一个字符串常量输出到显示器屏幕上
gets ():从键盘上输入一个字符串常量并放到程序的数组中
一些为对文件的操作,由于一切皆可看作是文件,标准输入,输出也可以当作文件来操作,文件描述符:标准输入(0)、标准输出(1)、标准错误(2)
fputs();输出到文件
fgets();从文件输入
fscanf();格式化文件输入
fprintf();格式化文件输出
另外两个很重要的函数,当然还有他们的派生函数也是类似的
sscanf(); 从一个字符串中提取各类数据。
sprintf(); 把格式化的数据写入某个字符串
这里不对每个函数进行详解,主要对格式化函数进行分析:
(1)当我们要把一个字符串转换成一个整数或者把一个整数转换成一个字符串时,我们一般会想到atoi()或者itoa()(非标准函数),但是我们可以通过流来实现:
int main(){
int num = 10;
char str[10] = {0};
sprintf(str,"%d",num); //把int转换成char[]
num = 0;
sscanf(str,"%d",&num);//把字符串转换成int
printf("num:%d str:%s\n",num,str);
return 0;
}
输出结果如下:
把字符串转与其它类型之间的转换:比如float,16进制,unsigned等都可以用流实现。
(2)格式化函数中的正则表达式
所有的格式化函数都可以定制自己的扫描集 %[abc]、%[a-z]、%[^abc]、%[^a-z],其中[]内是匹配的字符,^表示求反集。
当我们要从标准输入输入一个可能带空格的字符串时,直接用scanf("%s",str);当读到空格时就返回,此时就可以使用正则表达式:
char str[100] = {0};
scanf("%[^\n]",str);//直到遇到回车才写入
从标准输入中只要读小写字母a-z,遇到其它字符则返回:
char str[100] = {0};
scanf("%[a-z]",str);
其他格式化函数的用法相同,不一一举例。
4、总结
从大一开始学习C语言也有四五年了,个人认为:C语言中最大的成功在于它的指针,但是也是最容易出错的,想要理解C,必须要掌握指针。虽然说,语言只是一门工具,但是这是基础。或许,你可以说,现在是JAVA的天下了,满大街都是招聘JAVA工程师;或者你可以说C太底层,现在都是OOP的时代了,谁还会用面向过程的......你们不要忘了操作系统是用什么写的?是C;C实现的nginx的并发量是C++实现的apache的几十倍。无论是什么编程语言,好好学,深入学就行,不要因为它今天流行就抛弃昨天所学的。