数据蒋堂 | 为什么我们需要C程序员
作者:蒋步星
来源:数据蒋堂
本文共1000字,建议阅读6分钟。
如何保证数据操作的精确度和高性能呢?
再说一个招聘的话题。
大家可能知道,润乾的软件产品主体都是Java写的,几乎没有别的语言。但是,我们在招聘算法程序员时,从来都要求C语言背景,会不会Java反而无所谓,而如果没有C语言功底则免谈。事实上,现在润乾研发部几个做算法的程序员,都是来了公司之后才学习使用Java的。
为什么我们会这么关注C/C++?
润乾是做基础软件的,而编写底层代码的技术逻辑和界面有很大不同。底层代码会被千百次的调用,一个函数哪怕只慢了1个微秒,被重复调用100万次时也会导致秒级的延迟。相对来讲,界面程序就不在意这些,代码再慢也不可能慢过人的操作,这时候的重点就变成用户体验而不是性能了。
想写出高效的代码,就必须深入理解计算机的运行原理,知道CPU、内存是如何工作的。应用程序员一般只关注业务功能的正确性,而一个好的系统级程序则不仅要保证正确性,还会习惯性地脑补出每一句代码被编译器翻译成什么样子了,最后会导致CPU和内存的哪些动作,从而判断出代码的效率。举个例子,new是Java代码中很常见的动作,但系统程序员却会很慎重地使用它,因为它涉及动态内存分配,是个非常复杂的任务,效率很低;但应用程序员则很少关注或了解这一点。
这种能力,常常是被C语言编程训练出来的。至少,容易通过考察C语言经验知道程序员是否具有这种能力。而其它程序设计语言则难有这种效用。
C语言的与众不同,关键在于其指针能力,包括函数指针。理解指针,本质上是理解CPU的工作原理,了解数据和代码在内存是如何存放的,CPU又是如何访问数据和执行代码的。说到底,其实是对汇编语言的熟悉。但汇编语言过于繁琐,C语言则是一个很好的抽象,即保留了大部分汇编语言的能力,又提供了更为宏观易读的描述方式。有了清晰的指针概念之后,也很容易理解C++(以及Java)中继承重载的具体实现方法,对于多继承(Java中取消了)也不会感觉到糊涂,也知道如何用非面向对象的语言(比如就是C语言)实现面向对象的机制(不仅能实现,反而会更灵活)。
不过,并不是所有程序员都能体会到这一点,有些程序员仅仅是使用C语言的语法,而避开指针的运用。这样,C语言成为众多程序设计语言“之一”了。
还有一个问题,我们为什么不直接用C语言写软件呢?
这个主要是兼容性的问题。C语言发明得太早,早于许多操作系统,每个操作系统下的C语言总有些不一样,这样想写一个兼容性很好的程序几乎是不可能的事情。不过现在这个问题开始弱化了,服务器端的操作系统快被linux垄断了,所以迟早有一天,我们也会把程序用C语言重写一遍。这些本来就有C功底的程序员就能进一步发挥到作用。
专栏作者简介
润乾软件创始人、首席科学家
清华大学计算机硕士,中国大数据产业生态联盟专家委员,著有《非线性报表模型原理》等,1989年,中国首个国际奥林匹克数学竞赛团体冠军成员,个人金牌;2000年,创立润乾公司;2004年,首次在润乾报表中提出非线性报表模型,完美解决了中国式复杂报表制表难题,目前该模型已经成为报表行业的标准;2014年,经过7年开发,润乾软件发布不依赖关系代数模型的计算引擎——集算器,有效地提高了复杂结构化大数据计算的开发和运算效率;2015年,润乾软件被福布斯中文网站评为“2015福布斯中国非上市潜力企业100强”;2016、2017年,荣获中国电子信息产业发展研究院评选的“中国软件和信息服务业十大领军人物”;2017年度中国数据大工匠、数据领域专业技术讲堂《数据蒋堂》创办者。
— 完 —
关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。