编译原理--引论（二）

87143158

2019-12-27

一个编译器的结构

把编译器看作一个黑盒子，能够把源程序映射为在语义上等价的目标程序
映射过程，分成两部分，分析部分和综合部分

分析（analysis）

把源程序分解成为多个组成要素，在这些要素之上加上语法结构
使用这个结构创建该源程序的一个中间表示
分析部分检查出源程序没有按照正确的语法构成，或者语义不一致，就必须提供有用信息，使得用户改正
分析部分还会收集有关源程序的信息，并把信息存放在一个称为符号表（symbol table） 的数据结构中，符号表将和中间表示形式一起传送给综合部分

综合（synthesis）

根据中间表示和符号表中的信息来构造用户期待的目标程序
分析部分经常被称为编译器的前端（front end），综合部分称为后端（back end）

编译过程顺序执行了一组步骤

每个步骤的源程序的一种表示方式转换称另一种表示方向
一个典型的编译程序分解成多个步骤的方式
在实践中，多个步骤可能被组合在一起，而这些组合在一起的步骤间中间表示不需要被明确构造出来
存放整个源程序的信息的符号表可由编译器的各个步骤使用
有些编译器在前端和后端之间有一个与机器无关的优化步骤，目的在中间表示之上进行转换，以便后端程序能够生成更好的目标程序

编译原理--引论（二）

1. 词法分析

编译器的第一个步骤称为词法分析（lexical analysis）或扫描（scanning）
词法分析器读入组成源程序的字符流并将它们组织成为有意义的词素（lexeme）的序列
对于每个词素，词法分析器产生如下形式的词法单元（token）作为输出：<token-name, attribute-value>　
这个词法单元被传送给下一个步骤，即语法分析
第一个分量 token-name 是一个由语法分析步骤使用的抽象符号
第二个分量 attribute-value 指向符号表中关于这个词法单元的条目
符号表条目的信息会被语义分析和代码生成步骤使用

position   =    initial   +   rate   *   60   词素    词素     词素    词素   词素 词素 词素

这个赋值语句的字符组合成如下词素，映射成为如下词法单元，这些词法单元被传递给语法分析阶段

position是一个词素，被映射成词法单元<id, 1>，其中id是表示标识符(identifier)的抽象符号，而1指向符号表中position对应的条目
一个标识符对应的符号条目存放在该标识符有关的信息，比如它的名字和类型
赋值符号 = 是一个词素，被映射成词法单元< = >，这个词法单元不需要属性值，省略了第二个分量
也可以使用assign这样的抽象符号作为词法单元的名字，为了标记上的方便，选择使用词素本身作为抽象符号的名字
initial 是一个词素，被映射成此法单元 <id, 2>，其中2指向对应的符号条目
+ 是一个词素，被映射成词法单元 <+>
rate是一个词素，被映射成词法单元<id, 3>，其中3指向rate对应的符号表条目
* 是一个词素，被映射成词法单元<*>
60是一个词素，被映射成词法单元<60>
分隔词素的空格会被词法分析器忽略掉

经过词法分析后，赋值语句表示成如下的词法单元序列

编译原理--引论（二）

2. 语法分析

编译器的第2个步骤称为语法分析（syntax analysis）或解析（parsing）
语法分析器由词法分析器生成的各个词法单元的第一个分量来创建树形的中间表示
该中间表示给出了词法分析产生的词法单元流的语法结构
一个常用的表示方法是语法树（syntax tree），树中的每个内部结点表示一个运算，而该结点的子结点表示该运算的分量
编译器的后续步骤使用这个语法结构来帮助分析源程序，生成目标程序

以上面的语法树为例

如图1-7的这棵语法树，有一个标号为 * 的内部结点，<id, 3>是它的左子节点，整数60是它的右子结点，<id, 3>表示标识符rate
* 结点指明了必须把rate的值与60相乘，标号为 + 的结点表明必须把相乘的结果和 initial 的值相加
这棵树根节点标号为 = ，它表明我们必须把相加的结果存储到标识符 position 对应的位置
该运算与运算顺序和通常的算术规则相同，即乘法的优先级高于加法，乘法应该在加法前计算

3.语义分析（类型检查是一个重要部分）

语法分析器（semantic analyzer）使用语法树和符号表中的信息来检查源程序是否和语言定义的定义的语义一致
它同时也收集类型信息，并把这些信息存放在语法树或符号表中，以便在随后的中间代码生成过程中使用
语法分析的一个重要部分是类型检查（type checking），编译器检查每个运算符是否具有匹配的运算分量
比如，很多程序设计语言的定义要求一个数组的下标必须是整数，若用一个浮点数作为数组下标，编译器必须报告错误
自动类型转换，比如，一个二元算术运算符可以应用于一对整数或者一对浮点数，若这个运算应用于一个浮点和一个整数，那么编译器可以把整数转换成为一个浮点数

以上面的语法树为例

如图1-7现实了一个这样的自动类型转换，假设 position、initial 和 rate已经被声明为浮点数类型，而词素60本身形成一个整数
检查发现运算符 * 被用于一个浮点数rate 和一个整数 60，这种情况下，这个整数可以转换成为一个浮点数
语义分析器输出中有一个关于运算符 inttofloat 的额外结点，inttofloat明确地把它的整数参数转换为一个浮点数

4.中间的代码生成

在把一个源程序翻译成目标代码的过程中，一个编译器可能构造出一个或多个中间表示
这些中间表示可以有多种形式，语法树是一种中间表示形式，它们通常在语法分析和语义分析中使用
在源程序的语法分析和语义分析完成之后，很多编译器生成一个明确的低级的或类机器语言的中间表示
我们可以把这个表示看作是某个抽象机器的程序
该中间表示应该具有重要的性质：它易于生成，且能够轻松地翻译为目标机器上的语言

5.代码优化

机器无关的代码优化步骤试图改进中间代码，以便生成更好的目标代码
通常意味着更快，但是也可能会有其他目标，如更短的或能耗更低的目标代码
它由语义分析器得到的树形中间表示中的每个运算符都使用一个指令
使用一个简单的中间代码生成算法，然后进行代码优化步骤是生成优质目标代码的一个合理方法
不同的编译器所作的代码优化工作量相差很大，那些优化工作做得最多的编译器，"优化编译器"，会在优化结点花相当多的时间

6.代码生成

代码生成器以源程序的中间表示形式作为输入，并把它映射到目标语言，如果目标语言是机器代码，那么就必须为程序使用的每个变量选择寄存器或内存位置
中间指令被翻译成能够完成相同任务的机器指令序列，代码生成的一个至关重要的方面是合理分配寄存器以存放变量的值

7.符号表管理

编译器的重要功能之一是记录源程序中使用的变量的名字，并收集和每个名字有关的信息
这些属性可以提供一个名字的存储分配、它的类型、作用域等信息
对于过程名字，这些信息包括：它的参数数量和类型、每个参数的传递方法以及返回类型

8.将多个步骤组合成趟

在一个特定的实现中，多个步骤的活动可以被组合一趟（pass）
每趟读入一个输入文件并产生一个输出文件
比如，前端步骤中的词法分析、语法分析、语义分析，以及中间代码生成可以被组合在一起成为一趟
代码优化可以作为一个可选的趟，然后可以有一个为特定目标机生成代码的后端趟

9.编译器构造工具

语法分析器的生成器，根据语法描述自动生成语法分析器
扫描器的生成器，根据一个语言的语法单元的正则表达式描述生成词法分析器
语法制导的翻译引擎，生成一组用于遍历分析树并生成中间代码的例程
代码生成器的生成器，依据一组关于如何把中间语言的每个运算翻译成为目标机上的机器语言规则，生成一个代码生成器
数据流分析引擎，可以帮助收集数据流信息，程序中的值如何从程序的一部分传递到另一部分，数据流分析是代码优化的一个重要部分
编译构造工具集，提供了可用于构造编译器的不同阶段的历程

em 符号表编译原理

87143158

0 关注 0 粉丝 0 动态

相关推荐

如何评估机器学习模型的性能

您可以整天训练有监督的机器学习模型，但是除非您评估其性能，否则您永远无法知道模型是否有用。这个详细的讨论回顾了您必须考虑的各种性能指标，并对它们的含义和工作方式提供了直观的解释。罗宾和山姆都开始为工科大学准备入学考试。他们俩全年学习了几乎相同的时间，并参加

xceman 2020-09-22

Python初学者请注意！别这样直接运行python命令

Python已经成为全球最受欢迎的编程语言之一。原因当然是Python简明易用的脚本语法，只需把一段程序放入.py文件中，就能快速运行。而且Python语言很容易上手模块。这样设计的好处是，初学者能够非常方便地执行命令。但是对攻击者来说，这等于是为恶意程序

bcbeer 2020-08-27

知识点记录

express的中间件中执行异步函数，执行顺序不会按照洋葱模型，异步的执行结果有可能被放到最后，response之前。这是由于，其中间件执行机制，递归回调中没有等待中间件中的异步函数执行完毕，就是没有await中间件异步函数。express内置了很多中间件

风萧萧梦潇 2020-08-17

WPF Bezier Curve 贝塞尔曲线工具（有源码可分享）

第一：有需要的同学可以留下邮箱，我看到后会发给源码。

成长共勉 2020-07-29

OpenGL 六 - 3D数学基础 - 向量、矩阵及OpenGL中的变换

关于矩阵和向量的相关知识，大家可能和我一样毕业后几乎就慢慢遗忘干净了。但是，既然学过，回忆起来其实并不太难。而且，即使没有学过，也并不影响我们对相关API的使用。当然基础知识的理解会帮助我们弄明白和更好的进行OpenGL的开发工作。GLTools库中的Ma

夕加加 2020-07-20

问题：xcrun: error: invalid active developer path

解决：安装xcode-select. # xcode-select --install

LuckyDeng 2020-07-08

git常用操作

There is no tracking information for the current branch.Please specify which branch you want to merge with.See git-pull for deta

huangchunxia 2020-07-08

vuex及其属性应用

Vuex 是一个专为 Vue.js 应用程序开发的状态管理构架。它采用统一式存储管理和维护所有组件的可变化的状态。也可以理解为是一种开发模式或框架，通过状态集中管理驱动组件的变化，应用级的状态集中放在store中，改变状态的方式是提交mutations，异

lbPro0 2020-07-05

为什么是link-visited-hover-active原理这样的特殊

通常我们在设置链接的一些伪类样式时，要让不同的状态显示正确的样式，我们需要按一定的顺序设置这些伪类的样式。这里我就按css2规范中推荐的顺序进行介绍，即link-visited-hover-active，可记为LoVe-HAte。下面我们分别来看看特殊性、

葉無聞 2020-07-05

python基础

　　 IronPython：Python的C#实现，IronPython将Python代码编译成C#字节码，然后在CLR上运行。　　　　　　　　　　　　　　　　　‘if‘, ‘import‘, ‘in‘, ‘is‘, ‘lambda‘, ‘not‘, ‘o

万里之书 2020-07-04

css基础教程

HTML 标签原本被设计为用于定义文档内容。通过使用 <h1>、<p>、<table> 这样的标签，HTML 的初衷是表达“这是标题”、“这是段落”、“这是表格”之类的信息。同时文档布局由浏览器来完成，而不使用任何的格式

冰蝶 2020-07-04

pytest 用例编写规则、命令行执行用例、用例执行的先后顺序

文件名以 test_*.py 开头和 *_test.py 结尾的文件函数以test_开头类以Test开头，且不能包含 __init__ 方法类里面的方法以test_开头所有的包 pakege 必项要有__init__.py 文件断言必须使用asser

yuzhongdelei0 2020-07-04

FOG COMPUTING研究中的初级概念

”Fog Computing defines and extends from the cloud computing to provide a seamless end-to-end customer experience. Fog Computing

meiseeny 2020-06-28

常用正则表达式大全

提取信息中的图片链接：(s|S)(r|R)(c|C) *= *(‘|")?+?提取信息中的中国固定电话号码：?提取信息中的浮点数（即小数）：(-?匹配Email地址的正则表达式：\w+@\w+.\w+*

RuoShangM 2020-06-28

oracle 临时表空间、数据表空间、创建用户名与密码、赋予用户权限

2.确保路径存在，比如也就是你要保存文件的路径存在/*分为四步*//*第1步：创建临时表空间 */

bianxq 2020-06-28

saltstack

在主机上安装saltstack 首先需要epel源，其次安装：yum install salt-master -y 开机自启动：chkconfig salt-master on. vi /etc/salt/mast 文件里取消这

80327065 2020-06-28

策略模式

在策略模式中，一个类的行为或其算法可以在运行时更改。这种类型的设计模式属于行为型模式。在策略模式中，我们创建表示各种策略的对象和一个行为随着策略对象改变而改变的 context 对象。使用Context来查看当它改变策略Strategy时的行为变化。

Codeeror 2020-06-28

LayUI--页面元素

将栅格放入一个带有 class="layui-container" 的特定的容器中，以便在小屏幕以上的设备中固定宽度，让列可控。为了丰富网页布局，简化 HTML/CSS 代码的耦合，并提升多终端的适配能力，layui 引进了一套具备响应

somyjun 2020-06-25

SQL Server：SQL Like 通配符特殊用法：Escape

最后，看一个更加复杂的匹配，注意“-”这个也是特殊字符也需转义。下面这个就是要匹配包括“纺梦”这两个字，但这两个字只能是与“+-*/”这四个字符相连或是单独存在。如果这里的“纺梦”是任意中文字符就没办法去处理了。

xuanlvhaoshao 2020-06-16

tomcat 乱码

解决办法在C:\tomcat\apache-tomcat-8.5.56\conf 目录下找到logging.properties 文件用编辑器打开，本例子是使用“Notepad++”编辑器打开。

zhangxiaocc 2020-06-16

87143158

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号