1.搞清楚语言的目的,有的语言只是为了更好的操作变量,有的语言是获取书写者意图。
2.制作结构图
3.书写lexer. parser. lexer是一个工具,主要职能是从数据流中提取有效token. parser是转译器,根据第2部中构造出的结构图,我们就可以得知ast的结构,parser就是利用lexer获得token,然后将这些token组成ast。当然这里有效转译的前提是数据流在框架上符合我们的设定,否则转译失败。
4.获得ast之后,我们就可以遍历这颗书,然后求值。对于表达式,我们是求一个结果,对于操作变量的编程语言,我们是求每一个变量的语言。对于以获取用户意图为目的的语言,我们要如何才能得知用户的意图呢?
symabl表 一些语言存放的数据,如数据类型,变量名,程序名,函数名,作用域名等等。
语义检查 正式编译前的语法检查,内部代码结构与编译代码雷同,但是需要分开写,因为职责不同。
作用域与函数十分相似,一旦完成作用域,那么就可以实现函数调用,在compund statement中只有两种,compund statement和aasign statement,再加一种 procedurecall statement作为函数调用。
实现函数调用和作用域更像是 在仔细研究了函数的基础上 抽象出了函数的本质特征,而我们可以同样抽象出 if判断,for循环,泛型,委托等其他功能,不过越复杂的功能实现起来越费事。
编译器最好有一个统一的内存管理,之前的内存管理是通过dictionary,外加parent标记来维护父子作用域,实际上 可以用栈内存模型来实现。
编程语言的功能就是编译器实现的关键。
编译的本质是在给定格式规则的基础上提供适当的灵活性来增加表现力。他并不是语言翻译,更像是 给定规则,然后填充规则,这使得高级语言无论如何发展则也无法变成人类语言。在解析的时候 编译器一个词语一个词语的解析,一旦发现某个语句块不符合规定,则立马报错。
程序发源于计算复杂度问题,解决关于计算原子弹和宇宙的需要耗费的大量计算问题,歇包括两个问题 非常复杂的数学计算公式,人类计算很容易遗漏,第二 随着计算的复杂,一张纸很难写完,必然导致 很凌乱,无法将思绪完整的写下来,程序语言出现了,他用自动计算解决了计算错误问题,用函数将不同的计算部分分割开来,使得很清晰。随着计算机的发展,计算逐渐向 模拟自然方向发展,重点研究自然界的原理,并用计算机模拟它,而复杂度问题则向面相对象 mvc 函数式发展,重点解决代码复杂度问题,也就是高级语言出现的原因,而模拟自然界则导致api的出现,由具体设备提供api,通过api借用其计算的能力,这两个共同组成了现代编程的全部。windows编程提供c#, windows api。安卓提供java, Android api。浏览器提供js,浏览器api。
一些平台则出现平台api和对应的高级语言。
任何一种平台 框架都应该提供语言和api,语言用来写业务,api则提供平台能力,有的人说 本来不就是用语言写,然后平台翻译吗?实际上你用了框架,你就已经使用框架的api了,必然入口函数就是框架或者平台的api,生命周期就是框架的api,你使用语言是为了增加表现力,同样 当你自己创建框架的时候,你给出一个语言后,也要给出api,只有这样 你的平台才能和用户写的程序配合,甚至 有的框架给出高级功能,可以让程序员直接操作框架底层能力。