仔细看看,其实其中有很多关键字是为了帮助编译器进行优化的,还有一些是用来限定变量、函数的作用域、链接性或者生存周期(函数没有)的,这些在编译器实现的早期根本不必加上,于是可以去掉auto,restrict,extern,volatile,const,sizeof,static,inline,register,typedef,这样就形成了C的子集,C3语言,C3语言的关键字如下:
enumunsigned
breakreturnvoid
casefloatshort
charforsignedwhile
goto_Bool
continueif_Complex
defaultstruct_Imaginary
dointswitch
doublelong
elseunion
//共27个
再想一想,发现C3中其实有很多类型和类型修饰符是没有必要一次性都加上去的,比如三种整型,只要实现int就行了,因此进一步去掉这些关键词,它们是:unsigned,float,short,char(char is int),signed,_Bool,_Complex,_Imaginary,long,这样就形成了我们的C2语言,C2语言关键字如下:
enum
breakreturnvoid
case
forwhile
goto
continueif
defaultstruct
dointswitch
double
elseunion
//共18个
继续思考,即使是只有18个关键字的C2语言,依然有很多,高级的地方,比如基于基本数据类型的复合数据结构,另外我们的关键字表中是没有写运算符的,在C语言中的复合赋值运算符->运算符等的++,–等过于灵活的表达方式此时也可以完全删除掉,因此可以去掉的关键字有:enum,struct,union,这样我们可以得到C1语言的关键字:
breakreturnvoid
case
forwhile
goto
continueif
default
dointswitch
double
else
//共15个
接近完美了,不过最后一步手笔自然要大一点。这个时候数组和指针也要去掉了,另外C1语言其实仍然有很大的冗杂度,比如控制循环和分支的都有多种表述方法,其实都可简化成一种,具体的来说,循环语句有while循环,do…while循环和for循环,只需���保留while循环就够了;分支语句又有if…{},if…{}…else,if…{}…else if…,switch,这四种形式,它们都可以通过两个以上的if…{}来实现,因此只需要保留if,…{}就够了。可是再一想,所谓的分支和循环不过是条件跳转语句罢了,函数调用语句也不过是一个压栈和跳转语句罢了,因此只需要goto(未限制的goto)。因此大胆去掉所有结构化关键字,连函数也没有,得到的C0语言关键字如下:
breakvoid
goto
int
double
//共5个
这已经是简约的极致了。
只有5个关键字,已经完全可以用汇编语言快速的实现了。通过逆向分析我们还原了第一个C语言编译器的编写过程,也感受到了前辈科学家们的智慧和勤劳!我们都不过是巨人肩膀上的灰尘罢了!0生1,1生C,C生万物,实在巧妙!