前言:JavaScript的数据类型分为两类:原始类型和对象类型。5种原始类型:数字、字符串、布尔值、null(空)、undefined(未定义)。对象是属性的集合,每个属性都由“名/值对”(值可以是原始值、也可以是对象)构成。三个比较特殊的对象:全局对象、数组、函数。JavaScript语言核心还定义了三种有用的类:日期(Date)类、正则(RegExp)类、错误(Error)类。
1 数字
JavaScript中不区分整数值和浮点数值。JavaScript可以识别十进制整型直接量(所谓直接量,就是程序中直接使用的数据值),和16进制值(以0x或0X为前缀,那个是数字0不是字母o。想想如果是字母o的话,那一个十六进制值不成了一个标识符了嘛)。尽管ECMAScript标准不支持八进制直接量,但JavaScript的某些实现可以采用八进制形式表示整数(以数字0为前缀),笔者在自己电脑上的IE、Chrome、FF这三种浏览器中使用八进制给一个变量赋值也都没问题。不过在ECMAScript6的严格模式下,八进制直接量是明令禁止的。
浮点型直接量有两种写法。①传统的实数写法:有整数部分、小数点和小数部分组成;②指数计数法:即在实数后跟字母e或E,后面跟正负号,其后再跟一个整型的指数。
1.1 算术运算的溢出
JavaScript中算术运算在溢出(overflow)、下溢(underflow)或被0整除时不会报错。
溢出:当运算结果超出了JavaScript所能表示的数字上限,结果为正无穷大Infinity或负无穷大-Infinity。无穷大值得行为特性也符合现实:基于它们的加、减、乘和除运算结果还是无穷大值(当然保留它们的正负号);下溢:当运算结果无限接近于零并比JavaScript能表示的最小值还小的时候发生的情形。这种情况下,将会返回0。当一个负数发生下溢时返回特殊值“负零”。负零和整零基本是相等的(甚至可以使用严格相等===来测试),除了作为除数之外:
var zero = 0; //正零值 var negz = -0; //负零值 zero === negz //表达式返回值为true 1/zero === 1/negz //表达式返回值false,等价于判断正无穷大和负无穷大是否严格相等
被0整除会返回正无穷大或者负无穷大值。但0除以0会返回NaN(JavaScript预定义对象Number的NaN属性的值)。返回NaN的有四种情况:①0除以0②无穷大除以无穷大③给任意负数作开方运算④算术运算符与不是数字或无法转换为数字的操作数一起使用时。
NaN值有一点特殊:它和任何值都不相等,包括自身。判断一个变量x是否为NaN的两种方法:①使用函数isNaN()②是使用x != x 判断,当且仅当x为NaN时,表达式结果才为true。JavaScript中还有一个类似的函数isFinite(),在参数不是NaN、Infinity或-Infinity的时候返回true。
1.2 二进制浮点数和四舍五入错误
实数有无数个,但JavaScript通过浮点数的形式只能表示其中有限个数。也就是说,在JavaScript中使用实数的时候,常常只是一个真实值的一个近似表示。JavaScript采用了IEEE-754浮点数表示法,这是一种二进制表示法,可以精确的表示如1/2、1/8和1/1024、这样的分数,但是十进制分数1/10、1/10等并不能精确的表示。例如:
var x = 0.3 -0.2; //x=0.09999999999999998 var y = 0.2 - 0.1; // y=0.1 x == y //false x == 0.1 //false y == 0.1 //true 0.1 == 0.1 //true var z = x + y; //z=0.19999999999999998
2 文本
2.1 字符串、字符集
字符串(string)是一组由16位值组成的不可变的有序序列,每个字符通常来自于Unicode字符集。字符串的长度(length)是其所含16位值得个数。JavaScript通过字符串类型来表示文本。注意:JavaScript中并没有表示单个字符的“字符型”。要表示一个16位值,只需将其赋值给字符串变量即可。
JavaScript采用UTF-16编码的Unicode字符集,JavaScript字符串是由一组无符号的16位值组成的序列。那些不能表示为16位的Unicode字符则遵循UTF-16编码规则——用两个16位值组成一个序列(或称作“代理项对”)表示。这意味着一个长度为2的JavaScript字符串有可能表示一个Unicode字符。注意:JavaScript定义的各式字符串的操作方法均作用于16位值,而非字符,且不会对代理项对做单独处理。书看到这里,又结合上面所述,终于对Unicode字符集、UTF-8、UTF-16稍有理解。
字符串的定界符可以是单引号或者双引号。这两种形式的定界符可以嵌套,但是不能多层嵌套(比如,双引号可以包含单引号,这时单引号中不能再包含双引号了)。正如上篇所说,一个字符串值可以拆分为数行,每行必须以反斜线(\)结束,这时反斜线和行结束符都不算是字符串内容,即字符串本身并非是多行,只是写成了多行的形式。