Python 3.2 字符串方法学习总结

Sequence Types
sequence类型有六种:strings, byte sequences (bytes objects), byte arrays(bytearray objects), list, tuple, range objects.

sequence类型都支持的通用操作:
成员检查:in、not in
连接:+
复制:*
下标取值:s[i]
切片:s[i : j]
长度检查:len(s)
最小值:min(s)
最大值:max(s)
索引取值:s.index(i)
字符串统计:s.count(i)


String Methods


判断类方法,通常返回一个布尔值:
str.endswith(suffix[, start[, end]]):
判断字符串是否以指定后缀结尾,返回True或False。start和end指定判断的起始范围,默认全字符串。如:
'abcde'.endswith('de') -->True
'abcde'.endswith('de', 0, 3) -->Flase

str.startwith(prefix[, start[, end]]):
与str.endwith()相反,判断字符串是否以指定前缀开始。

str.islower():
判断字符串中的字母字符是否全部为小写,该方法仅判断字符串中的字母字符,不理会其它字符。字符串必须至少包含一个字母字符,否则返回False。如:
‘中国’.islower() -->False
‘ab中国’.islower() -->True

str.isupper():
与st.islower()方法相反,判断所有字母字符是否全部大写。

str.istitle():
判断字符串每个单词的首字母是否大写。字符串必须至少包含一个字母字符,否则返回False。即使首字母字符前面有非字母字符,如中文、数字、下划线等,也不影响对首字母字符的判断。
‘中国’.istitle() -->False //字符串不包含字母,返回False
‘中国Abc’.istitle() -->True //虽然首字母字符A前面有非字母字符,仍然返回True
‘-Abc xyz’.istitle() -->False //后一个单词的首字母不是大写,返回False

str.isalnum():
判断字符串是否只包含由文字数字式字符,字符串仅包含中文字符合法。若字符串包含空格、下划线、~等非文字数字式字符,均返回False。如:
‘3’.isalnum() -->True
‘中国’.isalnum() -->True
‘-’.isalnum() -->False
注:alphanumberic是一个特殊词汇,它表明这个字符串由数字字符或文字字符组成。如,’3’包括了一个数字字符,’a’包含了一个文字字符,而’3a’同时包括数字字符和字母字符。

str.isalpha():
判断字符串是否只包含文字字符,字符串仅包含中文字符合法。如:
‘中国’.isalpha() -->True
‘3’.isalpha() -->False

str.isidentifier():
判断字符串是否是合法的标识符,字符串仅包含中文字符合法,实际上这里判断的是变量名是否合法。如:
‘_a’.isidentifier() -->True
‘3a’.isidentifier() -->False
‘中国’.isidentifier() -->True

str.isprintable():
判断字符串所包含的字符是否全部可打印。字符串包含不可打印字符,如转义字符,将返回False。

str.isspace():
判断字符串是否仅包含空格或制表符。注意:空格字符与空白是不同的,如:
''.isspace() -->False
' '.isspace() -->True

str.isdecimal():
判断字符串是否只包含十进制数字字符,包括多国语言的十进制数字字符表现形式。如:
‘3’.isdecimal() -->True
‘\u0660’.isdeciaml() -->True

str.isdigit():
判断字符串是否只包含数字,这里的数字包括十进制数字和其它特殊数字(如上标数字等)。一般地,一个数字是拥有如下属性值的字符:Numeric_Type=Digit或Numeric_Type=Decimal。

str.isnumeric():
判断字符串是否只包含数字字符。数字字符范围很大,一般来说,数字字符是拥有如下属性值的字符:Numeric_Type=Digit, Numeric_Type=Decimal或Numeric_Type=Numeric。
比较isdecimal()、isdigit()、isnumeric(),几个方法检测的范围依次扩大。


格式化类方法,返回一个格式化的新字符串:
str.encode(encoding=”utf-8”, errors=”strict”):
将字符串以utf-8格式进行编码。

str.lower():
把全部字母字符转换成小写,不去管其它非字母字符。字符串全部为非字母字符也是合法的,但返回原字符串。如:
'中国123ABC'.lower() --> '中国123abc'
‘中国123’.lower() -->'中国123' //不会报错,返回原字符串

str.upper():
与str.lower()相反,把全部字母字符转换成大写。如:
'中国123abc'.upper() --> '中国123ABC'
'中国123'.upper() -->'中国123'

str.swapcase():
把字符串中的大小写字母互换,大写转换成小写,小写转换成大写。不去管非字母类字符。如:
'中国123Ab'.swapcase() -->'中国123aB'
'中国123'.swapcase() -->'中国123' //不会报错,返回原字符串

str.capitalize():
字符串首字母大写,其余小写。如果字符串首字符为非字母字符,将返回原字符串。字符串仅包含非字母字符合法,但返回原字符串。如:
'ab cd'.capitalize() -->'Ab cd' //只转换字符串的首字母
'中国ab 123cd'.capitalize() -->'中国ab 123cd' //首字符为非字母字符,返回原字符串
'中国 123'.capitalize() -->'中国 123' //不会报错,返回原字符串

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/ce6c44a788420bff83c3f6471d1af731.html