字符串驻留机制在python中字符串是基本数据类型,是一个不可变的字符序列
仅保留一份相同且不可变字符串的方法,不同的值被存放在字符串的驻留池中,Python的驻留机制对相同的字符串只保留一份拷贝,后续创建相同字符串时,不会开辟新空间,而是把该字符串的地址赋给新创建的变量
驻留机制的几种情况(交互模式)
字符串驻留机制的优缺点
- 字符串的长度为0或1时
- 符合标识符的字符串(含有字母;数字;下划线的字符串称为标识符字符串)
- 字符串只在编译时进行驻留,而非运行时
- [-5,256]之间的整数数字
- sys中的intern方法强制2个字符串指向同一对象
- PyCharm对字符串进行了优化处理(强制让内容相同的字符串驻留)
字符串的常用 *** 作 字符串的查询 *** 作
- 当需要值相同的字符串时,可以直接从字符串池李拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。
- 在需要进行字符串拼接时建议使用str类型的join方法,而非+,因为join()方法时先计算出所有字符串中的长度,然后再拷贝,只new一次对象,效率要比“+”效率高
建议使用find,rfind执行查找 *** 作
字符串大小写转换 *** 作转换之后将会产生一个新的字符串对象
字符串内容对齐 *** 作
字符串的劈分 *** 作 字符串的判断 *** 作 字符串的替换与合并 *** 作
字符串的比较 *** 作
运算符:>,>=,<,<=,==,!=
比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较
比较原理:两个字符进行比较时,比较的是其ordinal value(原始值),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时,指定ordinal value可以得到其对应的字符
字符串的切片 *** 作
格式化字符串
- 字符串是不可变类型
- 不具备增,删,改等 *** 作
- 切片 *** 作将产生新的对象
- 与列表切片 *** 作相同
按一定格式输出的字符串叫格式化字符串
格式化字符串的两种方式name='张三' age=20 print('我叫%s,今年%d岁' % (name,age)) print('我叫{0},今年{1}岁'.format(name,age)) print(f'我叫{name},今年{age}岁') #f-string
设置格式化的宽度及浮点型数值的精度
print('%10d' % 99) #10表示的是宽度 print('%.3f' % 3.1415926) #.3表示的是小数点后三位 print('%10.3f' % 3.1415926) #同时表示宽度和精度 总宽度为10,小数点后3位
print('{0:.3}'.format(3.1415926)) #.3表示的是一共是3位数 0代表占位符顺序,可以省略 print('{0:.3f}'.format(3.1415926)) #.3f表示的是3位小数 print('{0:10.3f}'.format(3.1415926)) #同时设置宽度和精度,一共是10位,3位小数字符串的编码转换 为什么需要字符串的编码转换 编码与解码的方式
- 编码:将字符串类型转换为二进制数据(bytes)
- 解码:将bytes类型的数据转换成字符串类型
a='天涯共此时' #编码 print(a.encode(encoding='GBK')) #在GBK这种编码格式中,一个中文占两个字节 print(a.encode(encoding='UTF-8')) #在UTF-8中,一个中文字符占8个字节 #解码 #byte代表的是一个二进制数据(字节类型的数据) byte=a.encode(encoding='GBK') #编码 print(byte.decode(encoding='GBK')) #解码 byte=a.encode(encoding='UTF-8') print(byte.decode(encoding='UTF-8'))总结
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)