# 『Python基础-4』字符串
目录
1.什么是字符串
2.修改字符串
2.1 修改字符串大小
2.2 合并(拼接)字符串 2.3 使用乘号‘*’
来实现字符串的叠加效果。 2.4 在字符串中添加空白或换行 2.5 删除字符串的空白3. 下标与切片
3.1 字符串中"下标"的使用
3.2 切片4. Python 的字符串内建函数
5. [列表]Python字符串运算符6. [列表]python字符串格式化符号
1. 字符串
字符串:
一系列字符,用来储存和表现基于文本信息Python 使用单引号(' ),双引号(" ),三引号(''' """) 来表示字符串,引号的开始与结束必须是相同类型的。
其中三引号可以由多行组成,编写多行文本的快捷语法,常用于文档字符串,在文件的特定地点,被当做注释。
Unicode 字符串
在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀u。
在Python3中,所有的字符串都是Unicode字符串。
2. 修改字符串
2.1 修改字符串的大小写
- Python对大小写很敏感,例如,在储存用户姓名的时候,如果用不同格式输入Lina,LINA,LiNa, 系统会认为这是三个变量,即储存三个不同的名字。
- 在实际应用中,我们无法依靠用户来提供正确的大小写,因此我们需要将字符串先转换为我们需要的格式,再存储它们
- 1.可以使用
.title()
来使字符串里的每个字节的首字母大写。 - 2.可以使用
.upper()
来使字符串里的每个字母都大写。 - 3.可以使
.lower()
使字符串里的每个字母都小写。
name = "Liu ka"print(name)print (name.title())print (name.upper())print (name.lower())
上述代码运行结果如下:
Liu kaLiu KaLIU KAliu ka
2.2 合并(拼接)字符串: 使用加号‘+’
来合并字符串。
- 一些情况下,我们可能会把多个字符串拼接在一起使用。
- 例如,姓和名存在不同的变量里,但是调用输出的时候,需要他们拼接在一起输出。 通过拼接,可使用存储在变量中的信息来创建完整的消息。
family_name = "李"first_name="娜"print(family_name,first_name)print(family_name+first_name)
上述代码运行结果如下:
李 娜李娜
2.3 使用乘号‘*’
来实现字符串的叠加效果。
str1 = "=+="str2 = "bang"print(str1*4)print(str2*3)
上述代码运行结果如下:
=+==+==+==+=bangbangbang
「注意」不同的数据类型是不可以拼接的,系统会报错。
2.4 在字符串中添加空白或换行
在编程中,空白泛指任何非打印字符,如空格、制表符和换行符。
- 可使用空白来组织输出, 以使其更易读。
- 要在字符串中添加制表符,可使用
字符组合/t
- 要在字符串中添加换行符,可使用
字符组合/n
- 可在同一个字符串中同时包含制表符和换行符。
字符串"/n/t"
让Python换到下一行,并在下一行开头添加一个制表符。
print("desk的意思是'桌子'")print("desk的意思是/t'桌子'")print("desk的意思是/n'桌子'")print("desk的意思是/n/t'桌子'")
上述代码运行结果如下:
desk的意思是'桌子'desk的意思是 '桌子'desk的意思是'桌子'desk的意思是 '桌子'
2.5 删除字符串的空白
有的看似一样的字符串,因为空格,会被认定为不同的数据,有时候我们需要用到.lstrip()
剔除字符串开头的空白,或使用.rstrip()
来剔除字符串尾端的空白,也可以使用.strip()
来剔除字符串两端的空白。
str = " 两端有空白需要删除 "print(str)str = " 两端有空白需要删除 "str = str.lstrip()print(str)str = " 两端有空白需要删除 "str = str.rstrip()print(str)str = " 两端有空白需要删除 "str = str.strip()print(str)
上述代码运行结果如下:
两端有空白需要删除两端有空白需要删除 两端有空白需要删除两端有空白需要删除
3. 下标与切片
字符串可以通过str[下标]
来进行索引和切片。
- 下标(索引): 就是对应的编号,默认python里面下标从0开始。
3.1 字符串中"下标"的使用:
如果有字符串:name = "My name is Mike",在内存中的实际存储如下:
(截图from)
3.2 切片
切片是指对操作的对象截取其中一部分的操作。可以看作是,在可操作对象中找出来我们想要的一小截,或者复制出来一小截我想要的长度储存在另外的地方,而不会对这个源文件改动。
切片的语法:[起始:结束:步长]
「提醒:」
- 不指定步长时,默认步长为1
- 结束位置不包含
- 不指定起始位置时,默认起始位置是0
- -1很特殊表示的最后一个元素
(1).使用切片获取指定数据,步长默认是1。
my_str = "Pycharm"print(my_str[0:3])
运行结果:Pyc
(2).快速取前三个字符 (开始位置不指定默认是0)
my_str = "Pycharm"result = my_str[:3]print(result)
运行结果:Pyc
(3).快速取最后三个字符
my_str = "Pycharm"result = my_str[-3:]print(result)
运行结果: arm
(4).快速获取整个字符串
my_str = "Pycharm"result = my_str[:] #my/_str[0:5]
运行结果: Pycharm
(5).负数下标
如果用正数下标完成不了的操作使用负数下标, -1很特殊表示的最后一个元素my_str = "Pycharm"result = my_str[-2:-5:-1] #负数下标print(result)result = my_str[3:0:-1] #正数下标print(result)result = my_str[-2:-6:-1]print(result)
运行结果如下:
rahhcyrahc
(6).获取整个字符串,然后倒着取每一个值
my_str = "Pycharm"result = my_str[::-1]
运行结果如下:mrahcyp
(7).根据切片取值,如果切片范围不对++不会崩溃++,得到空的字符串
my_str = "Pycharm"result = my_str[3:1:1]print("xxx:", result,":xxx")
运行结果为:xxx: :xxx
(8).根据下标取值如果对应的元素不存在++会崩溃++.
my_str = "Pycharm"result = my_str[7]print(result)
运行后报错:
Traceback (most recent call last): File "/home/python/text.Python", line 2, inresult = my_str[7]IndexError: string index out of range
不要忘记: 选取的区间从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身),步长表示选取间隔.
4. Python 的字符串内建函数
Python 的字符串常用内建函数如下
序号 | 方法 | 描述 |
---|---|---|
1 | capitalize() | 将字符串的第一个字符转换为大写 |
2 | center(width, fillchar) | 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。 |
3 | count(str, beg= 0,end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
4 | bytes.decode(encoding="utf-8", errors="strict") | Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。 |
5 | encode(encoding='UTF-8',errors='strict') | 以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
6 | endswith(suffix, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
7 | expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。 |
8 | find(str, beg=0 end=len(string)) | 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1 |
9 | index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在字符串中会报一个异常. |
10 | isalnum() | 如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False |
11 | isalpha() | 如果字符串至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False |
12 | isdigit() | 如果字符串只包含数字则返回 True 否则返回 False.. |
13 | islower() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
14 | isnumeric() | 如果字符串中只包含数字字符,则返回 True,否则返回 False |
15 | isspace() | 如果字符串中只包含空白,则返回 True,否则返回 False. |
16 | istitle() | 如果字符串是标题化的(见 title())则返回 True,否则返回 False |
17 | isupper() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
18 | join(seq) | 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
19 | len(string) | 返回字符串长度 |
20 | ljust(width[, fillchar]) | 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。 |
21 | lower() | 转换字符串中所有大写字符为小写. |
22 | lstrip() | 截掉字符串左边的空格或指定字符。 |
23 | maketrans() | 创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
24 | max(str) | 返回字符串 str 中最大的字母。 |
25 | min(str) | 返回字符串 str 中最小的字母。 |
26 | replace(old, new [, max]) | 把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。 |
27 | rfind(str, beg=0,end=len(string)) | 类似于 find()函数,不过是从右边开始查找. |
28 | rindex( str, beg=0, end=len(string)) | 类似于 index(),不过是从右边开始. |
29 | rjust(width,[, fillchar]) | 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串 |
30 | rstrip() | 删除字符串字符串末尾的空格. |
31 | split(str="", num=string.count(str)) | num=string.count(str)) 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串 |
32 | splitlines([keepends]) | 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
33 | startswith(str, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。 |
34 | strip([chars]) | 在字符串上执行 lstrip()和 rstrip() |
35 | swapcase() | 将字符串中大写转换为小写,小写转换为大写 |
36 | title() | 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
37 | translate(table, deletechars="") | 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |
38 | upper() | 转换字符串中的小写字母为大写 |
39 | zfill (width) | 返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
40 | isdecimal() | 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。 |
常用的字符串操作示例:
4-1 find()
方法
检测 str 是否包含在 mystr中,如果是返回开始的索引值,否则返回-1
mystr = 'hello world itcast and itcastcpp'result1 = mystr.find("world")print(result1)result2 = mystr.find("loop")print(result2)
上述代码运行结果如下:
6-1
4-2.index()
跟find()方法一样,只不过如果str不在 mystr中会报一个异常.
根据内容进行查找,返回一个下标,提示:如果没有找到则会崩溃mystr = 'hello world itcast and itcastcpp'result1 = mystr.index("world")print(result1)result2 = mystr.index("loop")print(result2)
上述代码运行结果如下:
6ValueError: substring not found
find 和index还可以使用下标来命令程序在字符串的某一段里查找:
result = my_str.index("l", 0, 3)print(result)
?指定查找的字符串: "l"
开始位置: 0 结束位置(不包含): 34-3 count()
:统计字符出现的次数。
会返回 str在start和end之间 在 mystr里面出现的次数
str = "welcome to Python world!"result = str.count("o")print(result)
运行结果:4
4-4. replace
替换
把 mystr 中的 str1 替换成 str2,如果 count 指定,则替换不超过 count 次.
.replace()
括号里的三个分别为: - 原字符串
- 替换后的字符串
- 替换的次数,默认-1,或者不指定次数,表示全部替换
str = "welcome to Python world!"result = str.count("o")print(result)name = "hello world, ha ha!"result = str.replace('o','x',2)print(result)name = "hello world, ha ha!"result = str.replace('o','x',1)print(result)name = "hello world, ha ha!"result = str.replace('o','x',-1)print(result)name = "hello world, ha ha!"result = str.replace('o','x')print(result)
上述代码运行结果如下:
welcxme tx Python world!welcxme to Python world!welcxme tx Pythxn wxrld!welcxme tx Pythxn wxrld!
4-5 split
: 对某一串字符串进行分割
- 指定字符进行对某一串字符串进行分割
- 分割次数: 指定1表示分割1次
- 默认全部分割: -1
my_str = "哈哈:嘿嘿:嘻嘻"result = my_str.split(":", 1)print(result)
上述代码运行结果如下:
['哈哈', '嘿嘿:嘻嘻']
4-6 capitalize
- 把字符串的第一个字符大写
mystr = "city"reault = mystr.capitalize()print(reault) #结果:City
4-7 startswith
:判断是否是以指定字符串开始
my_url = "http://www.baidu.com"result = my_url.startswith("http")print(result) #结果: True
4-8 endswith
- 判断是否是以指定字符串结束
my_url = "http://www.baidu.com"result = my_url.endswith(".cn")print(result) #结果:False
4-9 just
- 对齐
(1) ljust - 返回一个原字符串左对齐,并使用空格填充至长度 width的新字符串
(2) rjust - 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
(3) center - 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
my_str = "hello"result = my_str.ljust(10)print(result)result = my_str.rjust(10)print(result)result = my_str.center(10)print(result)
上述代码运行结果如下:
hello hello hello
4-10 partition
- 以指定字符串进行分段,一定会有三段数据,返回的是一个元组
my_str = "AABBCC"result = my_str.partition("BB")print(result)
上述代码运行结果如下:
('AA', 'BB', 'CC')
4-11 isalpha
- 如果字符串里所有字符都是字母 则返回 True,否则返回 False
str = "138138138"print(str.isalpha())
上述代码运行结果如下:False
4-12 isdigit
- 如果字符串只包含数字则返回 True 否则返回 False.
str = "138138138"print(str.isdigit())
上述代码运行结果如下:True
4-13 isalnum
- 如果字符串里所有字符都是字母或数字则返回 True,否则返回 False
str = "138138138"print(str.isalnum())
上述代码运行结果如下: True
4-14 isspace
- 如果字符串中只包含空格,则返回 True,否则返回 False.
str = "138138138"print(str.isspace())
上述代码运行结果如下:False
4-15 join
- 在字符串中每个元素后面插入str,构造出一个新的字符串。
my_str = "ABC"flag_str = "_"result = flag_str.join(my_str)print(result)
上述代码运行结果如下:A_B_C
4-16 rfind
- 类似于 find()函数,不过是从右边开始查找
-1:表示没有找到的标记,下标都是正数
my_str = "abce"result = my_str.rfind("d")print(result)result = my_str.rfind("c")print(result)
上述代码运行结果如下:
-12
5. [列表]Python字符串运算符
下表实例变量a值为字符串 "Hello",b变量值为 "Python":
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | a + b 输出结果: HelloPython |
* | 重复输出字符串 | a*2 输出结果:HelloHello |
[] | 通过索引获取字符串中字符 | a[1] 输出结果 e |
[ : ] | 截取字符串中的一部分,遵循左闭右开原则,str[0,2] 是不包含第 3 个字符的。 | a[1:4] 输出结果 ell |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | 'H' in a 输出结果 True |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | 'M' not in a 输出结果 True |
r/R | 原始字符串 - 所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 | print( r'/n' ) |
- 原始字符串除在字符串的第一个引号前加上字母 r(可以大小写)以外,与普通字符串有着几乎完全相同的语法。
- 字符串有加法运算和乘法运算,即拼接和重复.但是,没有减法和触发运算
6. [列表]python字符串格式化符号:
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |