1. 程式人生 > 程式設計 >python3 字串知識點學習筆記

python3 字串知識點學習筆記

python字串

字串是 Python 中最常用的資料型別。我們可以使用引號('或")來建立字串。

建立字串很簡單,只要為變數分配一個值即可。例如:

var1 = 'Hello World!'
var2 = "jb51.net"

上面單引號'或雙引號"都可以使用

Python 訪問字串中的值

Python 不支援單字元型別,單字元在 Python 中也是作為一個字串使用。

Python 訪問子字串,可以使用方括號來擷取字串,如下例項:

#!/usr/bin/python3
 
var1 = 'Hello World!'
var2 = "jb51.net"
 
print ("var1[0]: ",var1[0])
print ("var2[1:5]: ",var2[1:5])

以上例項執行結果:

var1[0]: H
var2[1:5]: b51.

具體的檢視這篇文章

https://www.jb51.net/article/165463.htm

Python 字串更新

你可以擷取字串的一部分並與其他欄位拼接,如下例項:

#!/usr/bin/python3 
var1 = 'Hello World!' 
print ("已更新字串 : ",var1[:6] + 'jb51.net')

var1[:6]就是擷取var1從開始到第六個字元包括空格正好是"Hello "

以上例項執行結果

已更新字串 : Hello jb51.net

Python轉義字元

在需要在字元中使用特殊字元時,python用反斜槓(\)轉義字元。如下表:

轉義字元 描述
\(在行尾時) 續行符
\\ 反斜槓符號
\' 單引號
\" 雙引號
\a 響鈴
\b 退格(Backspace)
\000
\n 換行
\v 縱向製表符
\t 橫向製表符
\r 回車
\f 換頁
\oyy 八進位制數,yy代表的字元,例如:\o12代表換行,其中 o 是字母,不是數字 0。
\xyy 十六進位制數,yy代表的字元,例如:\x0a代表換行
\other 其它的字元以普通格式輸出

Python字串運算子

下表例項變數a值為字串 "Hello",b變數值為 "Python":

操作符 描述 例項
+ 字串連線 a + b 輸出結果: HelloPython
* 重複輸出字串 a*2 輸出結果:HelloHello
[] 通過索引獲取字串中字元 a[1] 輸出結果e
[ : ] 擷取字串中的一部分,遵循左閉右開原則,str[0,2] 是不包含第 3 個字元的。 a[1:4] 輸出結果ell
in 成員運算子 - 如果字串中包含給定的字元返回 True 'H' in a輸出結果 True
not in 成員運算子 - 如果字串中不包含給定的字元返回 True 'M' not in a輸出結果 True
r/R 原始字串 - 原始字串:所有的字串都是直接按照字面的意思來使用,沒有轉義特殊或不能列印的字元。 原始字串除在字串的第一個引號前加上字母r(可以大小寫)以外,與普通字串有著幾乎完全相同的語法。
print( r'\n' )
print( R'\n' )
% 格式字串 請看下一節內容。

#!/usr/bin/python3
 
a = "Hello"
b = "Python"
 
print("a + b 輸出結果:",a + b)
print("a * 2 輸出結果:",a * 2)
print("a[1] 輸出結果:",a[1])
print("a[1:4] 輸出結果:",a[1:4])
 
if( "H" in a) :
  print("H 在變數 a 中")
else :
  print("H 不在變數 a 中")
 
if( "M" not in a) :
  print("M 不在變數 a 中")
else :
  print("M 在變數 a 中")
 
print (r'\n')
print (R'\n')

以上例項輸出結果為:

a + b 輸出結果: HelloPython
a * 2 輸出結果: HelloHello
a[1] 輸出結果: e
a[1:4] 輸出結果: ell
H 在變數 a 中
M 不在變數 a 中
\n
\n

Python字串格式化

Python 支援格式化字串的輸出 。儘管這樣可能會用到非常複雜的表示式,但最基本的用法是將一個值插入到一個有字串格式符 %s 的字串中。

在 Python 中,字串格式化使用與 C 中 sprintf 函式一樣的語法。

#!/usr/bin/python3
 
print ("我叫 %s 今年 %d 歲!" % ('我們',13))

以上例項輸出結果:

我叫 我們 今年 13 歲!

python字串格式化符號:

符 號 描述
%c 格式化字元及其ASCII碼
%s 格式化字串
%d 格式化整數
%u 格式化無符號整型
%o 格式化無符號八進位制數
%x 格式化無符號十六進位制數
%X 格式化無符號十六進位制數(大寫)
%f 格式化浮點數字,可指定小數點後的精度
%e 用科學計數法格式化浮點數
%E 作用同%e,用科學計數法格式化浮點數
%g %f和%e的簡寫
%G %f 和 %E 的簡寫
%p 用十六進位制數格式化變數的地址

格式化操作符輔助指令:

符號 功能
* 定義寬度或者小數點精度
- 用做左對齊
+ 在正數前面顯示加號( + )
<sp> 在正數前面顯示空格
# 在八進位制數前面顯示零('0'),在十六進位制前面顯示'0x'或者'0X'(取決於用的是'x'還是'X')
0 顯示的數字前面填充'0'而不是預設的空格
% '%%'輸出一個單一的'%'
(var) 對映變數(字典引數)
m.n. m 是顯示的最小總寬度,n 是小數點後的位數(如果可用的話)

Python2.6 開始,新增了一種格式化字串的函式str.format(),它增強了字串格式化的功能。

Python三引號

python三引號允許一個字串跨多行,字串中可以包含換行符、製表符以及其他特殊字元。例項如下

#!/usr/bin/python3
 
para_str = """這是一個多行字串的例項
多行字串可以使用製表符
TAB ( \t )。
也可以使用換行符 [ \n ]。
"""
print (para_str)

以上例項執行結果為:

這是一個多行字串的例項
多行字串可以使用製表符
TAB ( )。
也可以使用換行符 [
]。

三引號讓程式設計師從引號和特殊字串的泥潭裡面解脫出來,自始至終保持一小塊字串的格式是所謂的WYSIWYG(所見即所得)格式的。

一個典型的用例是,當你需要一塊HTML或者SQL時,這時用字串組合,特殊字串轉義將會非常的繁瑣。

errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (
login VARCHAR(8),
uid INTEGER,
prid INTEGER)
''')

f-string

f-string 是 python3.6 之後版本新增的,稱之為字面量格式化字串,是新的格式化字串的語法。

之前我們習慣用百分號 (%):

>>> name = 'Jb51.net'
>>> 'Hello %s' % name
'Hello Jb51.net'

f-string 格式話字串以 f 開頭,後面跟著字串,字串中的表示式用大括號 {} 包起來,它會將變數或表示式計算後的值替換進去,例項如下:

>>> name = 'Jb51.net'
>>> f'Hello {name}' # 替換變數
Hello jb51.net
>>> f'{1+2}'     # 使用表示式
'3'

>>> w = {'name': 'Jb51','url': 'www.Jb51.net'}
>>> f'{w["name"]}: {w["url"]}'
'Jb51: www.Jb51.net

用了這種方式明顯更簡單了,不用再去判斷使用 %s,還是 %d。

在 Python 3.8 的版本中可以使用 = 符號來拼接運算表示式與結果:

例項

>>> x = 1
>>> print(f'{x+1}')  # Python 3.6
2

>>> x = 1
>>> print(f'{x+1=}')  # Python 3.8
'x+1=2'

Unicode 字串

在Python2中,普通字串是以8位ASCII碼進行儲存的,而Unicode字串則儲存為16位unicode字串,這樣能夠表示更多的字符集。使用的語法是在字串前面加上字首 u。

在Python3中,所有的字串都是Unicode字串。

Python 的字串內建函式

Python 的字串常用內建函式如下:

序號 方法及描述
1

capitalize()
將字串的第一個字元轉換為大寫

2

center(width,fillchar)


返回一個指定的寬度 width 居中的字串,fillchar 為填充的字元,預設為空格。
3

count(str,beg= 0,end=len(string))


返回 str 在 string 裡面出現的次數,如果 beg 或者 end 指定則返回指定範圍內 str 出現的次數
4

bytes.decode(encoding="utf-8",errors="strict")


Python3 中沒有 decode 方法,但我們可以使用 bytes 物件的 decode() 方法來解碼給定的 bytes 物件,這個 bytes 物件可以由 str.encode() 來編碼返回。
5

encode(encoding='UTF-8',errors='strict')


以 encoding 指定的編碼格式編碼字串,如果出錯預設報一個ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'
6

endswith(suffix,beg=0,end=len(string))
檢查字串是否以 obj 結束,如果beg 或者 end 指定則檢查指定的範圍內是否以 obj 結束,如果是,返回 True,否則返回 False.

7

expandtabs(tabsize=8)


把字串 string 中的 tab 符號轉為空格,tab 符號預設的空格數是 8 。
8

find(str,end=len(string))


檢測 str 是否包含在字串中,如果指定範圍 beg 和 end ,則檢查是否包含在指定範圍內,如果包含返回開始的索引值,否則返回-1
9

index(str,end=len(string))


跟find()方法一樣,只不過如果str不在字串中會報一個異常.
10

isalnum()


如果字串至少有一個字元並且所有字元都是字母或數字則返 回 True,否則返回 False
11

isalpha()


如果字串至少有一個字元並且所有字元都是字母則返回 True,否則返回 False
12

isdigit()


如果字串只包含數字則返回 True 否則返回 False..
13

islower()


如果字串中包含至少一個區分大小寫的字元,並且所有這些(區分大小寫的)字元都是小寫,則返回 True,否則返回 False
14

isnumeric()


如果字串中只包含數字字元,則返回 True,否則返回 False
15

isspace()


如果字串中只包含空白,則返回 True,否則返回 False.
16

istitle()


如果字串是標題化的(見 title())則返回 True,否則返回 False
17

isupper()


如果字串中包含至少一個區分大小寫的字元,並且所有這些(區分大小寫的)字元都是大寫,則返回 True,否則返回 False
18

join(seq)


以指定字串作為分隔符,將 seq 中所有的元素(的字串表示)合併為一個新的字串
19

len(string)


返回字串長度
20

ljust(width[,fillchar])


返回一個原字串左對齊,並使用 fillchar 填充至長度 width 的新字串,fillchar 預設為空格。
21

lower()


轉換字串中所有大寫字元為小寫.
22

lstrip()


截掉字串左邊的空格或指定字元。
23

maketrans()


建立字元對映的轉換表,對於接受兩個引數的最簡單的呼叫方式,第一個引數是字串,表示需要轉換的字元,第二個引數也是字串表示轉換的目標。
24

max(str)


返回字串 str 中最大的字母。
25

min(str)


返回字串 str 中最小的字母。
26

replace(old,new [,max])


把 將字串中的 str1 替換成 str2,如果 max 指定,則替換不超過 max 次。
27

rfind(str,end=len(string))


類似於 find()函式,不過是從右邊開始查詢.
28

rindex( str,end=len(string))


類似於 index(),不過是從右邊開始.
29

rjust(width,[,fillchar])


返回一個原字串右對齊,並使用fillchar(預設空格)填充至長度 width 的新字串
30

rstrip()


刪除字串字串末尾的空格.
31

split(str="",num=string.count(str))


num=string.count(str)) 以 str 為分隔符擷取字串,如果 num 有指定值,則僅擷取 num+1 個子字串
32

splitlines([keepends])


按照行('\r','\r\n',\n')分隔,返回一個包含各行作為元素的列表,如果引數 keepends 為 False,不包含換行符,如果為 True,則保留換行符。
33

startswith(substr,end=len(string))


檢查字串是否是以指定子字串 substr 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定範圍內檢查。
34

strip([chars])


在字串上執行 lstrip()和 rstrip()
35

swapcase()


將字串中大寫轉換為小寫,小寫轉換為大寫
36

title()


返回"標題化"的字串,就是說所有單詞都是以大寫開始,其餘字母均為小寫(見 istitle())
37

translate(table,deletechars="")


根據 str 給出的表(包含 256 個字元)轉換 string 的字元,要過濾掉的字元放到 deletechars 引數中
38

upper()


轉換字串中的小寫字母為大寫
39

zfill (width)


返回長度為 width 的字串,原字串右對齊,前面填充0
40

isdecimal()


檢查字串是否只包含十進位制字元,如果是返回 true,否則返回 false。

下面是不一些例項

建議大家手工打出來,這樣才能理解,一個字元的差別都會導致出錯

字串擷取字元補充:

# 0、a,b為引數。從字串指標為a的地方開始擷取字元,到b的前一個位置(因為不包含b)
var1 = "hello world";
print(var1[a: b]);

# 1、如果a,b均不填寫,預設取全部字元。即,下面這兩個列印結果是一樣的
print(var1[: ]); # hello world
print(var1);   # hello world

# 2、如果a填寫,b不填寫(或填寫的值大於指標下標),預設從a開始擷取,至字串最後一個位置
print(var1[3: ]); # lo world

# 3、如果a不填寫, b填寫,預設從0位置開始擷取,至b的前一個位置
print(var1[: 8]); # hello wo

# 4、如果a為負數,預設從尾部某一位置,開始向後擷取
print(var1[-2: ]); # ld

# 5、如果a>=b,預設輸出為空。
print(var1[3: 3]);
print(var1[3: 2]);

python字串格式化符號 %f 可指定小數點後的精度。

>>> num=18.7254
>>> print("the price is %.2f" %num)
the price is 18.73
>>> 

python字串格式化符號:

%g 是 %f 和 %e 的簡寫是什麼意思?到底是 %f 還是 %e?

對此我用程式碼測試了一下:

>>> a=100000
>>> print("%g"%(a))
100000
>>> a=10000000
>>> print("%g"%(a))
1e+07
>>> a=1000000
>>> print("%g"%(a))
1e+06

可以發現,%g 是自動選擇輸出格式的,在六位數的情況下就會以科學計數法方式輸出,文章中說 %g 是 %f 和 %e 的簡寫,但是我發現上述不是科學計數法方式輸出的時候輸出的是一個整數,於是又進行了如下測試:

>>> a=100000.0
>>> print("%g"%(a))
100000
>>> print("%f"%(a))
100000.000000
>>>

發現 %g 在不是用 %e 輸出的情況下和%f還是有區別的

對此我又做了如下測試:

>>> a=100000.1
>>> print("%g"%(a))
100000
>>> a=1.0
>>> print("%g"%(a))
1
>>> a=1.1
>>> print("%g"%(a))
1.1

發現在 a=100000.1 的時候輸出的數並沒有小數點後面的 1,對此我對比了 C 語言 %g 的格式輸出,猜想 python 中應該如同 C 語言一樣,%g 用於列印資料時,會去掉多餘的零,至多保留六位有效數字。

使用格式化符號進行進位制轉換

>>> num=10
>>> print('十六進位制:%#x' % num)  #使用%x將十進位制num格式化為十六進位制
十六進位制:0xa
>>> print('二進位制:',bin(num))   #使用bin將十進位制num格式化為二進位制
二進位制: 0b1010
>>> print('八進位制:%#o' % num)   #使用%o將十進位制num格式化為八進位制
八進位制:0o12

上面使用格式化符號進行進位制轉換中,多加入了一個#號,目的是在轉換結果頭部顯示當前進位制型別,如不需要,可將#號去除,如下

>>> print('八進位制:%o' % num)
八進位制:12
>>> print('十六進位制:%x' % num)
十六進位制:a

字串擷取字元繼續補充:

[::2] 表示的是從頭到尾,步長為2。第一個冒號兩側的數字是指擷取字串的範圍,第二個冒號後面是指擷取的步長。

>>> L=['a','b','c','d','e','f','g']
>>> print(L[::2]) 
['a','g']

可以使用負數從字串右邊末尾向左邊反向索引,最右側索引值是 -1:

>>> str = "jb51.net"
>>> str[-4]
'.'
>>> 

字串的分割還有partition()這種方式。

partition(sep) --> (head,sep,tail)

從左向右遇到分隔符把字串分割成兩部分,返回頭、分割符、尾三部分的三元組。如果沒有找到分割符,就返回頭、尾兩個空元素的三元組。

s1 = "I'm a good sutdent."
#以'good'為分割符,返回頭、分割符、尾三部分。
s2 = s1.partition('good')
#沒有找到分割符'abc',返回頭、尾兩個空元素的元組。
s3 = s1.partition('abc')

print(s1)
print(s2)
print(s3)

結果如下:

I'm a good sutdent.
("I'm a ",'good',' sutdent.')
("I'm a good sutdent.",'','')

字串等倒序小測:

ch = "我們歡迎您"
ls = [0,1,2,3,4]
st = (0,4)
print(ch[::-1])
print(ls[::-1])
print(st[::-1])

輸出:

您迎歡家之本腳
[4,0]
(4,0)

這篇文章就介紹到這了。