1. 程式人生 > >numpy 學習彙總9-字元操作( 基礎學習 tcy)

numpy 學習彙總9-字元操作( 基礎學習 tcy)

Numpy字元操作 2018/11/20
        
===================================================================================
1.函式
    # 以下函式用於對dtype為string_或unicode_的陣列執行向量化字串操作。
    # 基於 Python 內建庫中的標準字串函式。
        
add()         #返回兩個str或Unicode陣列的逐個字串連線
multiply()   #返回按元素多重連線後的字串
center()     #返回給定字串的副本,其中元素位於特定字串的中央
capitalize() #返回給定字串的副本,其中只有第一個字串大寫
title()         #返回字串或 Unicode 的按元素標題轉換版本
lower()      #返回一個數組,其元素轉換為小寫
upper()     #返回一個數組,其元素轉換為大寫
split()        #返回字串中的單詞列表,並使用分隔符來分割
splitlines()#返回元素中的行列表,以換行符分割
strip()       #返回陣列副本,其中元素移除了開頭或者結尾處的特定字元
join()        #返回一個字串,它是序列中字串的連線
replace()  #返回字串的副本,其中所有子字串的出現位置都被新字串取代
decode()  #按元素呼叫str.decode
encode()  #按元素呼叫str.encode
        
===================================================================================
2.例項
np.char.add(['hello'],[' word'])            #字串連線array(['hello word'], dtype='<U9')
np.char.multiply('Hello ',3)                  #多重連線array('Hello Hello Hello ', dtype='<U18')
    
# 此函式返回所需寬度的陣列,以便輸入字串位於中心,並使用fillchar在左側和右側進行填充。
np.char.center('hello', 20,fillchar = '*')#array('*******hello********', dtype='<U20')
    
np.char.capitalize('hello world')     # 首字母大寫array('Hello world', dtype='<U11')
np.char.title('hello how are you?') # 標題  詞首字母大寫array('Hello How Are You?', dtype='<U18')
np.char.lower(['HELLO','WORLD'])  # 小寫array(['hello', 'world'], dtype='<U5')
np.char.upper(['hello','world'])       # 大寫array(['HELLO', 'WORLD'], dtype='<U5')
    
np.char.split ('Tom,Bob,John', sep = ',')
# 指定分隔符分割字串 array(list(['Tom', 'Bob', 'John']), dtype=object)
    
np.char.splitlines('hello\nhow are you?')# '\n','\r','\r\n'都會用作換行符。
#以換行符分割字串 array(list(['hello', 'how are you?']), dtype=object)
np.char.splitlines('hello\rhow are you?')
#array(list(['hello', 'how are you?']), dtype=object)
    
np.char.strip(['aTom','admin','java'],'a')    #移除開頭或結尾特定字元array(['Tom', 'dmin', 'jav'], dtype='<U5')
    
np.char.join(':','dmy')                                 #單個字元由特定的分隔符連線 array('d:m:y', dtype='<U5')
np.char.join([':','-'],['dmy','ymd'])                #array(['d:m:y', 'y-m-d'], dtype='<U5')
'.'.join(['ab', 'pq', 'rs'])                                # 'ab.pq.rs'
''.join(['ab', 'pq', 'rs'])                                 # 'abpqrs'
    
np.char.replace ('He is a good boy', 'is', 'was') # is 被was替代 array('He was a good boy', dtype='<U17')
    
np.char.encode('hello', 'cp500') #字串編碼 array(b'\x88\x85\x93\x93\x96', dtype='|S5')
char.encode()
# 此函式對陣列中的每個元素呼叫str.encode函式。 預設編碼是utf_8,可以使用標準 Python 庫中的編解碼器。
np.char.encode('hello', 'cp500') #array(b'\x88\x85\x93\x93\x96', dtype='|S5')
    =====================================================================================