python庫--pandas--Series.str--字串處理

阿新 • • 發佈：2018-11-13

python內建字串處理方法

S: Series　　I: Index

方法	返回值	引數	說明
.capitalize()	S/I		將Series/Index中的字串大寫
.cat()	S/I/str	使用給定分隔符連線字串
		other=None	None: 使用sep連線給定的Series返回一個str
			List_like: 與Series對應位置的字串用sep連線返回一個S
		sep=None	分隔符
		na_rep=None	遇到NA值忽略或使用指定字元替換
.center()	S	在字串兩端填充指定字元到指定長度
		width	填充後的字串長度
		fillchar=' '	用於填充的字串
.contains()	S[bool]	判斷指定字串或正則表示式是否在序列或索引中
		pat	字串或正則表示式
		case=True	是否區分大小寫
		flags=0	可傳入re.IGNORECASE之類的引數
		na=nan	缺失值填充
		regex=True	是否使用正則表示式匹配
.count()	S[int]	統計指定字串在序列字串中出現的次數
		pat	字串或正則表示式
		flags=0	可傳入re.IGNORECASE之類的引數
.decode()	S[str]	解碼
		encoding	解碼方式
		errors='strict'	error處理方式
.encoode()	S[b'']	編碼
		encoding	編碼方式
		error='static'	error處理方式
.endswith()	S[bool]	判斷是否以給定的字串結尾
		pat	字串
		na=nan	缺失值填充
.extract()		使用正則表示式提取需要的內容(只匹配一次)
		pat	正則表示式(必須含有捕獲組, 超過一個必然返回DataFrame)
		flags=0	可傳入re.IGNORECASE之類的引數
		expand=None	True: 返回DataFrame(未來版本預設值)
			False: 返回S/I/DataFrame(現在版本預設值)
.extractall()	df	獲取所有的正則表示式匹配到的內容(以多級索引的方式展示)
		pat	含捕獲組的正則表示式, 若捕獲組設有name則將作為返回的列標籤
		flags=0	可傳入re.IGNORECASE之類的引數
.find()	S	查詢sub在序列字串的子字串中出現的位置, 找不到返回-1
		sub	字串
		start=0	子字串開始的位置
		end=None	子字串結束的位置
.findall()	S[list]	相當於對序列中每個字串執行 re.findall(pat, string)
		pat	正則表示式
		flags=0	可傳入re.IGNORECASE之類的引數
.get()	S	i	獲取指定位置的字元, 超出長度則返回Na
.index()	S	同.find() 不過找不到將引發Error
.join()	S	sep	給每個字串的字元間插入指定字元
.len()	S	返回每個字串的長度
.ljust()	S	同 .center() 不過只在右側填充
.lower()	S	所有字元小寫
.lstrip()	S	to_strip=None	去除左側指定字元, 預設去掉空白符
.match()	S[bool]	判斷字串與正則表示式是否匹配, 即正則表示式能否匹配到內容
		pat	字串或正則表示式
		case=True	是否區分大小寫
		flags=0	可傳入re.IGNORECASE之類的引數
		na=nan	缺失值填充
		as_indexer=None	棄用
.normalize()	S	from	返回字串的Unicode標準格式
.pad()	S	在序列字串左側/右側/兩側填充指定字串到指定長度
		width	將字串填充到的長度
		side='left'	'left': 在左側填充
			'right': 在右側填充
			'both': 在兩側填充, 原字串居中
		fillchar=' '	填充的字元
.partition()		第一次出現pat時將字串分割為三個部分: pat前面的部分, pat本身, pat後面的部分
		pat=' '	字串
		expand=True	True: 返回DataFrame/Multilndex
			False: 返回Series/Index, 元素為Tuple
.repeat()		將字串擴充套件n倍, 比如 'a' 擴充套件 2 倍為 'aa'
		repeats	int: 序列中所有字串擴充套件相同倍數
			list_like: 長度需和序列長度一致, 對應每個元素擴充套件對應倍數
.replace()	S	更新字串
		pat	字串或編譯的正則表示式
		repl	str: 將匹配到的字串替換為此字串
			fun: 傳給fun的是物件相當於re.search(pat, string)的返回值
		n=-1	替換的次數, 預設全部
		case=None	是否區分大小寫, 如果pat為字串則預設為True, 若為編譯的正則表示式則不能設定
		flags=0	可傳入re.IGNORECASE之類的引數, 但若pat為編譯的正則表示式則不能設定
.rfind()		同 .find() 不過從右往左檢索
.rindex()		同 .index() 不過從右往左檢索
.rjust()		同 .center() 不過只在左側填充
.rpartition()		同.partition(), 不過從右往左檢索pat字串
.rstrip()	S	to_strip=None	去除右側指定字元, 預設去掉空白符
.slice()	S	擷取子字串
		start=None	開始位置
		stop=None	結束位置
		step=None	步長
.slice_replace()	S	擷取子字串, 並將擷取部分替換為repl
		start=None	開始位置
		stop=None	結束位置
		repl=None	要替換為的字串
.split()		對字串按照給定字元進行分割
		pat=None	分隔符, 預設空白符
		n=-1	分割次數, 預設全部
		expand=False	True: 返回DataFrame/MultiINdex
			False: 返回Series/Index
.rsplit()		同.split() 不過從右側開始分割
.startswith()	S[bool]	判斷序列字串是否以指定字串開頭
		pat	字串
		na=nan	缺失值填充
.strip()	S	to_strip=None	去除兩側指定字元, 預設去掉空白符
.swapcase()	S	將小寫字元大寫, 將大寫字元小寫
.title()	S	將首字母大寫, 其餘字元小寫
.translate()		參考python內建字串處理方法 .translate()
.upper()	S	全部大寫
.wrap()	S	width	在指定位置插入換行符
.zfill()	S	width	在字串前面填充0到指定長度
.isalnum()	S[bool]	字串至少包含一個字元且所有字元都是字母(漢字)或數字則返回True
.isalpha()	S[bool]	字串至少包含一個字元且所有字元都是字母(漢字)則返回True
.isdigit()	S[bool]	只包含數字(可以是: Unicode, 全形字元, bytes(b'1'), 羅馬數字)
.isspace()	S[bool]	只包含空白符
.islower()	S[bool]	至少包含一個小寫字元, 且不包含大寫字元
.isupper()	S[bool]	至少包含一個大寫字元, 且不包含小寫字元
.istitle()	S[bool]	所有單詞大寫開頭其餘小寫(標題化)
.isnumeric()	S[bool]	只包含數字字元
.isdecimal()	S[bool]	只包含數字(Unicode字元, 全形字元)
.get_dummies()	df	sep='\|'	把字串按照指定分隔符分割, 並返回分割後的字串出現的次數

python庫--pandas--Series.str--字串處理

python內建字串處理方法 S: Series　　I: Index 方法返回值引數說明 .capitalize() S/I 將Series/Index中的字串大

Python pandas.Series.str

1. replace Series.str.replace(pat, repl, n=-1, case=None, flags=0, regex=True) Parameters: pat&nbs

【pandas】pandas.Series.str.split()---字符串分割

span code utf color display adding play split strong 原創博文，轉載請註明出處！本文代碼的github地址例子： 1 # -*- coding: utf-8 -*- 2 # 創建dataframe 3 i

pandas.series.str.split()語法理解

一直對.str不能理解，那麼先在文件中找到。 PS:值得注意的是在construtor的class裡面才能查到str 發現本質是屬於類下的一個函式，猜想是強制轉化的函式（python是強型別語言）讓人不解，繼續開啟source 原來是一個類。所以Series.str更

【Python學習系列十二】Python庫pandas之CSV匯入

Python Data Analysis Library 或 pandas 是基於NumPy 的一種工具，該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型，提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理

python資料分析處理庫-Pandas之Series結構及Series常用操作方法

我上上篇部落格說過：Pandas資料結構為DataFrame，裡面可以同時是int、float、object（string型別時）、datatime、bool資料型別。而構成DataFrame結構的每一

Python 資料處理庫 pandas 入門教程

Python 資料處理庫 pandas 入門教程2018/04/17 · 工具與框架 · Pandas, Python 原文出處：強波的技術部落格 pandas是一個Python語言的軟體包，在我們使用Python語言進行機器學習程式設計的時候，這是一個非常常用的基礎程式設計庫。本文是對它的一個入門教程。p

【python學習筆記】44：Series.apply()列資料批量處理,Series.str.extract()正則匹配

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。 Series.apply()列資料批量處理先將該列取出，形成Series物件，再呼叫apply()方法傳入用於處理的函式，這個過程就像map()一樣。 import pandas as pd # 各

Python資料處理庫pandas基本使用

---恢復內容開始--- 　　pandas提供過便於操作資料的資料型別，也提供了許多分析函式和分析工具，使得資料分析易於操作。一、pandas庫中Series型別　　Series可以生成資料的索引（自動索引和自定義索引），見下例： Se

python資料分析處理庫-Pandas資料讀取、索引與計算

Pandas資料讀取、索引與計算 Pandas資料結構為DataFrame，裡面可以同時是int、float、object（string型別時）、datatime、bool資料型別 import p

Python資料處理庫pandas入門教程

pandas是一個Python的yuyi語言軟體包，在我們使用Python語音進行機器學習程式設計的時候，這是一個非常常用的基礎程式設計庫。本文是對它的一個入門教程。 pandas提供了快速，靈活和富有表現力的資料結構，目的是使“關係”或“標記”資料的工作既簡

python初學二（字串str的處理方式）

一，輸入輸入的用法：側輸入側輸入側側表示鍵盤輸入側側傳給變數，程式一直等待鍵盤輸入，輸入可新增提示資訊：接受變數的值的英文字串型別，如果要使用數字進行運算一定要用INT（）轉化。 a =

python使用pandas模組實現檔案讀取、字串處理、去重排序、excel生成

最近學習python，用python實現一個小需求,最後寫入excel使用到pandas模組：某中學學生在500米短跑訓練比賽中的資料，體育老師把學生成績結果記錄在檔案中（studentdata.txt）,記錄格式如下：卡納瓦, 2001-11-8,2:27,2:33,

Python資料處理庫pandas進階教程

在前面一篇文章中，我們對pandas做了一些入門介紹。本文是它的進階篇。在這篇文章中，我們會講解一些更深入的知識。前言本文緊接著前一篇的入門教程，會介紹一些關於pandas的進階知識。建議讀者在閱讀本文之前先看完pandas入門教程。資料訪問在入門教程中，

【Python】“pandas”庫“to_sql”報錯“Invalid MySQL identifier”處理記錄

最近又要幫客戶寫指令碼拉一份統計日報，就先把一堆一堆的小SQL寫好測好後，準備用Python封裝一下。但是用到第三方“pandas”模組的“to_sql”方法往MySQL資料庫寫資料時，卻報了“Invalid MySQL identifier”無效識別符號的錯。

【A-003】python資料分析與機器學習實戰 Python科學計算庫 Pandas資料分析處理庫（四）DataFrame資料結構

pandas資料結構：DataFrame 引入：在上一節中已經介紹過了Series物件，Series物件可以理解為由一列索引和一列值，共兩列資料組成的結構。而DataFrame就是由一列索引和多列值組成的結構，其中，在DataFrame中的每一列都是一個S

Python 資料處理庫 pandas

核心資料結構 pandas最核心的就是Series和DataFrame兩個資料結構。名稱維度說明 Series 1維帶有標籤的同構型別陣列

OpenAI 開源機器人模擬 Python 庫，並行模擬處理速度提升400%

class 功能 lan pic 速度 tail pytho 實現模擬 10000da.cnvboyule.cnjiaeidaypt.cn 在過去一年的研究中，OpenAI團隊開源一個使用 MuJoCoengine開發的用於機器人模擬的高性能Python庫。雷

pandas數組(pandas Series)-(4)NaN的處理

() 充值 ML line value apple tps nbsp fill 上一篇pandas數組(pandas Series)-(3)向量化運算裏說到,將兩個 pandas Series 進行向量化運算的時候,如果某個 key 索引只在其中一個 Series 裏出現,

python之pandas庫

numpy 混合 column query 大於 ace col outer 相關性一、生成數據表 1、首先導入pandas庫，一般都會用到numpy庫，所以我們先導入備用： import pandas as pd 2、導入CSV或者xlsx文件： df = pd.Dat

python庫--pandas--Series.str--字串處理

相關推薦