Python split 分割中文

阿新 • • 發佈：2017-12-31

關於區別 bsp spark pri park decode encode python

str8="中國 和 韓國 的區別"
# a=str8.find("Python")
# print a
b=str8.find("和")
print b
word=str8.split(" ")         #Python3 和Spark 這裏可以直接正確分割中文
print word
for i in word:               #python 2.x 需要這樣輸出
    print i

#這是關於編碼的問題
# print "-"*50
# data=str8.decode("utf-8").encode("gb2312")
# print type(data)
# data2=data.decode("gb2312")
# print type(data2)
# print data2.split(u" ")
# data3=data2.encode("utf-8").split(" ")
# print data3
# for i in data3:
#     print i

結果：

7

[‘\xe4\xb8\xad\xe5\x9b\xbd‘, ‘\xe5\x92\x8c‘, ‘\xe9\x9f\xa9\xe5\x9b\xbd‘, ‘\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab‘]
中國
和
韓國
的區別
--------------------------------------------------
<type ‘str‘>
<type ‘unicode‘>
[u‘\u4e2d\u56fd‘, u‘\u548c‘, u‘\u97e9\u56fd‘, u‘\u7684\u533a\u522b‘]
[‘\xe4\xb8\xad\xe5\x9b\xbd‘, ‘\xe5\x92\x8c‘, ‘\xe9\x9f\xa9\xe5\x9b\xbd‘, ‘\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab‘]
中國
和
韓國
的區別

Python split 分割中文

Python split 分割中文

關於區別 bsp spark pri park decode encode python str8="中國和韓國的區別" # a=str8.find("Python") # print a b=str8.find("和") print b word=str8.sp

python split使用分隔符分割多個字串

python內建的split()函式只能使用單個分隔符 text = '你好！吃早飯了嗎？再見。' text.split('！') Out[64]: ['你好', '吃早飯了嗎？再見。'] text.split('。|！|？') Out[65]: ['你好！吃早飯了

python split同時用多種字元分割字串並去除空串簡單兩行程式碼實現

程式碼使用的是python3的語法，python2只需要修改其中部分內容，同樣可以使用兩行程式碼實現需求這裡把程式碼直接給出，方便大家直接使用 >>> s

String.split()分割字符串方法

是把使用方法 array pan 字符串方法 -s 用法 ade split方法的主要用處就是：分割字符串split方法返回的是數組類型主要由以下幾種用法：1.比如有一個字符串var str = "bcadeab";對str使用split方法var strArray =

python ---split()函數講解

col 9.png str 中文 logs python 技術分享 itl cnblogs python ---split()函數講解 split中文翻譯為分裂。在python用於分割字符串使用。 split()就是將一個字符串分裂成多個字符串組成的列表。 split

python畫圖顯示中文亂碼

family cnblogs code otl 指定 param logs port 解決 import matplotlib #指定默認字體 matplotlib.rcParams[‘font.sans-serif‘] = [‘SimHei‘] matplotlib.r

python 在windows 中文顯示

存在代碼 port ensure nbsp ascii class syntax character 今天看到mechanize，在網上找例子實驗，發現只要代碼裏出現中文，就會報錯 SyntaxError: Non-ASCII character ‘\xe4‘ in f

python安裝Jieba中文分詞組件並測試

圖片 class pypi setup.py bubuko for 中文 users mage python安裝Jieba中文分詞組件 1、下載http://pypi.python.org/pypi/jieba/ 2、解壓到解壓到python目錄下： 3、

python日誌分割(轉)

ati inf val ota cti pos 分割 fix tin 按文件大小分割：RotatingFileHandler 按時間分割：TimedRotatingFileHandler import logging from logging.handlers impo

Python 註釋和中文亂碼

uft str class 計算機運行中文不支持 encoding linux Python 註釋分為三種： 1.單行註釋：# 2.多行註釋：前後3個單引號，或者三個雙引號；如：‘‘‘ 多行註釋 ‘‘‘, """或者多行註釋 ‘""" 3.特殊註釋：　

python---補充django中文報錯

pep 方法 view log character python for 我們 eps SyntaxError at /blog/ news/story Non-ASCII character ‘\xe4‘ in file D:\MyPython\day23\HelloW

js split 的用法和定義 js split分割字符串成數組的實例代碼

script RR 用法 scrip arr AR asc 分割 lan <script language="javascript"> str="2,2,3,5,6,6"; //這是一字符串 var strs= new Array(); //定義一數組 strs

python CSV寫中文

save filedia pytho csv str 轉換 txt dal troy 　　　　 1 def OnDeleteClick(self, event): 2 import os 3 dlg = wx.FileDialog(s

天文python應用包中文使用說明文檔《Usage Documentation of Astro-python》

說明文檔 tro 單位隊友顯示文檔變換支持 http 耗時一個多月的翻譯工作終於完成了....！！還是很感謝給力的隊友(*^__^*) 言歸正傳：此說明文檔是關於一系列天文的Python包的中文應用說明【Astro_py_whl(v1.1.1).pdf】。我

Python 批量生成中文姓名（百家姓）

遍歷 [] enc image 只需要 BE 數據標簽 append 　　最近需要造一部分數據，需要用到人名，與其用腳本生成一些隨機組合的漢字，不如在網上爬一些看似真實的姓名，所以找來了姓氏大全的網站，網址：http://www.resgain.net/xsdq.html

Python split()方法

com bin In AS clas 結果 spa n) class 描述 Python split() 通過指定分隔符對字符串進行切片，如果參數 num 有指定值，則僅分隔 num 個子字符串語法 split() 方法語法： str.split(str="", num=

關於Python萬惡的中文亂碼和找不到問題

color 變現亂碼 path pat python round unicode 傳遞 rootDir = os.path.join(CASE_PATH, "系統", "基礎", "管理")print rootDirprint(chardet.detect(rootDir

python 讀取 csv 中文亂碼解決辦法

解決辦法 pre pen 讀取 gb2 line with pri clas import codecs with codecs.open(‘h.csv‘, ‘rb‘, ‘gb2312‘) as csvfile: for line in csvfile:

C# split分割字符串

har gsp sys reg ignorecas () options sar write string str="0011001100110011"; string[] str001 = str.Split(new string[]{"00"}, StringSplit

python requests返回中文亂碼

ons enc lxml nco res gb2 main def bs4 　　最近在使用python爬取高考分數線時，獲得的response裏面輸出了中文亂碼： from bs4 import BeautifulSoup import requests def get