取出csv文件中的中文評論數據
阿新 • • 發佈:2017-07-20
port pat nts encoding pri python .get dict pos
# -*- coding: utf-8 -*- import csv import re csvfile = ‘weibo.csv‘ def columns_data(path, column): columns_data = ‘‘ csvfile = open(path, ‘r‘, encoding=‘utf-8‘) DicReader = csv.DictReader(csvfile) for row in DicReader: columns_data = columns_data+row.get(column) returncolumns_data comments = columns_data(csvfile, ‘comment‘) print(comments) pattern = re.compile(r‘[\u4e00-\u9fa5]+‘) filterdata = re.findall(pattern, comments) print(filterdata) cleaned_comments = ‘‘.join(filterdata) print(cleaned_comments)
數據來源:Python爬取新浪微博評論數據,寫入csv文件中
本文等同:篩選出一段文字中的中文
取出csv文件中的中文評論數據