python練習冊0004題

阿新 • • 發佈：2018-12-17

在任意一個英文文件中，統計單詞出現的次數，

分析:

本題不是很難，單詞通常以空格隔開，但是有些單詞後面跟一些特殊符號，只需把這些特殊符號替換掉就可以了，

程式碼一

 1 import re
 2 
 3 file_name = 'code.txt'
 4 
 5 lines_count = 0
 6 words_count = 0
 7 chars_count = 0
 8 words_dict = {}
 9 lines_list = []
10 
11 with open(file_name, 'r') as f:
12     for line in f:
13         lines_count = lines_count + 1
14 
         chars_count = chars_count + len(line)
15         match = re.findall(r'[^a-zA-Z0-9]+', line)
16 
17         #正則 re.findall  的簡單用法（返回string中所有與pattern相匹配的全部字串，返回形式為陣列）語法：
18         for i in match:
19             # 只要英文單詞，刪掉其他字元
20             line = line.replace(i, ' ')
21         lines_list = line.split()
 
22         for i in lines_list:
23             if i not in words_dict:
24                 words_dict[i] = 1
25             else:
26                 words_dict[i] = words_dict[i] + 1
27 
28 print('words_count is', len(words_dict))
29 print('lines_count is', lines_count)
30 print('chars_count is', chars_count)
 
31 
32 for k, v in words_dict.items():
33     print( k, v)

該程式碼有些囉嗦，網上找的，說下思路把，利用正則表示式找到所有的不是字母也不是數字的資料儲存下來，然後再訪問文字中的資料，將非字母和數字的資料替換為空

弱弱的說一句，直接替換掉不就完了。

程式碼二：

這是本人所寫的，較程式碼一稍微簡潔些；

import  re
f=open("code.txt",'r')
s=f.read()
s.replace("[^a-zA-Z]",' ')
s=s.split()
word={}
for i in s:
    if i not in  word:
        word[i]=1
    else:
        word[i]=word[i]+1
for k,v in word.items():
    print(k,v)

程式碼三：

你以為你寫的夠簡潔了嗎？不，python早就幫你封裝好函數了。

點開才能看。

import collections
import re
 
def calwords(path):
    word = []
    with open(path) as file:
        data = file.readlines()
    for line in data:
        word += re.split(' |，',line.strip('\n'))
    print(collections.Counter(word))
 
 
if __name__ == '__main__':
    calwords('e://code.txt')

View Code

用到的方法說明

正則 re.findall  的簡單用法（返回string中所有與pattern相匹配的全部字串，返回形式為陣列）
語法：findall(pattern, string, flags=0)

string的replace方法，用後一個引數替換字串中的前一個引數。

string.split方法

str.split()

單一分隔符，使用str.split()即可 

str.split不支援正則及多個切割符號，不感知空格的數量

re.split()

 多個分隔符，複雜的分隔情況，使用re.split

原型： re.split(pattern, string, maxsplit=0)

通過正則表示式將字串分離。如果用括號將正則表示式括起來，那麼匹配的字串也會被列入到list中返回。maxsplit是分離的次數，maxsplit=1分離一次，預設為0，不限制次數。

eg:

>>>a='w w w'

>>>import re

1.空格分

>>>re.split(r'[\s]',a)

['w','w','w']

2.只分割一次

>>>re.split(r'[\s]',a,1)

['w','ww']

3.多個字元分割

>>>c='[email protected]%w^w'

>>>re.split(r'[[email protected]%^],c)

['w','w','w','w','w']

4.還原?:

>>>re.split(r'(?:[email protected]%^),c)

['[email protected]%w^w']

描述
Python strip() 方法用於移除字串頭尾指定的字元（預設為空格或換行符）或字元序列。

注意：該方法只能刪除開頭或是結尾的字元，不能刪除中間部分的字元。

couter 是一個容器，可以統計列表中元素的出現次數.

python練習冊0004題

在任意一個英文文件中，統計單詞出現的次數，分析: 本題不是很難，單詞通常以空格隔開，但是有些單詞後面跟一些特殊符號，只需把這些特殊符號替換掉就可以了，程式碼一 1 import re 2 3 file_name = 'code.txt' 4 5 lines_count = 0 6 wor

python練習冊第一題

題目做為 Apple Store App 獨立開發者，你要搞限時促銷，為你的應用生成啟用碼（或者優惠券），使用 Python 如何生成 200 個啟用碼（或者優惠券）？解題思路上網搜了一下生成隨機字串的方法，除了猜想中類似C的random()方法，令我驚訝的是uuid模組也可以起到隨機的作用，

python練習冊第二題

題目將 0001 題生成的 200 個啟用碼（或者優惠券）儲存到 MySQL 關係型資料庫中。解決思路基本步驟應該是：讀取檔案 --> 解析字元 --> 開啟資料庫 --> 存入後關閉。其中涉及python操作mysql資料庫的我還不是很熟悉。 py3.6我是用pymysql作

python練習冊每天一個小程序第0002題

color == oot 關系型數據庫 auth creat user root mdb 1 #-*-coding:utf-8-*- 2 __author__ = ‘Deen‘ 3 ‘‘‘ 4 題目描述： 5 將 0001 題生成的 200 個激活碼

python練習冊每天一個小程序第0010題

rgb pytho 進行 lur return n) dom randint window # -*-coding:utf-8-*- ‘‘‘ 題目描述：使用 Python 生成類似於下圖中的字母驗證碼圖片思路：運用PIL庫加random 隨機字母進行生成

python練習冊第零題

說明這個是網上一些大佬做的一套練習題，總共有25題，訓練大家python在檔案讀取、文字處理、資料庫、網頁等方向的熟練度，十分有用。github地址在這： python 練習冊每天一個小程式上不了github的可以直接搜名字，應該能搜到。我這個筆記集也是隻記了五道題。。。我大概多做了一兩題吧，

python練習冊第三題

題目將 0001 題生成的 200 個啟用碼（或者優惠券）儲存到 Redis 非關係型資料庫中。解題思路難點是壓根不知道redis怎麼用。好在找到了一些文章快速學了些：使用python操作redis python: redis介紹及簡單應用 python(十一)下：Redis安裝配置及使用詳解

python練習冊第四題

題目任一個英文的純文字檔案，統計其中的單詞出現的個數。解題思路上網找了一下思路。首先要讀取文字，對文字進行處理——這裡的處理要包括去除空格及各個標點符號。處理好的文字就是一串單詞，可以用list儲存。接下來，就是統計list中各單詞的重複次數了，最簡單的想法，應該是一個個遍歷，將之前未出現的錄入一

python練習冊第五題

題目你有一個目錄，裝了很多照片，把它們的尺寸變成都不大於 iPhone5 解析度（1136*640）的大小。解題思路涉及到圖片的都要用到Image模組，讀取圖片然後解析，解析後的字串中某個地方表示圖片的解析度，可以依此來判斷是否符合標準——如果不符合，就需要將圖片等比例壓縮到一個恰好合適的大小。

Python 練習冊，每天一個小程式(0004)

總的想法是讀檔案，將其餘字元過濾，使用字典結構來儲存結果，最後將結果儲存到本地的Excel檔案中參考資料： # -*- coding: utf-8 -*- import re impo

20170511 Python練習冊0000 將頭像右上角加上紅色的數字

figure 服務 .com 1.5 open 保存圖片 lan 顯卡驅動 type() 現在開始每天做一個Python小練習，第一個練習 #!/usr/bin/env python#-*- coding:utf8 -*-from PIL import Image, Ima

python練習冊每天一個小程序

註釋 and ati 註意繪圖 windows 操作 jpeg odi PIL庫學習鏈接：http://blog.csdn.net/column/details/pythonpil.html?&page=1 1 #-*-coding:utf-8-*- 2 _

python練習冊之14 15 16

第 0014 題：純文字檔案 student.txt為學生資訊, 裡面的內容（包括花括號）如下所示： { "1":["張三",150,120,100], "2":["李四",90,99,95], "3":["王五",60,66,68] } 請

Python 練習冊，每天一個小程式

第 0001 題：做為 Apple Store App 獨立開發者，你要搞限時促銷，為你的應用生成啟用碼（或者優惠券），使用 Python 如何生成 200 個啟用碼（或者優惠券）？第 0002 題: 將 0001 題生成的 200 個啟用碼（或者優惠券）儲存到

Python 練習冊，每天一個小程式----------000 圖片右上角加上紅色的數字

# -*- coding:utf-8 -*- #第 0000 題：右上角加上紅色的數字，類似於微信未讀資訊數量那種提示效果 #python 3.5.2 from PIL import Image, ImageDraw, ImageFont def add_num(fil

python入門-簡單基礎題練習

clas 不可多行註釋 elif str 例子密碼 if條件流程 '''1.簡述變量名稱規範（1）變量必須由字母，數字，下劃線組成。（2）變量不能是數字開頭，更不可以是純數字組成。（3）變量不能是python的關鍵詞。

【python練習】Mysql綜合練習作業50題

when join not in rem 檢索名稱同學 score har 表關系班級表：class 學生表：student cid caption grade_id sid sname gender class_id 1 一年一班 1

python 每日一練之0004題➕file方法（簡單版）

前文前幾天考試太多一直沒時間寫今天繼續正文路漫漫～今天做的第四題發現好像是蠻簡單的，但是看網上大佬們選擇的方法都是正則表示式，。。。我這裡貼出一個簡單的方法吧。為那些看不懂正則的小白們貼一貼 # -*- coding: utf-8 -*- def main(words): with

Python 從入門到入門基礎練習十五題

1、永遠的 HelloWorldprint("Hello World") 2、M與N的數學運算：使用者輸入兩個數 M 和 N，其中 N 是整數，計算M 和 N 的5種數學運算結果，並依次輸出，結果間用空格分隔。5種數學運算分別是：M 與 N 的和、M 與 N 的乘積、M 的

python練習_module02-1-員工信息表

註意最大空格 n) 輸入找到 true 之間進行 python 操作員工信息表要求：可進行模糊查詢，語法至少支持下面3種: select name,age from staff_table where age > 22select * from

python練習冊0004題

相關推薦