python練習冊第四題

阿新 • • 發佈：2018-11-26

題目

任一個英文的純文字檔案，統計其中的單詞出現的個數。

解題思路

上網找了一下思路。首先要讀取文字，對文字進行處理——這裡的處理要包括去除空格及各個標點符號。處理好的文字就是一串單詞，可以用list儲存。接下來，就是統計list中各單詞的重複次數了，最簡單的想法，應該是一個個遍歷，將之前未出現的錄入一個dict中，出現過的增加個數。

解決程式碼

寫起來很簡單。其中defaultdict與dict幾乎一樣，但可以起到設定預設值的作用，如果不存在就會設定預設值為0；也可以用條件判斷解決。

唯一的難點就是如何排序，dict型別是無法排序的，所以需要藉助函式sort，sort接收四個引數，第一個是iterable

，即可迭代引數，而dict就是iterable值。


import re
from collections import defaultdict


if __name__ == '__main__':
    w_dict = defaultdict(int)
    with open('subtitle.txt', 'r') as fp:
        for line in fp.readlines():
            s_list = re.split(r'[\s\,\.\?\"]+', line.strip())
            for w in s_list:
                w_dict[w] += 1   # 不會報錯，設定預設值為0 
    for w in sorted(w_dict, key=w_dict.get, reverse=True):
        print(w, w_dict[w])

修改

import re
from collections import defaultdict

# filter()也接收一個函式和一個序列。和map()不同的時，filter()把傳入的函式依次作用於每個元素，然後根據返回值是True還是False決定保留還是丟棄該元素。

if __name__ == '__main__':
    w_dict = defaultdict(int)
    with open('subtitle.txt', 'r') as fp:
        article = fp.read().replace('\n', ' ')
        s_list = re.split(r'[\s\,\.\?\"]+', article)
        s_list = [item for item in filter(lambda x: x != '', s_list)]  
        # 去掉空串，空串出現在最後一個逗號後面
        for w in s_list:
            w_dict[w] += 1
    for w in sorted(w_dict, key=w_dict.get, reverse=True):
        print(w, w_dict[w])

別人的程式碼

嗯，沒什麼好說的。。

import string


# simply extend word like: it's => it is
def extend_word(text):
    if text.find('\'') > 0:
        old2new = dict()
        words = text.split()
        for word in words:
            if word.find('\'') > 0:
                parts = word.split('\'')
                if parts[1] == 'm':
                    parts[1] = 'am'
                elif parts[1] == 's':
                    parts[1] = 'is'
                elif parts[1] == 're':
                    parts[1] = 'are'
                elif parts[1] == 't':
                    parts[1] = 'not'
                elif parts[1] == 've':
                    parts[1] = 'have'
                elif parts[1] == 'll':
                    parts[1] = 'will'
                elif parts[1] == 'd':
                    if words[words.index(word) + 1] == 'better':
                        parts[1] = 'had'
                    else:
                        parts[1] = 'would'
                if parts[0].endswith('n'):
                    parts[0] = parts[0][:-1]
                old2new[word] = ' '.join(parts)
        _text = text
        for old_word in old2new.keys():
            _text = _text.replace(old_word, old2new[old_word])
        return _text


def return_order_key(record):
    return record[1]


def show_in_order(records):
    items = sorted(records.items(), key=return_order_key, reverse=True)
    for item in items:
        print(item[0], item[1])

with open('subtitle.txt', 'r') as file:
    article = file.read()
    no_pun_text = article
    _punctuation = string.punctuation.replace('\'', '')
    for pun in _punctuation:
        no_pun_text = no_pun_text.replace(pun, '')
    complete_text = extend_word(no_pun_text)
    records = dict()
    for word in complete_text.lower().split():
        records[word] = records.get(word, 0) + 1
    show_in_order(records)

python練習冊第四題

題目任一個英文的純文字檔案，統計其中的單詞出現的個數。解題思路上網找了一下思路。首先要讀取文字，對文字進行處理——這裡的處理要包括去除空格及各個標點符號。處理好的文字就是一串單詞，可以用list儲存。接下來，就是統計list中各單詞的重複次數了，最簡單的想法，應該是一個個遍歷，將之前未出現的錄入一

python練習冊第零題

說明這個是網上一些大佬做的一套練習題，總共有25題，訓練大家python在檔案讀取、文字處理、資料庫、網頁等方向的熟練度，十分有用。github地址在這： python 練習冊每天一個小程式上不了github的可以直接搜名字，應該能搜到。我這個筆記集也是隻記了五道題。。。我大概多做了一兩題吧，

python練習冊第三題

題目將 0001 題生成的 200 個啟用碼（或者優惠券）儲存到 Redis 非關係型資料庫中。解題思路難點是壓根不知道redis怎麼用。好在找到了一些文章快速學了些：使用python操作redis python: redis介紹及簡單應用 python(十一)下：Redis安裝配置及使用詳解

python練習冊第五題

題目你有一個目錄，裝了很多照片，把它們的尺寸變成都不大於 iPhone5 解析度（1136*640）的大小。解題思路涉及到圖片的都要用到Image模組，讀取圖片然後解析，解析後的字串中某個地方表示圖片的解析度，可以依此來判斷是否符合標準——如果不符合，就需要將圖片等比例壓縮到一個恰好合適的大小。

python練習冊每天一個小程序第0002題

color == oot 關系型數據庫 auth creat user root mdb 1 #-*-coding:utf-8-*- 2 __author__ = ‘Deen‘ 3 ‘‘‘ 4 題目描述： 5 將 0001 題生成的 200 個激活碼

python練習冊每天一個小程序第0010題

rgb pytho 進行 lur return n) dom randint window # -*-coding:utf-8-*- ‘‘‘ 題目描述：使用 Python 生成類似於下圖中的字母驗證碼圖片思路：運用PIL庫加random 隨機字母進行生成

python練習冊第一題

題目做為 Apple Store App 獨立開發者，你要搞限時促銷，為你的應用生成啟用碼（或者優惠券），使用 Python 如何生成 200 個啟用碼（或者優惠券）？解題思路上網搜了一下生成隨機字串的方法，除了猜想中類似C的random()方法，令我驚訝的是uuid模組也可以起到隨機的作用，

python練習冊第二題

題目將 0001 題生成的 200 個啟用碼（或者優惠券）儲存到 MySQL 關係型資料庫中。解決思路基本步驟應該是：讀取檔案 --> 解析字元 --> 開啟資料庫 --> 存入後關閉。其中涉及python操作mysql資料庫的我還不是很熟悉。 py3.6我是用pymysql作

python練習冊0004題

在任意一個英文文件中，統計單詞出現的次數，分析: 本題不是很難，單詞通常以空格隔開，但是有些單詞後面跟一些特殊符號，只需把這些特殊符號替換掉就可以了，程式碼一 1 import re 2 3 file_name = 'code.txt' 4 5 lines_count = 0 6 wor

C primer plus 第六版第十章第四題程式設計練習答案

Github地址：φ(>ω<*)這裡這裡。 /* 本程式應習題-4 建立。題目要求：編寫一個函式，返回儲存在 double 型別陣列中的最大值的下標，並在一個簡單的程式中測試該函式。 */ &n

C primer plus 第六版第十一章第四題程式設計練習答案

Github地址：φ(>ω<*)這裡這裡。 /* 本次任務設計並測試一個函式，要求有任務3建立的函式的功能，並新增第二個引數控制最大讀入字元數量。 */ #include<stdio.h> #define o 100 vo

LeetCode 第四題：兩個排序陣列的中位數 --C++/Python

class Solution { public: double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) { int len1 = nums1.size();

C primer plus 第六版第八章第四題程式設計練習答案

/* 本程式應題目而建立。題目要求：遇到EOF之前，將輸入作為字元流讀取。該程式要求報告平均每個單詞的字母數。 */ /* 邏輯 - 程式碼構建本題實現要求的核心結構就是使用標頭檔案 ctyp

20170511 Python練習冊0000 將頭像右上角加上紅色的數字

figure 服務 .com 1.5 open 保存圖片 lan 顯卡驅動 type() 現在開始每天做一個Python小練習，第一個練習 #!/usr/bin/env python#-*- coding:utf8 -*-from PIL import Image, Ima

博弈論（noip普及組2010第四題三國遊戲）

三國勝利沒有 blog hang max efi () turn 小涵很喜歡電腦遊戲，這些天他正在玩一個叫做《三國》的遊戲。在遊戲中，小涵和計算機各執一方，組建各自的軍隊進行對戰。遊戲中共有 N 位武將（N為偶數且不小於 4），任意兩個武將之間有一個“默

Python開發【第四篇】：Python基礎之函數

nco pos *args 更強三元 sequence hunk ins att 三元運算三元運算（三目運算），是對簡單的條件語句的縮寫。 # 書寫格式 result = 值1 if 條件 else 值2 # 如果條件成立，那麽將 “值1” 賦值給result

python預習－第四節

4.4 第四節 list elif eight float idt see height ＃遍歷列表所有元素 #!/usr/bin/python# -*- coding: UTF-8 -*- listm=["s","l","z","x","l","m","XX",[12

python練習冊每天一個小程序

註釋 and ati 註意繪圖 windows 操作 jpeg odi PIL庫學習鏈接：http://blog.csdn.net/column/details/pythonpil.html?&page=1 1 #-*-coding:utf-8-*- 2 _

hiho_offer收割18_題解報告_差第四題

read () value 調試一個數時間大於 fin 個數 I.求逆元歐幾裏得方法 II.模擬細心+耐心 *本人感悟：自己的錯誤在於：對於這道模擬題沒有耐心靜下來一字一字看題，一行一行調錯，一步一步調試，我要引以為戒。 III.dpf[i][j][k]=max(f[

2002普及組第四題過河卒

upload eight print 比較通過 pro online ret 過河題目描述如圖，A 點有一個過河卒，需要走到目標 B 點。卒行走規則：可以向下、或者向右。同時在棋盤上的任一點有一個對方的馬（如上圖的C點），該馬所在的點和所有跳躍一步可達的點稱為對方馬

python練習冊第四題

題目

解題思路

解決程式碼

修改

別人的程式碼

相關推薦