python 統計檔案中的字串數目示例

阿新 • • 發佈：2020-01-09

題目：

一個txt檔案中已知資料格式為：

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

統計每個欄位出現的次數，比如C4D、maya

先讀取檔案，將檔案中的資料抽取出來：

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若讀取結束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

說明：這個有一個要注意的地方是檔案是被”\n”,”/”兩種格式分割而來的，因此需要split兩次。

然後定義一個dict，遍歷資料，程式碼如下所示：

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函式的呼叫：

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

結果：

{'C4D': 9,'max': 1,'su': 1,'maya': 1,'AE': 3}

說明：

1，

print(type(word)) 
print(type(splitData[0]))

輸出為：

<class 'list'>
<class 'str'>

就是當splitData.extend()執行之後就將原本是list型別的資料轉換成str型別的儲存起來。只有對str型別的資料才能用split函式

2，

import os 
print(os.getcwd())

這個可以輸出當前所在位置，對於讀取檔案很有用。

在讀入檔案並對檔案進行切分的時候，若是含有的切分詞太多，那麼使用re.split()方法是最方便的，如下所示：

filepath='data/new.txt'
file = open(filepath)    #讀取檔案
wordOne=[]
symbol = '\n/'       #定義分隔符
symbol = "["+symbol+"]"   #拼接正則表示式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通過上式得到的list中會含有很多的空字串，所以要去空
wordOne = [x for x in wordOne if x]

以上這篇python 統計檔案中的字串數目示例就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

python 統計檔案中的字串數目示例

題目：一個txt檔案中已知資料格式為： C4D C4D/maya C4D C4D/su C4D/max/AE 統計每個欄位出現的次數，比如C4D、maya

Linux中統計檔案和目錄數目

思路：管道命令 + 正則表示式 1、執行ls -l命令之後，終端輸出的結果是一行一行的字元，每一行字元對應一個目錄或者是檔案，如果是檔案的話，該行的字串資訊的第一個字元顯示的是“-”，如果是目錄的話，該

python統計字母在字串中出現的次數

技術標籤：Pythonpython統計次數程式碼第一行輸入一個由字母和數字以及空格組成的字串，第二行輸入一個字母，不區分大小寫

shell基礎---AWK+UNIQ+SORT 統計檔案中某字串出現次數並排序

在伺服器開發中，我們經常會寫入大量的日誌檔案。有時候我們需要對這些日誌檔案進行統計。Linux中我們可以利用以下命令簡單高效的實現這一功能。

Python統計分析模組statistics用法示例

本文例項講述了Python統計分析模組statistics用法。分享給大家供大家參考，具體如下：

Python從檔案中讀取指定的行以及在檔案指定位置寫入

Python從檔案中讀取指定的行如果想根據給出的行號，從文字檔案中讀取一行資料， Python標準庫linecache模組非常適合這個任務:

python統計文章中單詞出現次數例項

python統計單詞出現次數做單詞詞頻統計，用字典無疑是最合適的資料型別，單詞作為字典的key，單詞出現的次數作為字典的 value，很方便地就記錄好了每個單詞的頻率，字典很像我們的電話本，每個名字關聯一個電話號碼

Python提取視訊中圖片的示例（按幀、按秒）

一、按幀提取 #coding=utf-8 import os import cv2 def save_img():#提取視訊中圖片按照每幀提取

Python從檔案中讀取資料的方法步驟

一、讀取整個檔案內容在讀取檔案之前，我們先建立一個文字檔案resource.txt作為原始檔。

統計一個文字檔案中字元的個數//統計檔案中文字的行數

1 //統計一個文字檔案中字元的個數 2 package classwork10; 3 4 import java.io.FileInputStream;

【python】python刪去檔案中的回車、空格等

技術標籤：pythonpython 文章目錄參考原始碼使用後續英語渣在看外國文獻時喜歡谷歌成段直接翻譯，但是pdf文字直接貼上存在換行符，谷歌翻譯不能識別，所以用python刪去。這個故事告訴大家要好好學英語。

python讀取檔案中的資料插入到mysql

1、python讀取檔案中的資料插入到mysql https://blog.csdn.net/weixin_46429290/article/details/119303393?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_title~default-0-119303393-blog-7

python提取檔案中所有ip

引用正則表示式 import re, socket ip_lists = []ip_regex = re.compile(r\'(25[0-5]|2[0-4][0-9]|[0-1]?[0-9]?[0-9])\\.(25[0-5]|2[0-4][0-9]|[0-1]?[0-9]?[0-9])\\.(25[0-5]|2[0-4][0-9]|[0-1]?[0-9]?[0-9])\\.(25