[參考]對莎士比亞英語文段的字頻分析

阿新 • • 發佈：2021-10-13

根據密碼學的明文推斷中的統計學規律，一個英語文段中字母字頻有一定的規律。因而對莎士比亞的多份作品做了基本的字頻分析。

指令碼

import sys
import csv

if(len(sys.argv) != 2):
    exit(-2)

filename = sys.argv[1]
alphabet = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890"#所有正常列印字元
strings = open(filename).read()#讀取需要統計頻數的文字

len = len(strings)

result = {}
for i in alphabet:
    counts = strings.count(i)
    i = '{0}'.format(i)
    result[i] = counts

res = sorted(result.items(), key=lambda item: item[1], reverse=True)
num = 0
print("Statistic file "+ filename+" ...")
print("Result sheet will be saved to "+filename+".analysis.csv\n")

for data in res:
    num += 1
    print("Char '" + data[0] + "' appeared "+ str(data[1]) + "times with percentage "+ str( 100 * data[1]/len) + "%")

print('\nRESULT')

for i in res:
    flag = str(i[0])
    print(flag[0], end="")

with open(filename+".analysis.csv", "w",encoding='utf-8',newline='') as csvfile:  # 開啟檔案

    writer = csv.writer(csvfile)

    #先寫入columns_name
    writer.writerow(["char","count"])
    #寫入多行用writerows
    writer.writerows(res)

示例資料（以hamlet_TXT_FolgerShakespeare.txt.analysis.csv為例）

csv檔案
此分析檔案包含了對整個個文段，即資料夾/text下的對應文章的字元個數分析結果。

.txt.output.txt檔案
此檔案格式如下

Statistic file hamlet_TXT_FolgerShakespeare.txt ... 
#從hamlet_TXT_FolgerShakespeare.txt統計字頻
Result sheet will be saved to hamlet_TXT_FolgerShakespeare.txt.analysis.csv
#將此字頻表儲存到hamlet_TXT_FolgerShakespeare.txt.analysis.csv

Char 	'e' appeared 	14843 times	(8.396026834704106%)
#字元	   'e'出現了		14843次，頻率為8.396026834704106%
Char 	't' appeared 	10981 times	(6.211464708743905%)
#...
Char 	'8' appeared 	0 times	(0.0%)

Sorting result:
#按照出現先後排序
etoasnhirldumywfcgpbTAIvEkHLONRMSWGPUBCDFKxYQqjzVZJ123450679X8

下載附件

[參考]對莎士比亞英語文段的字頻分析

根據密碼學的明文推斷中的統計學規律，一個英語文段中字母字頻有一定的規律。因而對莎士比亞的多份作品做了基本的字頻分析。

遊戲《文豪格鬥》上架 Steam：莎士比亞大戰海明威

7 月 20 日訊息Steam 商城近日上架了一款很有創意的格鬥遊戲《文豪格鬥（Write \'n\' Fight）》。顧名思義，該遊戲將彙集歷史上的各大文豪，讓他們像武者那樣進行擂臺格鬥。

比亞迪：擬對汽車工業、比亞迪汽車及比亞迪供應鏈增資

2月2日訊息比亞迪今日釋出公告，公司擬對全資子公司比亞迪汽車工業有限公司增資 8.5 億美元或等值人民幣，對控股子公司比亞迪汽車增資 30 億元人民幣，對全資子公司比亞迪供應鏈增資 30 億元人民幣。

比亞迪漢銷量神話背後：4S 店全面對標特斯拉 Model 3，現場能對比試駕

售價 20 多萬的新能源車比亞迪漢在國內徹底火了。官方資料顯示，去年 11 月至今，比亞迪漢已連續 3 個月達成月銷量突破 1 萬臺的成就。2021 年 1 月~ 2 月，在全國私人純電動乘用車上險數排行榜裡，比亞迪漢排在第

小米、努比亞公開“對線”：沒有 XXX，好意思說自己是遊戲手機

5 月 24 日訊息努比亞即將釋出騰訊紅魔遊戲手機 6R，今日也是出現了數碼圈比較少見的一幕，小米、努比亞雙方高管親自下場“對線”，互噴對方手機不能稱為遊戲手機。

比亞迪王傳福：通過超級混動 DM-i 加速新能源車對燃油車的替代

6 月 14 日訊息從比亞迪獲悉，6 月 13 日，2021 中國汽車重慶論壇舉行，比亞迪股份有限公司董事長兼總裁王傳福參會並發表演講。

比亞迪半導體宣佈漲價：對 IPM、IGBT 單管產品提價不低於 5 %

6 月 21 日訊息據集微網，比亞迪半導體近日向其客戶發出了漲價通知函，稱公司決定從 2021 年 7 月 1 日起對 IPM、IGBT 單管產品進行價格調整，提漲幅度不低於 5%，即日起在途和未交訂單按照新價格執行。

比亞迪王傳福：電動車對半導體的需求較傳統車增加 5-10 倍

近日，比亞迪集團董事長兼總裁王傳福表示，汽車電動化帶來百年未有的大變革，產業供應鏈體系發生重構。“在半導體領域，電動車對半導體的需求相較傳統車對半導體的需求增加 5-10 倍。但是因為‘缺芯’，全球大約 700

自家產能緊張，訊息稱比亞迪向士蘭微、華潤微、斯達半導、時代電氣等下達車規級 IGBT 訂單

12 月 9 日訊息，據財聯社，從知情人士處獲悉，比亞迪已經正式下單士蘭微車規級 IGBT，訂單金額達億元級。該知情人士稱，“一方面是比亞迪半導體產能確實緊張，另一方面是為了壓縮與比亞迪集團的關聯交易。獲得訂單

比亞迪：子公司與戴姆勒擬分別對騰勢新能源增資 10 億元

12 月 24 日訊息，比亞迪今日晚間在深交所公告稱，控股子公司比亞迪汽車工業與戴姆勒擬按持股比例分別對騰勢新能源以貨幣方式增資 10 億元。雙方股東增資完成後，比亞迪汽車工業和戴姆勒將分別繼續持有騰勢新能源 5

比亞迪：西安疫情對秦 PLUS DM-i 混動等車型生產有影響，正在積極協調應對

比亞迪昨日表示，此次疫情對西安園區的生產有些影響，正在積極協調應對。據陝西省衛健委網站，12 月 23 日 0-24 時，陝西新增報告本土確診病例 52 例。自 12 月 9 日以來，全省累計報告本土確診病例 264 例 (西安市

比亞迪：對提供網路黑公關線索及證據獎勵 5 萬至 100 萬人民幣

12 月 28 日訊息，據“比亞迪網路舉報中心”微信公眾號訊息，為響應網信辦“清朗”系列行動要求，打擊網路黑公關亂象，維護比亞迪品牌形象，即日起，比亞迪決定徵集有關對比亞迪進行黑公關操作的線索及證據，經比亞

英偉達公佈自動駕駛新平臺，新增 Lucid 和比亞迪為合作伙伴

據國外媒體報道，22 日晚間，英偉達在 GTC 2022 大會上宣佈其自動駕駛晶片 Orin 於本月正式投產銷售，同時還公佈了公司新一代汽車自動駕駛技術平臺“Drive Hyperion 9”。英偉達還宣佈新增比亞迪和 Lucid Group 兩家

比亞迪：年初西安疫情對生產有影響，其他影響較小

4 月 15 日訊息，據中證報報道，比亞迪相關負責人就“上海等地疫情對汽車供應鏈造成的影響”問題迴應稱，疫情反覆，許多車企受到不同程度的影響。比亞迪情況相對好一些，年初西安疫情對生產有影響，其他地方影響較小

努比亞65W氮化鎵多彩系列充電器今日10點開售，到手價109元

9月27日訊息此前努比亞上架了 65W 氮化鎵 Candy 多彩系列充電器，這款充電器將於今日 10:00 開售，到手價 109 元。

對標 GTX 1650 ？英特爾新款遊戲獨顯曝光：搭載 1024 流處理器

10 月 10 日訊息英特爾現已公佈 Xe 架構 GPU ，Xe-LP 系列為核顯和入門級獨顯（DG1），Xe-HP 則為遊戲愛好者設計。現在，爆料者 @APISAK 在資料庫中找到了一款 1024 流處理器的 Xe GPU，預計是一款遊戲級獨顯。

比亞迪9月份銷售新能源汽車19881輛，同比增長45.32%

10 月 10 日訊息，電動汽車製造商比亞迪釋出公告稱，今年 9 月份，該公司的新能源汽車銷量為 19881 輛，與去年同期的 13681 輛相比，同比增長 45.32%。

比亞迪入股晶片製造商 “華大北斗” 持股比例 6.93%

10 月 19 日訊息企查查 APP 顯示，10 月 15 日，深圳華大北斗科技有限公司發生工商變更，新增股東比亞迪（002594）等共 5 名股東，其中比亞迪（002594）持股 6.93%。

第三批新能源汽車下鄉名單出爐：共 9 款車型，比亞迪元 EV535、秦 EV 在列

10月20日訊息今日上午，比亞迪港股漲幅擴大至 5% 左右。截至發稿時，比亞迪漲4.83% 報 134.6 港元。此前，第三批新能源汽車下鄉名單出爐，比亞迪元 EV535、秦 EV 在列。

比亞迪相關人士：華為與比亞迪合作開發麒麟晶片“不屬實”，海思稱其不太清楚

1月22日訊息據財聯社今日報道，就華為與比亞迪合作開發麒麟晶片一事，有比亞迪相關人士迴應表示：“該訊息不屬實”。

[參考]對莎士比亞英語文段的字頻分析

相關推薦