用 jupyter notebook 開啟 oui.txt 檔案出現的問題及解決方案

阿新 • • 發佈：2018-12-25

問題背景：下載了2018 IEEE 最新的 oui.txt 檔案。裡面包含了裝置 MAC 地址的前六位對應的廠商。要做的工作是，將海量裝置的 MAC 地址與 oui.txt 檔案的資訊比對，統計出蘋果，華為，小米，OPPO，VIVO 這5家廠商的佔比情況。oui.txt 文件裡面的內容如下圖所示。

oui.txt 檔案中有很多冗餘資訊。現在只關心前 6 位 mac 地址和五個廠商的對應關係。所以，對 oui.txt 裡的資料清洗一下。

處理 oui.txt 出現的問題：

1.按照下面的寫法，會報錯

1 with open('data/oui.txt') as f:
2     for 
 line in f.readlines():
3         if('Apple' in line and '-' not in line):
4             print(line)

看來是編碼問題，搜尋了別人相關問題的回答，然後嘗試方法2：

1 with open('data/oui.txt', encoding='gb18030') as f:
2     for line in f.readlines():
3         if('Apple,' in line and '-' not in line):
4             print(line)

結果依舊出錯。

再次嘗試下面的的程式碼：

1 with open('data/oui.txt', encoding='gb18030', errors='ignore') as f:
2     for line in f.readlines():
3         if('Apple,' in line and '-' not in line):
4             print(line)

就成功了。但是不太理解這個 error=‘ignore’ 會不會讓我需要的資訊漏讀。

聰明的大虎給我提供了一個思路：可以用 utf-8

所以改成下面的樣子：

1 with open('data/oui.txt', encoding='utf-8') as f:
2     for line in f.readlines():
3         if('Apple,' in line and '-' not in line):
4             print(line)

這次成功，完全讀取出來了，整理出的格式如下：IEEE分配給蘋果的前六位mac地址太多，這裡只展示一部分。

果然，看書敲程式碼學習是一回事，自己做東西出來是另外一回事

用 jupyter notebook 開啟 oui.txt 檔案出現的問題及解決方案

問題背景：下載了2018 IEEE 最新的 oui.txt 檔案。裡面包含了裝置 MAC 地址的前六位對應的廠商。要做的工作是，將海量裝置的 MAC 地址與 oui.txt 檔案的資訊比對，統計出蘋果，華為，小米，OPPO，VIVO 這5家廠商的佔比情況。oui.txt 文件裡面的內容如下圖所示。 ou

在Jupyter Notebook下使用遇到的問題以及解決方案

問題我們在利用python程式設計時會經常遇到這樣的情況，明明有些庫已經安裝了，為什麼在使用Jupyter Notebook執行時，會提示 xxx module is not found這樣的bug. 原因因為在Jupyter Notebook下的模式和我們平時用的模式是不同的，我們

[Hadoop]大量小檔案問題及解決方案

1. HDFS上的小檔案問題小檔案是指檔案大小明顯小於HDFS上塊（block）大小（預設64MB）的檔案。如果儲存小檔案，必定會有大量這樣的小檔案，否則你也不會使用Hadoop（If you’re storing small files, then you probably have lot

win10下用vritualbox下安裝redhat黑屏原因及解決方案

背景，想裝個虛擬機器。當前環境，win10，聯想小新。其他版本資訊： vritualbox 5.2.22 映象 rhel-server-7.0-x86_64-dvd.iso 利用vritualbox安裝虛擬機器的過程不贅述，在新建後，選擇iso，然

HDFS小檔案處理及解決方案

小檔案為什麼會成為問題？小檔案的解決方案包括哪些？有沒有自己的解決方案？Hadoop Archive具體是如何處理小檔案的？Sequence file是如何解決小檔案的？CombineFileInputFormat是如何解決小檔案的？1、概述小檔案是指檔案size小於H

第一篇-Win10開啟txt檔案出現中文亂碼

如果剛開始安裝的是英文的Win10系統，那麼開啟txt檔案時很容易出現亂碼問題。包括開啟cmd視窗，也是不能顯示中文的。當然，麻煩的處理方法是：在cmd中想要顯示中文：先輸入chcp 936，之後中文就可以正常顯示。 txt檔案中想能夠看見中文，就在儲存檔案時點選另存為，然後選擇旁邊的編碼為utf-8，

怎麼修改Jupyter Notebook開啟的目錄

簡單兩步走：（1）開啟anaconda3裡面的Anaconda Prompt（它是windons系統中的cmd命令頁，只不過它直接進到了Anacinda目錄下，它可以直接開啟python以及執行python還有直接開啟Anaconda的其他軟體）（2）輸入cd /d E:&n

用python生成多個txt檔案

在win下建立多個.txt檔案，參考下面的程式碼 for i in range(1000): i_str = str(i+1) file_name = i_str+ '.txt' f = open('a/'+file_name,'w') f.close() 在

【OS大作業】用多執行緒統計txt檔案中字元個數（Java實現）

問題描述給定一個txt檔案，利用不同個數的執行緒查詢檔案中某字元的個數，探究執行緒個數與查詢時間的關係。本作業程式碼使用JAVA實現，版本為10.0.2，使用的IDE為Eclipse4.9.0. 結果測試所用的txt檔案內容為英文，編碼格式為UTF-8。原始碼第一版程式碼：（

詳述解決jupyter notebook開啟瀏覽器空白

之前jupyter notebook一直在360瀏覽器下開啟，今天重灌了anaconda之後，發現開啟jupyter notebook，home頁面空白。解決辦法：更換預設的瀏覽器，選擇谷歌瀏覽器，很多360打不開的頁面，更換谷歌後都能有效解決。 1、找到anaconda下的anacond

雙擊預設notepad++開啟的txt檔案總是提示安裝以及如何notepad++設定預設開啟txt、java檔案

1.用notepad++開啟txt檔案選擇要開啟的檔案→右鍵→開啟方式→選擇其他開啟方式→把下面的始終使用此應用開啟.txt檔案勾上→選擇notepad++→確定注意！！！不要把應用選錯了！我當初選了notepad++的安裝檔案，然後每次雙擊檔案都要安裝。百度死了也沒人遇到這種問題。後來

jupyter notebook中呼叫.ipynb檔案

1、新增jupyter notebook解析檔案首先，建立一個python檔案，命名為Ipynb_importer.ipynb，直接貼上下面的程式碼。 import io, os,sys,types from IPython import get_ipython f

oui.txt檔案的格式化操作以及db檔案的重寫

Organizationally unique identifier (OUI) “組織唯一識別符號”，是IEEE分發給各個廠家的唯一MAC識別符號。我們知道，裝置的MAC地址由12位數字和字母混合組成，這裡需要注意的是：MAC地址的前六位代表唯一的廠商，且MAC地址

解決linux下開啟windows .txt檔案中文亂碼問題

出現這種情況的原因為兩種作業系統的中文壓縮方式不同，在windows環境中中文壓縮一般為gbk，而在linux環境中為utf8，這就導致了在windows下能正常顯示 txt檔案在linux環境下開啟呈現了亂碼狀態。解決方法：在linux用iconv命令，如亂碼檔名為test.txt，那麼

用Jupyter Notebook學習https://github.com/GokuMohandas

一個印度小哥寫的AI教程，看了開頭的三篇，感覺還是很通俗易懂的。作者推薦使用Google Colab，也可以用Jupyter Notebook在本地學習。https://github.com/GokuMohandas/practicalAI 以下是目錄：安裝Jupyter Notebook (ht

,編寫一個程式,將a.txt檔案中的單詞與b.txt檔案中的單詞交替合併到c.txt檔案中,a.txt檔案中的單詞用回車符分隔,b.txt檔案中用回車或空格進行分隔.

在java面試寶典看到這樣一題，看到答案真蛋疼，看了半天才明白,可能每個人的想法不一樣！答案也不知道是那位前輩寫的，讓人理解起來太費精了！老饒彎子，以下是本人自已整理的，去面試如果真有這麼一題，應該不成問題了。。。。。。。如有不是的地方還望指點 package accp

JAVA Web專案中用OpenOffice+Swftools+Flexpaper實現線上預覽，txt檔案出現亂碼！

在幼兒園管理系統中，實現線上預覽功能。當上傳word、ppt、excel、pdf的時候，不會出現亂碼；當上傳txt檔案的時候（編碼除UTF-8之外），會出現亂碼。當時有兩個方案。方案一：在上傳txt檔案的時候，判斷其編碼是否為UTF-8，如果不是，提示框：提示使用者上傳

在ubuntu Pycharm 中開啟txt檔案的亂碼解決方法

由於在window和ubuntu下的編碼方式不同，用pycharm開啟window下的txt檔案會出現亂碼問題，該怎麼辦呢？在Setting--》Editor-->File Encodings中的IDE Encoding和Project Encoding改成GBK

java讀取txt檔案出現中文亂碼

在保證程式碼沒有問題的前提下，讀取txt檔案出現瞭如下亂碼。解決方法： 1.檢視檔案程式碼的編碼方式是否是ANSI（我使用的文字編輯器為EditPlus） 2.檢視.txt檔案的編碼方式是否是ANSI 修改儲存，結果如下這裡附如上讀取txt檔案的程式

修改jupyter notebook開啟的瀏覽器

Windows 下jupyter notebook 修改開啟的瀏覽器：1.2. 開啟C:\Users\Administrator\.jupyter\jupyter_notebook_config.py新增import webbrowserwebbrowser.register

用 jupyter notebook 開啟 oui.txt 檔案出現的問題及解決方案

相關推薦