047 一維資料的格式化和處理
阿新 • • 發佈:2020-12-13
目錄
一、概述
- 資料組織的維度
- 一維資料的表示
- 一維資料的儲存
- 一維資料的處理
二、資料組織的維度
2.1 從一個數據到一組資料
2.2 維度:一組資料的組織形式
2.3 一維資料
由對等關係的有序或無序資料構成,採用線性方式組織
3.1413, 3.1398, 3.1404, 3.1401, 3.1349, 3.1376
- 對應列表、陣列和集合等概念
2.4 二維資料
由多個一維資料構成,是一維資料的組合形式
表格是典型的二維資料,其中,表頭是二維資料的一部分
2.5 多維資料
由一維或二維資料在新維度上擴充套件形成
2.6 高維資料
僅利用最基本的二元關係展示資料間的複雜結構
2.7 資料的操作週期
儲存 <-> 表示 <-> 操作
三、一維資料的表示
3.1 如果資料間有序:使用列表型別
ls = [3.1398, 3.1349, 3.1376]
- 列表型別可以表達一維有序資料
- for迴圈可以遍歷資料,進而對每個資料進行處理
3.2 如果資料間無序:使用集合型別
st = {3.1398, 3.1349, 3.1376}
- 集合型別可以表達一維無序資料
- for迴圈可以遍歷資料,進而對每個資料進行處理
四、一維資料的儲存
4.1 儲存方式一:空格分隔
中國 美國 日本 德國 法國 英國 義大利
- 使用一個或多個空格分隔進行儲存,不換行
- 缺點:資料中不能存在空格
4.2 儲存方式二:逗號分隔
中國,美國,日本,德國,法國,英國,義大利
- 使用英文半形逗號分隔資料進行儲存,不換行
- 缺點:資料中不能有英文逗號
4.3 儲存方式三:其他方式
中國$美國$日本$德國$法國$英國$義大利
- 使用其他符號或符號組合分隔,建議採用特殊符號
- 缺點:需要根據資料特點定義,通用性較差
五、一維資料的處理
5.1 資料的處理
儲存 <-> 表示
- 將儲存的資料讀入程式
- 將程式表示的資料寫入檔案
5.2 一維資料的讀入處理
5.2.1 從空格分隔的檔案中讀入資料
中國 美國 日本 德國 法國 英國 義大利
txt = open(fname).read()
ls = txt.split()
f.close()
print(ls) # ['中國', '美國', '日本', '德國 ', '法國', '英國', '義大利']
5.2.2 從特殊符號分隔的檔案中讀入資料
中國$美國$日本$德國$法國$英國$義大利
txt = open(fname).read()
ls = txt.split('$')
f.close()
print(ls) # ['中國', '美國', '日本', '德國 ', '法國', '英國', '義大利']
5.3 一維資料的寫入處理
5.3.1 採用空格分隔方式將資料寫入檔案
ls = ['中國', '美國', '日本']
f = open(fname, 'w')
f.write(' '.join(ls))
f.close()
5.3.2 採用特殊分隔方式將資料寫入檔案
ls = ['中國', '美國', '日本']
f = open(fname, 'w')
f.write('$'.join(ls))
f.close()
六、單元小結
6.1 一維資料的格式化和處理
- 資料的維度:一維、二維、多維、高維
- 一維資料的表示:列表型別(有序)和集合型別(無序)
- 一維資料的儲存:空格分隔、逗號分隔、特殊符號分隔
- 一維資料的處理:字串方法 .split() 和 .join()