1. 程式人生 > 實用技巧 >047 一維資料的格式化和處理

047 一維資料的格式化和處理

目錄

一、概述

  • 資料組織的維度
  • 一維資料的表示
  • 一維資料的儲存
  • 一維資料的處理

二、資料組織的維度

2.1 從一個數據到一組資料

2.2 維度:一組資料的組織形式

2.3 一維資料

由對等關係的有序或無序資料構成,採用線性方式組織

3.1413, 3.1398, 3.1404, 3.1401, 3.1349, 3.1376

  • 對應列表、陣列和集合等概念

2.4 二維資料

由多個一維資料構成,是一維資料的組合形式

表格是典型的二維資料,其中,表頭是二維資料的一部分

2.5 多維資料

由一維或二維資料在新維度上擴充套件形成

2.6 高維資料

僅利用最基本的二元關係展示資料間的複雜結構

2.7 資料的操作週期

儲存 <-> 表示 <-> 操作

三、一維資料的表示

3.1 如果資料間有序:使用列表型別

ls = [3.1398, 3.1349, 3.1376]

  • 列表型別可以表達一維有序資料
  • for迴圈可以遍歷資料,進而對每個資料進行處理

3.2 如果資料間無序:使用集合型別

st = {3.1398, 3.1349, 3.1376}

  • 集合型別可以表達一維無序資料
  • for迴圈可以遍歷資料,進而對每個資料進行處理

四、一維資料的儲存

4.1 儲存方式一:空格分隔

中國 美國 日本 德國 法國 英國 義大利

  • 使用一個或多個空格分隔進行儲存,不換行
  • 缺點:資料中不能存在空格

4.2 儲存方式二:逗號分隔

中國,美國,日本,德國,法國,英國,義大利

  • 使用英文半形逗號分隔資料進行儲存,不換行
  • 缺點:資料中不能有英文逗號

4.3 儲存方式三:其他方式

中國$美國$日本$德國$法國$英國$義大利

  • 使用其他符號或符號組合分隔,建議採用特殊符號
  • 缺點:需要根據資料特點定義,通用性較差

五、一維資料的處理

5.1 資料的處理

儲存 <-> 表示

  • 將儲存的資料讀入程式
  • 將程式表示的資料寫入檔案

5.2 一維資料的讀入處理

5.2.1 從空格分隔的檔案中讀入資料

中國 美國 日本 德國 法國 英國 義大利

txt = open(fname).read()
ls = txt.split()
f.close()
print(ls)  # ['中國', '美國', '日本', '德國 ', '法國', '英國', '義大利']

5.2.2 從特殊符號分隔的檔案中讀入資料

中國$美國$日本$德國$法國$英國$義大利

txt = open(fname).read()
ls = txt.split('$')
f.close()
print(ls)  # ['中國', '美國', '日本', '德國 ', '法國', '英國', '義大利']

5.3 一維資料的寫入處理

5.3.1 採用空格分隔方式將資料寫入檔案

ls = ['中國', '美國', '日本']
f = open(fname, 'w')
f.write(' '.join(ls))
f.close()

5.3.2 採用特殊分隔方式將資料寫入檔案

ls = ['中國', '美國', '日本']
f = open(fname, 'w')
f.write('$'.join(ls))
f.close()

六、單元小結

6.1 一維資料的格式化和處理

  • 資料的維度:一維、二維、多維、高維
  • 一維資料的表示:列表型別(有序)和集合型別(無序)
  • 一維資料的儲存:空格分隔、逗號分隔、特殊符號分隔
  • 一維資料的處理:字串方法 .split() 和 .join()