1. 程式人生 > >Spark實戰練習01--XML數據處理

Spark實戰練習01--XML數據處理

提取 pan account 實戰練習 count park mes 文件 acc

一、要求

將XML中的數據提取出來,並以account_number:model格式存儲

1、XML文件數據格式

<activations>
  <activation timestamp="1225499258" type="phone">
  <account-number>316</account-number>
  <device-id>
    d61b6971-33e1-42f0-bb15-aa2ae3cd8680
  </device-id>
  <phone-number>5108307062</phone-number>

  <model>iFruit 1</model>
  </activation>

</activations>
2、存儲格式:

1234:iFruit 1
987:Sorrento F00L
4566:iFruit 1

Spark實戰練習01--XML數據處理