1. 程式人生 > >Hadoop HDFS SequenceFile

Hadoop HDFS SequenceFile

SequenceFile 是一個由二進位制序列化過的 key/value 的位元組流組成的文字儲存檔案,它可以在map/reduce過程中的input/output 的format時被使用。在map/reduce過程中,map處理檔案的臨時輸出就是使用SequenceFile處理過的。 所以一般的SequenceFile均是在FileSystem中生成,供map呼叫的原始檔案。