SparkStream檔案監控和資料讀取

阿新 • • 發佈：2018-12-30

程式碼

package main.scala

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.slf4j.LoggerFactory
/**
  * Created by silentwolf on 2016/5/23.
  */
object FileRead {

  val log = LoggerFactory.getLogger(classOf[HdfsCount])
  def main(args: Array[String]) {
    if (args.length < 1) {
      System.err.println("Usage: HdfsWordCount <directory>")
      System.exit(1)
    }

    val sparkConf = new SparkConf().setAppName("HdfsCount").setMaster("local[2]")
    // Create the context
    val ssc = new StreamingContext(sparkConf, Seconds(10))

    val lines = ssc.textFileStream(args(0))
    lines.map(line => {
      val json = line+"2222222222222"
      println("-----------------" )
      println(json)
      println("-----------------" )
    }).print()

    ssc.start()
    ssc.awaitTermination()
  }
}

啟動

（備註：注意檢視/spark/bin/./spark-submit 的方法）

/spark/bin/./spark-submit --class main.scala.FileRead SparkSteamStudy.jar /user/yuhui/sparkStreaming/data

執行資料和過程

在一批資料來的時候，是一行一行存入list集合中，這樣資料可以一行一行取出來

SparkStream檔案監控和資料讀取

程式碼 package main.scala import org.apache.spark.SparkConf import org.apache.spark.streaming.{Seconds, StreamingContext} import org.slf4

tensorflow學習筆記（五）：TensorFlow變數共享和資料讀取

　　這一節我們提及了三個內容：變數共享、執行緒和佇列和資料讀取，這些都是TensorFlow官方指導中的內容。會在程式中經常遇到所以放在一起進行敘述。前面都是再利用已有的資料進行tensorflow的學習，這一節我們要學習怎麼從檔案中讀取我們需要的各類資料。

將檔案中的資料讀取，列印到控制檯

讀取方式一： FileReader fr=new FileReader("abc"); int ch=0;while((ch=fr.read())!=-1){System.out.println((

Hive（一）資料型別、檔案格式和資料定義

1、基本資料型別 Hive支援多種不同長度的整型和浮點型資料型別，支援布林型別，也支援無長度限制的字串型別，後續的Hive增加了時間戳資料型別和二進位制陣列資料型別。和其他的SQL語言一樣，這些都是保留字。需要注意的是所有的這些資料型別都是對Jav

大資料的監控和資料準確性保證

我們目前的資料流程是：資料來源資料經過挖掘處理轉換等操作生成中間資料，入寬表，然後提取寬表資料入PDC，資料停留的地方有資料來源–>中間資料–>寬表–>PDC。目前我們的監控措施如下: （1）資料來源 –>中間資料–&g

Linux下實現視訊讀取（三）---Buffer的準備和資料讀取

前面主要介紹的是：V4L2 的一些設定介面，如亮度，飽和度，曝光時間，幀數，增益，白平衡等。今天看看V4L2 得到資料的幾個關鍵ioctl，Buffer的申請和資料的抓取。 1. 初始化 Memory Mapping 或 User Pointer I/O. int ioct

windows系統平臺下的PE檔案格式和資料定義詳解（附帶詳細高清大圖）

PE（Portable Executable）格式，是微軟Win32環境可移植可執行檔案(如exe、dll、vxd、sys和vdm等)的標準檔案格式。 PE格式衍生於早期建立在VAX(R)VMS(R)上的COFF(Common Object File Format)檔案格式

flume1.7.0－taildirSource 支援多檔案監控和斷點續傳

flume 1.7.0 推出了 taildirSource 元件。tail 監控目錄下匹配上正則表示式的的所有檔案，實現斷點續傳。問題但是官方的 taildirSource 元件貌似是支援nginx 日誌，對於log4j 日誌好像不太管用。

Excel 檔案資料讀取和篩選

需求：已知一個excel 表中的"Sheet1"中，有id, name, salary 3列的內容，要求將薪水重複次數最多的按從高到低進行排序 #coding=utf-8 import xlrd from collections import Counter import opera

Java實現在文字檔案中寫入資料和讀取資料

Java實現在文字檔案中寫入資料和讀取資料寫資料到文字檔案中去：程式碼如下所示： import java.io.File; import java.io.FileWriter; import java.io.IOException; public class

matlab查詢指定資料夾下檔案（附漢字和標點符號讀取方法）

fidrrt = fopen('F:\lyn.txt'); while 1 tline = fgetl(fidrrt); if ~ischar(tline), break, e

R語言讀CSV、txt檔案方式以及read.table read.csv 和readr（大資料讀取包）

首先準備測試資料*(mtcars)分別為CSV. TXT 歡迎加入Python快速進階QQ群：867300100 R語言資料分析案例：直通車 read.table 預設形式讀取CSV（×）與TXT(效果理想) ① > test<-read.t

QT和VS讀取.txt檔案中的資料並儲存為陣列

QT中讀取.txt檔案並儲存為陣列 QFile fpx("/work/qt_workspace/saly/pix_x.txt"); QFile fpy("/work/qt_workspace/saly/pix_y.txt"); // QVector&l

Java中讀取某個目錄下的所有檔案和資料夾

import java.io.File;public class Test1 { public static void main(String[] args) { String path="d:/"; File file=new File(path); File[] tempList = file.li

讀取並顯示dicom檔案的影象資料和覆蓋層資料

一、影象資料影象資料儲存在標籤<7FE0，0010>中，按照一行一行的畫素位元組排列過去。在讀取dicomTag時，會儲存<7FE0，0010>在檔案中指向的位置. 一般後面會專門的讀取影象的位元組流. 步驟如下: 新建一個位

TensorFlow模型檔案儲存和讀取

一、模型檔案的儲存在訓練一個TensorFlow模型之後，我們可以將訓練好的模型儲存成檔案，這樣可以方便下一次對新的資料進行預測的時候直接載入訓練好的模型即可獲得結果，下面通過TensorFlow提供的tf.train.Saver函式，將一個模型儲存成檔案，一般習慣性的將TensorFlow的模

wave和pyaudio讀取wav語音檔案並播放

需要模組：wave , pyAudio 程式如下： import pyaudio import wave CHUNK = 1024 # 從目錄中讀取語音 wf = wave.open('./2.wav', 'rb') # read data data = wf.readfra

Java實現zip檔案壓縮（單個檔案、資料夾以及檔案和資料夾的組合壓縮）

Java實現zip檔案壓縮（單個檔案、資料夾以及檔案和資料夾的組合壓縮） 2016年10月04日 23:22:24 ljheee 閱讀數：13215 標籤：壓縮javazip 更多個人分類： Java應用版權宣告：本文為博

IO流讀取資料檔案，將資料寫入資料庫，並記錄資料匯入日誌

流程分析：資料型別： ROUTE_ID,LXBM,ROAD_NAME,SRC_LON,SRC_LAT,DEST_LON,DEST_LAT 10000,G50,滬渝高速,115.8605349,30.08934467,115.5437817,30.08898601 10001,G

Linux 中檔案和資料夾獲取 MySQL 許可權(SELinux)

今天在 Linux 系統上移動 MySQL 的資料庫目錄配置如下: /etc/my.cnf [mysqld]datadir=/home/mysqlsocket=/var/lib/mysql/mysql.sock 更改完配置檔案重啟MYSQL的時候出現

SparkStream檔案監控和資料讀取

相關推薦