<Spark Streaming><本地調試>

阿新 • • 發佈：2017-05-20

pri lis pac flume object st2 soc port 打包

寫在前面

因為本地電腦沒裝flume，nginx各種。所以之前寫Streaming程序的時候，都是打包了放到集群上跑。就算我在程序代碼裏不停地logger，調試起來也hin不方便。
於是本地寫了兩個程序，在intellj調試。
主要就是包括兩個程序：
- 一個是GenerateChar.scala用來向某個指定端口，使用socket發消息；
- 另一個就是要測試的Streaming程序了。

GenerateChar

package com.wttttt.spark

import java.io.PrintWriter
import java.net.ServerSocket

/**
  * Created with IntelliJ IDEA.
  * Description: 
  * Author: wttttt
  * Github: https://github.com/wttttt-wang/hadoop_inaction
  * Date: 2017-05-19
  * Time: 10:19
  */
object GenerateChar {
  def main(args: Array[String]) {
    val listener = new ServerSocket(9998)
    while(true){
      val socket = listener.accept()
      new Thread(){
        override def run() = {
          println("Got client connected from :"+ socket.getInetAddress)
          val out = new PrintWriter(socket.getOutputStream,true)
          while(true){
            Thread.sleep(3000)
            val context1 = "GET /result.html?Input=test1 HTTP/1.1"
            println(context1)
            val context2 = "GET /result.html?Input=test2 HTTP/1.1"
            println(context2)
            val context3 = "GET /result.html?Input=test3 HTTP/1.1"
            println(context3)
            out.write(context1 + ‘\n‘ + context2 + "\n" + context2 + "\n" + context3 + "\n" + context3 + "\n" + context3 + "\n" + context3 + "\n")
            out.flush()
          }
          socket.close()
        }
      }.start()
    }
  }
}

要發送的數據就根據需要自定義。

streaming

streaming這邊就是要調試的程序啦。
- 一方面是，Mater設置成local[x]，x > 1，因為這裏需要receivers來接收數據。
- 另一方面，設置一個本地checkpoint目錄

val conf = new SparkConf()
      .setMaster("local[2]")
      .setAppName("LocalTest")
    // WARN StreamingContext: spark.master should be set as local[n], n > 1 in local mode if you have receivers to get data,
    // otherwise Spark jobs will not get resources to process the received data.
    val sc = new StreamingContext(conf, Milliseconds(5000))
    sc.checkpoint("flumeCheckpoint/")

測試的時候就各種打log，做輸出啦，hin方便噠

pri lis pac flume object st2 soc port 打包寫在前面因為本地電腦沒裝flume，nginx各種。所以之前寫Streaming程序的時候，都是打包了放到集群上跑。就算我在程序代碼裏不停地logger，調試起來也hin不方便。於是本地

<Spark Streaming><Flume><Integration>

uri min 取數 nts general ora span int from Overview Flume：一個分布式的，可靠的，可用的服務，用於有效地收集、聚合、移動大規模日誌數據我們搭建一個flume + Spark Streaming的平臺來從Flume獲取數

idea在本地調試，spark創建hiveContext的時候報錯

image onf sca etl () pan ray apache strong spark版本：1.6.1 scala版本：2.10 問題呢場景：　　在idea調試本地程序的時候創建hiveContext報錯，上午的時候是沒有這個問題的，下午在項目中寫了一個小

基於Kafka的生產者消費者消息處理本地調試

term 啟動 con 文件 tails console == cat 記得（尊重勞動成果，轉載請註明出處：http://blog.csdn.net/qq_25827845/article/details/68174111冷血之心的博客）Kafka下載地址：http:

Linux->Mysql安裝調試

版本 info index 成功 relation 運行 pat root密碼 ext 環境準備 mysql下載地址:https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.19-linux-glibc2.12-

Hive 本地調試方法

tcl 客戶原因 lips thrift ast strong nbsp 需要關鍵詞：hive, debug 本地調試（local debug） Hive 可分為 exec (hive-exec，主要對應源碼裏的ql目錄) 和 metastore 兩部分，其中

vscode本地調試php

微軟雅黑 tex software ott sea .com itl cal 技術分享 1、安裝wampserver3.06百度軟件下載中心：http://sw.bos.baidu.com/sw-search-sp/software/efb995b9b97d6/wampse

利用NATAPP隧道解決微信公眾號開發之本地調試難題

需要 alt clas 公眾號開發 help 服務器 -a amd64 驗證一、問題眾所周知，微信公眾號開發需要公網的有效域名和80端口，本機當然互聯網是訪問不了的。那麽我們難道去一個公網的服務器去開發嗎？那樣是不是太土了。答案當然是，NO 當然我們在做微信支付

Visual Studio 2017 本地調試 Chrome瀏覽器自動退出

edge mvc firefox 選項退出 fir 項目中文本地調試在使用VS 2017(15..6 、15.7)對.NET Core MVC應用程序進行本地調試的時候，選擇使用Chrome瀏覽器。但輸入中文就自動關閉Chrome瀏覽器，隨後結束調試。但復制、粘貼

vue : 本地調試跨域問題的解決辦法：proxyTable

settings sat tell emp 相同 debug conf sts zip 本來我是不想寫的，但為了加深印象還是寫一寫吧。 ./config/index.js module.exports = { dev: { // Paths

阿裏雲OSS上傳文件本地調試跨域問題解決

服務描述文件 join drivers bsp con res sys 問題描述：最近後臺說為了提高上傳效率，要前端直接上傳文件到阿裏雲，而不經過後臺。因為在阿裏雲服務器設置的允許源（region）為某個固定的域名下的源（例如*.cheche.com），直接在本地訪問

網站開發（周六）：項目本地調試（實戰）

png 本地調試文章 img 添加 black 添加數據本地 wid 項目本地調試：運行網站並添加文章數據 1、運行項目，可以發現前端網頁空空如也！ 2、登錄數據管理後臺。 3、在後臺添加數據。 4、前端刷新，頁面正常展示。至此，本地網站

Hyperledger Fabric 實戰(十二): Fabric 源碼本地調試

yaml releases centos 模塊 usr 分布式自己虛擬機啟動 res 　　借助開發網絡調試 fabric 源碼本地調試　　　　準備工作　　　　IDE Goland　　　　Go 1.9.7　　　　fabric-samples 模塊 chaincode-do

GET方法調試時，List<Object>的填寫方法

cal font lis obj xxxx [] ref In pan http://localhost:8080/findObject?idList[]=xxxx,xxx,xxxx&name=xxxxx GET方法調試時，List<Object>的填

<spark> ~/spark/conf/spark-default.conf 配置文件

shuf 參考 ons ast .sh spark集群搭建 driver conf 配置文件因為看到我參考的Hadoop/spark集群搭建的文檔中的都沒有對 /spark-default.conf 的配置合理地對 /spark-default.conf 進行配置，能

<spark> error：啟動spark後查看進程，進程中master和worker進程沖突

告訴若有 master 沖突存在查看進程 spark 但是文件啟動hadoop再啟動spark後jps，發現master進程和worker進程同時存在，調試了半天配置文件。測試發現，當我關閉hadoop後 worker進程還是存在，但是，當我再關閉spar

git使用<一>：本地倉庫的常用操作

碼農 ubun 所有都是 chan 常用 rac master 添加文件　　編寫軟件，時常免不了修修改改，修改過後的代碼不一定比前面好，甚至產生新問題，或者有時無意間修改了某行代碼，導致出錯，這種情況都是很常見的，如果此時沒有版本管理，如果是小軟件可能沒什麽影響，如果代

<Spark快速大數據分析>讀書筆記

磁盤外部闖關計算 apache 忽略分布 ado format <Spark快速大數據分析>主要使用java, scala和python進行講解，因博主暫未對java和scala展開了解，所以後續總結只通過python進行展示。 Part 1 Spark

<Spark快速大數據分析>讀書筆記(二)

body 數據單詞 spa line lin pairs clas art PART 3 Pair RDD 　　Spark為包含鍵值對類型的RDD提供了專有操作，這類RDD叫做Pair RDD(意為“對RDD”) 　　Spark中Pair RDD的創建主要有兩種方式，一種

【論文閱讀-REC】<<Recommending music on Spotify with deep learing>>閱讀

play ring 來源調整能力表達 layers 書籍訓練 1、協同過濾協同過濾不使用item的具體信息，因此可適用性很強，在書籍、電影、音樂上都可用；協同過濾不適用item的具體信息，因此強者愈強；冷啟動問題無法解決 2、基於內容的推薦使用聲音信號推薦

<Spark Streaming><本地調試>

寫在前面

GenerateChar

streaming

相關推薦