再探spark之一（複習之前）加spark如何實現遠端除錯程式碼

阿新 • • 發佈：2018-12-25

Scala的練習https://blog.csdn.net/yewakui2253/article/details/80022403

alt+p可以用來上傳東西僅限於secureCRT

然後put F:\Users\Administrator\WorkspacesIDEA\scalaMaven\target\scalaMaven-1.0.jar就可以將東西傳到Linux上了

沒啟動spark的話。

可以通過 sbin/start-all.sh 來啟動spark

按crtl+c來終止任務，而不是ctrl+z

spark-shell --master spark://192.168.235.128:7077 連線到spark上

spark-shell --master spark://192.168.235.128:7077 --total-executor-cores 3 調整任務用核的數量

spark-shell --master spark://192.168.235.128:7077 --executor-memory 2g 用2g執行記憶體

spark-submit --master spark://192.168.235.128:7077 --class org.apache.spark.examples.SparkPi /export/servers/spark-2.1.0-bin-hadoop2.7/examples/jars/spark-examples_2.11-2.1.0.jar 100 用來執行spark-submit任務

遠端除錯程式碼如下

package com.wxa.spark.one

import org.apache.spark.{SparkConf, SparkContext}

/**
  * Created by root on 2016/5/14.
  * 遠端除錯的方法
  */
object WordCount {
  def main(args: Array[String]) {
    //非常重要，是通向Spark叢集的入口
    val conf = new SparkConf().setAppName("WC").
      setJars(Array("F:\\Users\\Administrator\\WorkspacesIDEA\\scalaMaven\\target\\scalaMaven-1.0.jar"))
        .setMaster("spark://hadoop01:7077")

    val sc = new SparkContext(conf)

    //textFile會產生兩個RDD：HadoopRDD  -> MapPartitinsRDD
    sc.textFile(args(0)).cache()
      // 產生一個RDD ：MapPartitinsRDD
      .flatMap(_.split(" "))
      //產生一個RDD MapPartitionsRDD
      .map((_, 1))
      //產生一個RDD ShuffledRDD
      .reduceByKey(_+_)
      //產生一個RDD: mapPartitions
      .saveAsTextFile(args(1))
    sc.stop()
  }
}

再探spark之一（複習之前）加spark如何實現遠端除錯程式碼

Scala的練習https://blog.csdn.net/yewakui2253/article/details/80022403alt+p可以用來上傳東西僅限於secureCRT然後put F:\Users\Administrator\WorkspacesIDEA\sc

Spark-MLlib的快速使用之一（資料型別）

1、Vector 數學向量，MLlib既支援稠密向量也支援稀疏向量。稠密向量：向量的每一位都儲存下來。稀疏向量：儲存非零位以節約空間 2、LabeledPoint 表示帶標籤的資料點，包含一個特徵向量與一個標籤。 3、Mo

離散複習資料之一（Dijkstra演算法）

Dijkstra演算法。 Dijkstra演算法，也可以叫做標記法。它的原理是把所求目標點到達該點的最短路徑標記起來，並且把每一個到達他的最短路徑的點標記起來。就像（5,4），就是表示到達它的最短的距離是5.它是通過4到達的，類似於遞迴的思想。先來看一個最短路問題

藍的成長記——追逐DBA（4）：追憶少年情愁，再探oracle安裝（Linux下10g、11g）

***************************************宣告*************************************** 個人在oracle路上的成長記錄，其中以藍自喻，分享成長中的情感、眼界與技術的變化與成長。敏

不容易系列之一（錯排）

tdi cstring 輸入 font style str 而且 scanf 什麽題目：大家常常感慨，要做好一件事情真的不容易，確實，失敗比成功容易多了！做好“一件”事情尚且不易，若想永遠成功而總從不失敗，那更是難上加難了，就像花錢總是比掙錢容易的道理一樣。話雖這樣

DELL BIOS FIRMWARE升級（12G之前）

bios dell firmware update 下載32位診斷解壓程序制作啟動U盤下載對應機型的BIOS，並且拷貝到U盤根目錄啟動界面按F11選擇啟動菜單，選擇U盤啟動直接輸入BISO文件名運行DELL BIOS FIRMWARE升級（12G之前）

[node 工具 ] 用 Node.js 將 bugzilla 上的 bug 列表導入到 excel 表格在線版本之一（ web 端）

oct node img please utf save smis charset nim 用 Node.js 將 bugzilla 上的 bug 列表導入到 excel 表格在線版本之一（ server 端） <!DOCTYPE html>

實現IE兼容方案之一（濾鏡）

alpha arp ie6 code pix fault 技術 bsp work 當 CSS3 遇上較低版本 IE，濾鏡就成了實現兼容性的折衷方案之一。雖然濾鏡是過時很久的技術了，但還是能看出微軟的高瞻遠矚——早在 IE6 就用濾鏡實現了 bug 叢

hadoop生態搭建（3節點）-10.spark配置

sla over doc you 環境變量添加 home usr count # https://www.scala-lang.org/download/2.12.4.html# ==============================================

資源|28本必讀的經典機器學習/資料探勘書籍（免費下載）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Spark2.2（三十三）：Spark Streaming和Spark Structured Streaming更新broadcast總結

背景：需要在spark2.2.0更新broadcast中的內容，網上也搜尋了不少文章，都在講解spark streaming中如何更新，但沒有spark structured streaming更新broadcast的用法，於是就這幾天進行了反覆測試。經過了一下兩個測試：：Spark Streaming更

Spark學習（拾叄）- Spark Streaming整合Flume&Kafka

文章目錄處理流程畫圖剖析日誌產生器開發並結合log4j完成日誌的輸出使用Flume採集Log4j產生的日誌使用KafkaSInk將Flume收集到的資料輸出到Kafka Spark Streaming消費Kafka的

Spark學習（拾貳）- Spark Streaming整合Kafka

文章目錄 Spark Streaming整合Kafka的版本選擇詳解以下是基於spark2.2的測試： Receiver方式整合之概述 Receiver方式整合之Kafka測試 Receiver方式整合之Sp

Spark學習（拾壹）- Spark Streaming整合Flume

文章目錄 Push方式整合之概述 Push方式整合之Flume Agent配置開發 Push方式整合之Spark Streaming應用開發 Push方式整合之本地IDEA環境聯調 Push方式整合之伺服器環境聯調

區塊鏈核心技術之一（共識演算法）

開篇導言作為一名IT技術工作者以及區塊鏈相關從業者，談到區塊鏈技術，不自覺的會想到密碼學、P2P協議、分散式儲存以及共識機制。鑑於前三者無論在學術上和工程上都是比較成熟的技術，因此理解區塊鏈的關鍵就是理解共識機制。從比特幣的POW開始，到以太坊的Ethash，再到EOS的dpos機制，然後是基於VRF抽籤設

Tensorflow常見模型實現之一（LSTM/BiLSTM）

1. LSTM import tensorflow as tf import tensorflow.contrib as contrib from tensorflow.python.ops import array_ops class lstm(object):

Mybatis框架的使用之一（環境搭建）

Mybatis是當今比較流行的、開源的資料持久化層(DAO)框架，作為SSM框架之一，它可以在實體類與SQL語句之間建立對映關係。主要有以下優點：與JDBC相比，減少了50%以上程式碼量是最簡單的持久化框架、小巧簡單易學 SQL程式碼從程式程式碼中徹底分離，

高階網路計算-1（複習筆記）

SDN：軟體定義網路(Software Defined Network, SDN )，是Emulex網路一種新型網路創新架構，是網路虛擬化的一種實現方式，其核心技術OpenFlow通過將網路裝置控制面與資料面分離開來，從而實現了網路流量的靈活控制，使網路作為管道變得更加智慧。

O(n*logn)級別的演算法之一（歸併排序）

測試用例： #ifndef INC_02_MERGE_SORT_SORTTESTHELPER_H #define INC_02_MERGE_SORT_SORTTESTHELPER_H #include <iostream> #include <

redis 學習之一（資料結構）

通用方法 incr decr incrby decrbyredis string方法 get set mset mget setex expire儲存物件的兩種方式 //儲存序列化之後的物件 jedis.set("user:liud

再探spark之一（複習之前）加spark如何實現遠端除錯程式碼

相關推薦