Windows10+Pycharm+Pyspark環境安裝單機版spark

阿新 • • 發佈：2018-12-22

首先請確保你已經配置好Java1.7以上環境

然後將其解壓至C盤根目錄：【本人使用的是spark-2.2.0-bin-hadoop2.7】

步驟二：安裝python環境【建議python3.5版本】，當然也可以直接安裝Anaconda，然後使用自帶或者建立python環境。

以及pycharm，這裡有很多教程就不再贅述。

步驟三：

1.開啟pycharm-（左上角）file---settings--Project Interpreter--選擇你的python環境

2.開啟解壓後的spark檔案---python---lib：C:\spark-2.2.0-bin-hadoop2.7\python\lib 你會看到有兩個壓縮檔案

將其貼上複製解壓到你所選python環境的Lib\site-packages中比如：C:\Python35\Lib\site-packages

然後可在pycharm建立py檔案嘗試輸入import pyspark 若不報錯則證明操作成功【另外也可以直接pip install pyspark==版本號】。下面是檢驗搭建是否

成功的例子程式碼：請務必看完後再嘗試執行

from pyspark import *
import os
 
if __name__ == '__main__':
    # Windows的Spark安裝目錄
    os.environ['SPARK_HOME'] = 'C:\spark-2.2.0-bin-hadoop2.7'
    # Create SparkConf
    conf = SparkConf() \
        .setAppName("WordCount") \
        .setMaster("local") \
        # Create SparkContext
    sc = SparkContext(conf=conf)
    # 從本地模擬資料
    datas = ["you,jump", "i,jump"]
    # Create RDD
    rdd = sc.parallelize(datas)
    print(rdd.count())  # 2
    print(rdd.first())  # you,jum
 
    # WordCount
    wordcount = rdd.flatMap(lambda line: line.split(",")) \
        .map(lambda word: (word, 1)) \
        .reduceByKey(lambda a, b: a + b)
    for wc in wordcount.collect():
        print(wc[0] + "   " + str(wc[1]))
# you   1
# jump   2
# i   1

當然，要想成功執行還需要一些操作：
'#你需要指定#Windows的Spark安裝目錄：os.environ['SPARK_HOME'] = 'C:\spark-2.2.0-bin-hadoop2.7‘

另外你也可以以下圖示指定SPARK_HOME

點選OK即可。

下面可嘗試執行以下程式碼【如果報錯：

Exception: Java gateway process exited before sending the driver its port number

在錯誤之前若出現'cmd' + 一堆亂碼，可能是因為Windows10系統環境變數沒有指定系統目錄

】

嘗試如下操作：

結束！！！！！！

Windows10+Pycharm+Pyspark環境安裝單機版spark

首先請確保你已經配置好Java1.7以上環境然後將其解壓至C盤根目錄：【本人使用的是spark-2.2.0-bin-hadoop2.7】步驟二：安裝python環境【建議python3.5版本】，當然也可以直接安裝Anaconda，然後使用自帶或者建立python

【Spark筆記】Windows10 本地搭建單機版Spark開發環境

語句 spl 嘗試 spa efi 下載界面 RR 是否錯誤 0x00 環境及軟件 1、系統環境 OS：Windows10_x64 專業版 2、所需軟件或工具 JDK1.8.0_131 spark-2.3.0-bin-hadoop2.7.tgz hadoop-2.8

redis安裝-單機版

一個 zxvf -c server alt+ linux http 指定寫入環境準備　　因為redis使用c語言開發的，如果要運行在linux上，需要gcc-c++的環境。那麽我們就要先看一下是否安裝了gcc-c++如果沒有的話，需要在虛擬機上安裝gcc-c++環境（

Solr安裝(單機版)

inux 部署數據庫連接 art image lin 修改 pps field 　　本文記錄的是solr在win下安裝配置使用的過程，最後將solr部署到Linux上通過遠程訪問。下一篇文章會介紹solr集群的安裝！　　Solr是基於Lucene的全文檢索服務器，性

activeMQ的安裝--單機版

一、單機版 1、安裝 JDK 並配置環境變數（略） 2、下載apache-activemq-5.11.1-bin.tar.gz 3、解壓安裝 $ tar -zxvf apache-activemq-5.11.1-bin.tar.gz $ mv apache-activemq

在linux環境安裝單機RocketMQ

一、下載安裝Maven 我們準備安裝的Apache-RocketMQ需要通過Maven去編譯後才能啟動，所以首先要保證linux伺服器中有安裝java環境以及Maven。 1.下載maven並解壓 maven下載地址 maven.apache.org/download.cg… 找到合適的maven版本

centos6.5安裝單機版hadoop2.6.0

安裝hadoop之前，首先要安裝 jdk1.8.0_181（我使用的版本）並配置jdk環境變數，接下來開始安裝hadoop 1. hadoop2.6.0下載下載地址：http://archive.apache.org/dist/hadoop/core/hadoop-2.6.0/

windows作業系統安裝單機版mongodb

Windows 平臺安裝 MongoDB MongoDB 下載 MongoDB 提供了可用於 32 位和 64 位系統的預編譯二進位制包，你可以從MongoDB官網下載安裝，MongoDB 預編譯二進位制包下載地址：https://www.m

Ubuntu下搭建spark2.4環境（單機版）

說明：單機版的Spark的機器上只需要安裝JDK即可，其他諸如Hadoop、Zookeeper（甚至是scala）之類的東西可以一概不安裝。叢集版搭建：Spark2.2叢集部署和配置一、安裝JDK1.8 1、下載JDK1.8，地址 2、將下載的檔案儲存在 /home/qq/j

在linux上安裝單機版redis步驟

1.redis官網下載地址： redis下載 2.redis環境準備: 安裝 gcc ，使用yum安裝參考部落格 Centos上yum安裝 3.把下載的redis安裝包 redis-4.0.10.tar.gz 放在 /usr/local/software目錄下 4.

Centos7 安裝單機版Nginx

1.到nginx官網下載 tar.gz檔案（Stable version） 2.使用xftp上傳到linux系統中去 3.在安裝nginx之前要準備nginx的安裝環境 a)安裝gcc環境 [[email protected] ~]

Docker安裝單機版redis5和叢集版redis5

轉載請表明出處 https://blog.csdn.net/Amor_Leo/article/details/85147086 謝謝 Docker安裝單機版redis5和叢集版redis5 單機Redis 搜尋redis 拉取r

在linux伺服器上安裝單機版redis

一、環境準備因為redis使用c語言開發的，如果要執行在linux上，需要gcc-c++的環境。那麼我們就要先看一下是否安裝了gcc-c++如果沒有的話，需要安裝gcc-c++環境（友情提示，除了指令碼語言，linux上執行啥東西都需要裝環境）。首先需要檢

【Docker】Docker執行單機版Spark

機器環境 centos7 記憶體4G 拉取映象映象有2G多，下載時間比較長 = =！ docker pull sequenceiq/spark:1.6.0 啟動映象啟動

CentOS6.5 64位安裝單機版hadoop2.6教程

Hadoop2.6單機安裝安裝環境硬體：虛擬機器作業系統：Centos 6.5 64位主機名：hadoop0 安裝使用者：root 主機名很重要，可以任意自定義，但是一定要記住。安裝JDK 2，在/root/.bash

Mac下部署單機版spark模式

mac下配置單機版Spark相對比較簡單，首先我們從Spark官網上下載Spark的源程式http://spark.apache.org/downloads.html，在頁面中選擇你需要的版本，本文選擇的是最新版本spark-2.1.0-bin-hadoop2.7.tgz

Zookeeper的安裝單機版和叢集版

自己寫部落格,很大一部分原因是因為自己安裝過的軟體也老是忘記安裝步驟,每次都是百度的,寫下來供自己參考,當然,有什麼不足的地方,請大神批評指正!!!!!都是搞技術的,有錯指出來就行,歡迎各位騷擾!!!! Zookeeper的單機版安裝從官網上下載zookeeper的安裝

CentOS7安裝單機版Hadoop

（一）安裝JAVA環境 hadoop需要java環境，所以先安裝好java，安裝CentOS的時候，有的勾選了就可以不用安裝了（二）下載hadoop （三）解壓 tar –zxvf hadoop-2.7.5.tar.gz -C /

centos下安裝單機版kafka-0.10.0.1

1.環境說明主機資訊如下: 1[[email protected] soft]# hostname2test13[[email protected] soft]# cat /etc/hosts4127.0.0.1 localh

kafka在linux安裝單機版(--zookeeper未識別的坑)

kafka安裝評測下載地址：http://archive.apache.org/dist/kafka/2.0.0/ 可以直接通過wget下載依賴jdk環境可以安裝在/usr/local中 vim server.properties 修改對外的IP地址，否則kafka在

Windows10+Pycharm+Pyspark環境安裝單機版spark

相關推薦