Spark執行Python程式碼

阿新 • • 發佈：2019-02-10

兩種方法：

使用 spark-submit 解釋執行python指令碼
使用 python 解釋執行python指令碼

1. 使用Spark-submit解釋執行python指令碼

Python指令碼中需要在開頭匯入spark相關模組，呼叫時使用spark-submit提交，示例程式碼如下：

===========================================================

"""odflow.py"""
from pyspark import SparkContext

fileDir = "/TripChain3_Demo.txt"
# sc = SparkContext("local", "ODFlow")
sc = SparkContext("spark://ITS-Hadoop10:7077", "ODFlow")
lines = sc.textFile(fileDir)

# python不能直接寫多行的lambda表示式，所以要封裝在函式中
def toKV(line):
    arr = line.split(",")
    t = arr[5].split(" ")[1].split(":")
    return (t[0]+t[1]+","+arr[11]+","+arr[18],1)

r1 = lines.map( lambda line : toKV(line) ).reduceByKey(lambda a,b: a+b)
# 排序並且存入一個（repartition）檔案中
r1.sortByKey(False).saveAsTextFile("/pythontest/output")

===========================================================

釋出命令為：

spark-submit \
  --master spark://ITS-Hadoop10:7077 \
  odflow.py

2. 使用 python 解釋執行python指令碼

直接用python執行會出現錯誤:

ImportError: No module named pyspark
ImportError: No module named py4j.java_gateway

缺少pyspark和py4j這兩個模組，這兩個包在Spark的安裝目錄裡，需要在環境變數裡定義PYTHONPATH，編輯~/.bashrc或者/etc/profile檔案均可

vi ~/.bashrc # 或者 sudo vi /etc/profile
# 新增下面這一行
export PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip:$PYTHONPATH
# 使其生效
source ~/.bashrc # 或者 sudo source /etc/profile

然後關閉終端，重新開啟，用python執行即可

python odflow.py

python odflow.py

Spark執行Python程式碼

兩種方法：使用 spark-submit 解釋執行python指令碼使用 python 解釋執行python指令碼1. 使用Spark-submit解釋執行python指令碼 Python指令碼中需要在開頭匯入spark相關模組，呼叫時使用spark-submit提

Windows 10後臺程序執行python程式碼

#1.安裝服務 python PythonService.py install #2.讓服務自動啟動 python PythonService.py --startup auto install #3.啟動服務 python PythonService.py

實現在Java中執行python程式碼或py指令碼（可傳引數）

最近用Java寫服務端程式時，遇到這樣一個需求：需要把用python寫的機器學習演算法部署到伺服器上，然後Java執行py指令碼，並且取得演算法執行的結果。在網上找了很久，有些跑不通，有些是基於windows的，我的伺服器是linux的，遇到了不少坑= =好不容易解決了，記錄

動態執行python程式碼

最近剛剛學到兩個新的命令exec和eval，這兩個命令可以在程式碼中動態執行python指令碼。 exec a = 1 exec "a = 2" print a 上述程式碼輸出的結果為2 name = "os" exec "import

SVM入門例項可執行python程式碼完整版(簡單視覺化)

執行環境 anaconda python 版本 2.7.13 包含詳細資料集和資料的使用，視覺化結果，很快入門，程式碼如下 # -*- coding: utf-8 -*- __author__ = 'LinearSVC線性分類支援向量機：包含懲罰項的' # 導包 imp

安裝python pip，再安裝request模組，執行python程式碼

1，看到這篇文章，想試試用來測試我們的介面：照著寫了python的引用 requests模組的程式碼，執行python，反饋說不能引入這個requests模組，說用pip安裝requests模組，命令端使用pip install requests反饋說沒

在Notepad++中執行python程式碼以及執行後只是一閃而過

1.在notepad++中直接執行python程式碼 1.第一種：開啟Notepad++；點選外掛，點選plugin manager，點選show plugin manager，找到“pynpp”，install。執行時直接開啟文件，點選外掛->pynpp-&g

在notepad++中直接執行python程式碼快捷方式設定

如何在notepad++中直接執行python的程式碼在notepad++介面中按F5（或者在選單欄中選擇“執行”），此時會出現下圖介面（初次使用這裡面是空的)：然後輸入：cmd /k D:\Python27\python.exe "$(FUL

如何用iPad執行Python程式碼？

其實，不只是iPad，手機也可以。（由於微信公眾號外部連結的限制，文中的部分連結可能無法正確開啟

TensorFlow學習筆記7——Win7下Spyder執行python程式碼出現UnicodeEncodeError問題的解決

環境： win7+Anaconda1.6.3+Spyder3.2.1+tensorflow1.1.0 問題描述：執行下述程式碼，讀取之前儲存的tfrecord檔案，

漲見識了，在終端執行 Python 程式碼的 6 種方式！

原作：[BRETT CANNON](https://snarky.ca/author/brett/) 譯者：豌豆花下貓@Python貓英文：[https://snarky.ca/the-many-ways-to-pass-code-to-python-from-the-terminal](https:/

執行python爬蟲程式碼中遇到的問題~

可以算是一次小嚐試~ 遇到的問題有： from bs4 import BeautifulSoup ModuleNotFoundError: No module named 'bs4' bs4.FeatureNo

Linux系統下python程式碼執行shell命令的方法

方法一：os.popen #!/usr/bin/python # -*- coding: UTF-8 -*- import os, sys # 使用 mkdir 命令 a = 'ls' b = os.popen(a,'w',1) print b 方法二：os.system #!/

分享一份四百行的Python程式碼給你！可直接執行哦！企業級專案爬蟲

__author__ ="PSM" '''用於記錄暫時的錯誤，以便檢視''' import http.client import urllib.request import re import os import linecache print(" **********************

Python網路爬蟲之爬取淘寶網頁頁面 MOOC可以執行的程式碼

可以實現功能的全部程式碼： import requests import re def getHTMLText(url): try: r = requests.get(url, timeout = 30) r.raise_for_statu

python3教程（三）：程式碼執行環境及你的第一段python程式碼

程式碼執行環境我們安裝完Python後，可以使用ide或idle來執行程式。關於ide我們之後會專門進行介紹，我們前期一般是使用idle來學習及執行程式碼。在Windows上一般有兩個idle ，一個是cmd ，另一個則是python自帶的。 cmd的話，和上一節課程一樣，

python程式碼在android上執行方法

使用開源專案SL4A。 SL4A讓指令碼語言能夠在android上編輯和執行。並且能夠提供互動式解析器直接使用android裝置。這些指令碼能夠呼叫完全成熟的android應用程式介面，並且擁有一個簡潔的介面。

Python執行速度慢這點是公認的！那麼如何加速Python程式碼呢？

通過使用jit裝飾器，使用Numba非常容易：正如你所知道的，在Python中，所有程式碼塊都被編譯成位元組碼：當然在學習Python的道路上肯定會困難，沒有好的學習資料，怎麼去學習呢？

Python程式碼執行應該注意哪些問題？

Python作為近年來熱度一度高漲的程式語言，非常受廣大程式設計師的喜愛，用過之後發現這門語言有很多特點。比如作為一門動態語言它的變數是信手拈來就可以用的，甚至比js還簡單，也沒有程式語言常見的大括號包含程式碼塊，它採用獨特的縮排方式來處理不同級別的程式碼塊，所以整體給人一種清爽簡潔的特性，程式讀起來甚至跟讀

python程式碼本地執行不報錯，上傳伺服器後報錯？？？

本地執行是成功的，程式碼也更新了，但在伺服器上執行程式碼就報錯了，500 Internal Server ErrorThe server encountered an internal error and was unable to complete your request. Either t

Spark執行Python程式碼

兩種方法：

1. 使用Spark-submit解釋執行python指令碼

2. 使用 python 解釋執行python指令碼

相關推薦