python3 + conda 部署geospark

阿新 • • 發佈：2020-09-14

以下操作，叢集每臺機器都要做

--------------------------------------------------------------------------------------------------------------------------------------------

1.安裝conda，我選擇是 miniconda3

2.安裝geospark

從git hub上下載：https://github.com/apache/incubator-sedona/tree/master/python/geospark

安裝主包：

　　pip installgeospark-1.3.0-py3-none-any.whl

安裝 PyArrow：

　　spark.sql.execution.arrow.enabled 設定為 true ,則必須安裝
　　pip3 install PyArrow==0.14.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/

安裝pyproj==2.4.0：

　　使用geopandas進行座標系轉換時，報錯RuntimeError: b'no arguments in initialization list' 問題是由proj造成的，可以通過更新proj修復

　　pip3 install --ignore-installed pyproj==2.4.0 -i https://pypi.douban.com/simple/

3. 把自己的程式放到某個位置，比如 /opt/myproject。然後在/opt/software/miniconda3/envs/datamining/lib/python3.6/site-packages 目錄下建立 my.pth檔案，加入以下包，否則無法識別自定義包。

比如以下內容：

4. 下載下來的對應jar包(GeoSpark\python\geospark\jars\2_4) 拷貝到/opt/cloudera/parcels/SPARK2-2.3.0.cloudera4-1.cdh5.13.3.p0.611179/lib/spark2/jars 下面。（我使用的是 cloudera manager）

5.環境變數設定

6.重啟叢集

7.測試

測試程式碼如下（返回 True就是ok了）：

from geo_pyspark.utils import GeoSparkKryoRegistrator, KryoSerializer
from geo_pyspark.register import GeoSparkRegistrator
import pandas as pd

session = SparkSession.builder. \
appName("test"). \
config("spark.serializer", KryoSerializer.getName). \
config("spark.kryo.registrator", GeoSparkKryoRegistrator.getName). \
getOrCreate()
GeoSparkRegistrator.registerAll(session)

python3 + conda 部署geospark

python3 + conda 部署geospark

uwsgi centos python3 flask 部署

詳解centos7+django+python3+mysql+阿里雲部署專案全流程

ansible-playbook實現自動部署KVM及安裝python3的詳細教程

遠端部署神器 Fabric，支援 Python3

將Python3後臺工程編譯成pyc部署

nginx+uwsgi+python3+flask+騰訊雲（專案部署、親測可用）

Python3 基於 Nginx 部署 Django 專案

使用Swift的後端開發之---如何在伺服器上部署 Vapor?和PostgreSQL?

RocketMQ踩坑之部署

Rio手把手教學：如何打造容器化應用程式的一站式部署體驗

寫給後端的Docker初級入門教程:實現高效率自動化部署

基於 Jenkins Pipeline 自動化部署(恭喜fpx)

使用 Go 執行與部署

如何部署後端jar包？

基於Rancher k8s部署Prometheus 監控swoole專案核心指標實戰

雙十一還在蓋樓？少年你應該掌握Docker 部署 Consul了

簡單使用持續整合jenkins 快速部署springboot和vue專案(面向開發者)

K8S平臺基於SideCar模式的Java應用部署方式

部署一個node伺服器

python3 + conda 部署geospark

相關推薦