php小編柚子最近接到用戶回饋,表示在使用Docker上的Jupyter Notebook連接PySpark時遇到了問題。具體問題是在連接的過程中遇到了一些與PostgreSQL相關的困擾。針對這個問題,我們將為大家提供解決方案和操作步驟,以幫助使用者順利連接PySpark並解決問題。在本文中,我們將詳細介紹如何使用Docker上的Jupyter Notebook連接PySpark,並提供一些常見問題的解決方法,希望能對大家有所幫助。
問題內容
我遇到了這個問題 py4jjavaerror: 呼叫 o124.save 時發生錯誤。 :org.postgresql.util.psqlexception:與 localhost:5432 的連線被拒絕。檢查主機名稱和連接埠是否正確,以及 postmaster 是否接受 tcp/ip 連線。
當我在 jupyter notbook 上運行此 pysark 程式碼並使用 docker 運行所有內容時,postgresql 將安裝在本機電腦(windows)中。
from pyspark.sql import SparkSession from pyspark.sql.functions import lit, col, explode import pyspark.sql.functions as f spark = SparkSession.builder.appName("ETL Pipeline").config("spark.jars", "./postgresql-42.7.1.jar").getOrCreate() df = spark.read.text("./Data/WordData.txt") df2 = df.withColumn("splitedData", f.split("value"," ")) df3 = df2.withColumn("words", explode("splitedData")) wordsDF = df3.select("words") wordCount = wordsDF.groupBy("words").count() driver = "org.postgresql.Driver" url = "jdbc:postgresql://localhost:5432/local_database" table = "word_count" user = "postgres" password = "12345" wordCount.write.format("jdbc") \ .option("driver", driver) \ .option("url", url) \ .option("dbtable", table) \ .option("mode", "append") \ .option("user", user) \ .option("password", password) \ .save() spark.stop()
我嘗試編輯postgresql.conf 添加“listen_addresses = 'localhost'”並編輯pg_hba.conf 添加“host all all 0.0.0.0/0 md5”,但它對我不起作用,所以我不知道該怎麼做做。
解決方法
我也解決了在docker 上安裝PostgreSQL 的問題(使用此映像https://hub.docker .com/_/postgres/ 僅為postgres 建立一個容器)並使用指令在PySpark 容器和postgreSQL 容器之間建立網路
docker網路建立my_network
,
此指令用於 postgres 容器
docker run --name postgres_container --network my_network -e POSTGRES_PASSWORD=12345 -d -p 5432:5432 postgres:latest
這個用於 Jupyter-pyspark 容器
docker run --name jupyter_container --network my_network -it -p 8888:8888 -v C:\home\work\path:/home/jovyan/work jupyter/pyspark-notebook:latest
以上是postgreSQL 出現問題,嘗試在 Docker 上的 Jupyter Notebook 上連接 PySpark的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

記事本++7.3.1
好用且免費的程式碼編輯器