如何使用 PySpark 的 JDBC 從外部資料庫取得特定查詢結果？-mysql教程-PHP中文網

首頁

資料庫

mysql教程

如何使用 PySpark 的 JDBC 從外部資料庫取得特定查詢結果？

Linda Hamilton

Nov 30, 2024 am 07:34 AM

How Can I Fetch Specific Query Results from an External Database Using PySpark's JDBC?

在Apache Spark 2.0.0 中從外部資料庫取得特定查詢結果

使用PySpark 在Apache Spark 2.0.0 中處理外部資料庫時，用戶可能希望從特定查詢中獲取數據，而不是獲取整個表。這可以增強效能並減少資料傳輸。

問題：

在以下 PySpark 程式碼中，從名為「schema.tablename」的資料庫表載入 df DataFrame 。我們如何修改程式碼以從自訂查詢的結果集中取得資料？

from pyspark.sql import SparkSession

spark = SparkSession\
    .builder\
    .appName("spark play")\
    .getOrCreate()    

df = spark.read\
    .format("jdbc")\
    .option("url", "jdbc:mysql://localhost:port")\
    .option("dbtable", "schema.tablename")\
    .option("user", "username")\
    .option("password", "password")\
    .load()

答案：

取得自訂查詢的結果集查詢，將查詢作為 Spark DataFrameReader 選項中的「dbtable」參數提供。查詢必須用括號括起來，並為臨時表名稱起別名。

...
.option("dbtable", "(SELECT foo, bar FROM schema.tablename) AS tmp")
...

透過將子查詢作為「dbtable」參數傳遞，Spark 將執行查詢並將結果資料載入到 DataFrame 中。這允許使用者從外部資料庫檢索特定數據，而無需獲取整個表的開銷。

以上是如何使用 PySpark 的 JDBC 從外部資料庫取得特定查詢結果？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

將用戶添加到MySQL：完整的教程May 12, 2025 am 12:14 AM

掌握添加MySQL用戶的方法對於數據庫管理員和開發者至關重要，因為它確保數據庫的安全性和訪問控制。 1)使用CREATEUSER命令創建新用戶，2)通過GRANT命令分配權限，3)使用FLUSHPRIVILEGES確保權限生效，4)定期審計和清理用戶賬戶以維護性能和安全。

掌握mySQL字符串數據類型：varchar vs.文本與charMay 12, 2025 am 12:12 AM

chosecharforfixed-lengthdata，varcharforvariable-lengthdata，andtextforlargetextfield.1）chariseffity forconsistent-lengthdatalikecodes.2）varcharsuitsvariable-lengthdatalikenames，ballancingflexibilitibility andperformance.3）

MySQL：字符串數據類型和索引：最佳實踐May 12, 2025 am 12:11 AM

在MySQL中處理字符串數據類型和索引的最佳實踐包括：1)選擇合適的字符串類型，如CHAR用於固定長度，VARCHAR用於可變長度，TEXT用於大文本；2)謹慎索引，避免過度索引，針對常用查詢創建索引；3)使用前綴索引和全文索引優化長字符串搜索；4)定期監控和優化索引，保持索引小巧高效。通過這些方法，可以在讀取和寫入性能之間取得平衡，提升數據庫效率。

mysql：如何遠程添加用戶May 12, 2025 am 12:10 AM

ToaddauserremotelytoMySQL,followthesesteps:1)ConnecttoMySQLasroot,2)Createanewuserwithremoteaccess,3)Grantnecessaryprivileges,and4)Flushprivileges.BecautiousofsecurityrisksbylimitingprivilegesandaccesstospecificIPs,ensuringstrongpasswords,andmonitori

MySQL字符串數據類型的最終指南：有效的數據存儲May 12, 2025 am 12:05 AM

tostorestringsefliceflicyInmySql，ChooSetherightDataTypeBasedyOrneOrneEds：1）USEcharforFixed-LengthStstringStringStringSlikeCountryCodes.2）UseVarcharforvariable-lengtthslikenames.3）USETEXTCONTENT.3）

mysql blob vs.文本：為大對象選擇正確的數據類型May 11, 2025 am 12:13 AM

選擇MySQL的BLOB和TEXT數據類型時，BLOB適合存儲二進制數據，TEXT適合存儲文本數據。 1)BLOB適用於圖片、音頻等二進制數據，2)TEXT適用於文章、評論等文本數據，選擇時需考慮數據性質和性能優化。

MySQL：我應該將root用戶用於產品嗎？May 11, 2025 am 12:11 AM

No,youshouldnotusetherootuserinMySQLforyourproduct.Instead,createspecificuserswithlimitedprivilegestoenhancesecurityandperformance:1)Createanewuserwithastrongpassword,2)Grantonlynecessarypermissionstothisuser,3)Regularlyreviewandupdateuserpermissions

MySQL字符串數據類型說明了：選擇適合您數據的合適類型May 11, 2025 am 12:10 AM

mySqlStringDatatAtatPessHouldBechoseBasedondatActarActeristicsAndusecases：1）USEcharforFixed lengthStstringStringStringSlikeCountryCodes.2）usevarcharforvariable-lengtthslikeLikenames.3）usebarnionororvarinyorvarinyorvarybinarydatalgebenedaTalgeextocrabextrapon.4）

See all articles