在Apache Spark 中,可以連接到外部資料庫並將資料載入到Spark DataFrame 中使用讀取方法。從資料庫表中讀取時,預設行為是檢索整個表。但是,在某些情況下,可能需要僅取得特定查詢的結果。
使用PySpark,您可以將SQL 查詢指定為「從資料庫讀取時使用「dbtable」選項。這允許您取得查詢的結果集而不是整表。在外部資料庫上執行,並且結果集被載入到 Spark DataFrame df 中。
以上是如何將外部資料庫中的特定查詢結果提取到 Spark DataFrame 中?的詳細內容。更多資訊請關注PHP中文網其他相關文章!