首頁  >  文章  >  資料庫  >  如何將 MySQL 表讀取為 Spark DataFrame?

如何將 MySQL 表讀取為 Spark DataFrame?

Patricia Arquette
Patricia Arquette原創
2024-11-01 02:08:02186瀏覽

How to Read MySQL Tables as Spark DataFrames?

將Apache Spark 與MySQL 整合以讀取資料庫表

要將Apache Spark 與MySQL 連線並將資料庫表用作Spark 資料幀,請依照以下步驟操作:

  1. 建立Spark 會話:

    <code class="python">from pyspark.sql import SparkSession
    
    # Create a Spark session object
    spark = SparkSession.builder \
        .appName("Spark-MySQL-Integration") \
        .getOrCreate()</code>
  2. 實例化MySQL Connector

    :
    <code class="python">from pyspark.sql import DataFrameReader
    
    # Create a DataFrameReader object for MySQL connection
    jdbc_df_reader = DataFrameReader(spark)</code>
  3. 配置MySQL 連接參數

    :
    <code class="python"># Set MySQL connection parameters
    jdbc_params = {
        "url": "jdbc:mysql://localhost:3306/my_db",
        "driver": "com.mysql.jdbc.Driver",
        "dbtable": "my_table",
        "user": "root",
        "password": "password"
    }</code>
  4. 讀取資料庫表

    :
    <code class="python"># Read the MySQL table as a Spark dataframe
    dataframe_mysql = jdbc_df_reader.format("jdbc") \
        .options(**jdbc_params) \
        .load()
    
    # Print the dataframe schema
    dataframe_mysql.printSchema()</code>

此方法演示瞭如何將Apache Spark 與MySQL 集成,允許您將資料庫表作為Spark 資料幀存取。

以上是如何將 MySQL 表讀取為 Spark DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn