首页  >  文章  >  数据库  >  如何将 MySQL 表读取为 Spark DataFrame?

如何将 MySQL 表读取为 Spark DataFrame?

Patricia Arquette
Patricia Arquette原创
2024-11-01 02:08:02119浏览

How to Read MySQL Tables as Spark DataFrames?

将 Apache Spark 与 MySQL 集成以读取数据库表

要将 Apache Spark 与 MySQL 连接并将数据库表用作 Spark 数据帧,请按照以下步骤操作:

  1. 创造火花Session:

    <code class="python">from pyspark.sql import SparkSession
    
    # Create a Spark session object
    spark = SparkSession.builder \
        .appName("Spark-MySQL-Integration") \
        .getOrCreate()</code>
  2. 实例化 MySQL Connector:

    <code class="python">from pyspark.sql import DataFrameReader
    
    # Create a DataFrameReader object for MySQL connection
    jdbc_df_reader = DataFrameReader(spark)</code>
  3. 配置MySQL连接参数:

    <code class="python"># Set MySQL connection parameters
    jdbc_params = {
        "url": "jdbc:mysql://localhost:3306/my_db",
        "driver": "com.mysql.jdbc.Driver",
        "dbtable": "my_table",
        "user": "root",
        "password": "password"
    }</code>
  4. 读取数据库表:

    <code class="python"># Read the MySQL table as a Spark dataframe
    dataframe_mysql = jdbc_df_reader.format("jdbc") \
        .options(**jdbc_params) \
        .load()
    
    # Print the dataframe schema
    dataframe_mysql.printSchema()</code>

此方法演示了如何将 Apache Spark 与 MySQL 集成,允许您将数据库表作为 Spark 数据帧访问。

以上是如何将 MySQL 表读取为 Spark DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn