Rumah  >  Artikel  >  pangkalan data  >  Bagaimana untuk Membaca Jadual Pangkalan Data MySQL sebagai Spark DataFrames?

Bagaimana untuk Membaca Jadual Pangkalan Data MySQL sebagai Spark DataFrames?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-10-31 04:23:01916semak imbas

How to Read MySQL Database Tables as Spark DataFrames?

Mengintegrasikan Apache Spark dengan MySQL untuk Membaca Jadual Pangkalan Data sebagai Spark DataFrames

Untuk menyambungkan Apache Spark dengan MySQL dengan lancar dan mendapatkan data daripada jadual pangkalan data sebagai Spark DataFrames, ikuti langkah berikut:

Dari PySpark, gunakan fungsi mySqlContext.read untuk mewujudkan sambungan:

<code class="python">dataframe_mysql = mySqlContext.read.format("jdbc")</code>

Tetapkan parameter konfigurasi yang diperlukan untuk sambungan MySQL:

  1. url: Tentukan URL JDBC untuk pangkalan data MySQL.
  2. pemandu: Tentukan pemacu JDBC untuk MySQL (cth., "com.mysql.jdbc.Driver").
  3. dbtable: Nyatakan nama jadual MySQL untuk membaca data.
  4. pengguna: Sediakan nama pengguna untuk mengakses pangkalan data MySQL.
  5. kata laluan: Tentukan kata laluan untuk pengguna MySQL.

Muatkan data jadual ke dalam DataFrame menggunakan kaedah beban:

<code class="python">dataframe_mysql = dataframe_mysql.options(
    url="jdbc:mysql://localhost:3306/my_bd_name",
    driver = "com.mysql.jdbc.Driver",
    dbtable = "my_tablename",
    user="root",
    password="root").load()</code>

Setelah anda memuatkan data ke dalam DataFrame, anda boleh melakukan pelbagai operasi padanya, seperti transformasi dan pengagregatan , menggunakan set kaya Spark bagi API.

Atas ialah kandungan terperinci Bagaimana untuk Membaca Jadual Pangkalan Data MySQL sebagai Spark DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn