Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara menggunakan Apache Toree untuk pembangunan sains data dan algoritma dalam pembangunan PHP

Cara menggunakan Apache Toree untuk pembangunan sains data dan algoritma dalam pembangunan PHP

王林
王林asal
2023-06-25 18:41:351168semak imbas

Apache Toree ialah Jupyter Kernel sumber terbuka yang menyediakan antara muka biasa untuk pembangunan algoritma dan penyelidikan sains data dalam pelbagai bahasa, termasuk Python, R, Scala dan Java, dsb. Dalam projek dan pasukan kecil hingga sederhana, PHP selalunya menjadi bahasa pengaturcaraan web pilihan. Tetapi dari segi analisis data dan sains, PHP mempunyai pilihan yang agak sedikit Pada masa ini, kemunculan Apache Toree menyelesaikan masalah ini. Artikel ini akan memperkenalkan cara menggunakan Apache Toree untuk pembangunan sains data dan algoritma dalam pembangunan PHP.

Pemasangan dan Deployment Apache Toree
Pertama, adalah perlu untuk memasang dan menggunakan Apache Toree dalam persekitaran pembangunan PHP. Di bawah sistem CentOS, anda boleh menggunakan arahan berikut untuk memasang:

sudo yum -y install python-pip
sudo yum -y install scala
sudo pip install --upgrade pip
sudo pip install jupyter
sudo pip install toree
sudo jupyter toree install --user --interpreters=Scala

Di bawah sistem pengendalian Windows, jalankan arahan berikut dalam command prompt untuk menyelesaikan kerja penyediaan:

  • Install Python2
  • Install Scala
  • Install JDK, make Pasti versi Java selaras dengan perlawanan pelayan
  • stall Anaconda
  • install Torne
  • install Jupyter Notebook
  • Stall Toree Kernel

The berikut adalah langkah -langkah pemasangan untuk sistem Windows: kedua-dua versi Python2 dan Python3. Untuk membolehkan Apache Toree berfungsi dengan baik, persekitaran Python2 perlu dipasang. Muat turun pakej pemasangan Python2 dari laman web rasmi dan klik untuk memasang.

    Pasang Scala
  1. Muat turun pakej pemasangan Scala dari laman web rasmi dan klik untuk memasang.
  2. Pasang JDK
    Toree memerlukan persekitaran Java untuk dijalankan. Muat turun dan pasang versi JDK yang sepadan dengan sistem pengendalian anda daripada tapak web rasmi, atau gunakan arahan berikut untuk memasang dalam talian:
  3. sudo yum install java-1.8.0-openjdk
  4. Pasang Anaconda
    Muat turun pakej pemasangan Anaconda untuk memasang Jupyter Notebook.

  5. Pasang toree
    Untuk memasang toree, laksanakan arahan berikut:
  6. pip install toree

  7. Pasang Jupyter Notebook

    Untuk memasang Jupyter Notebook, laksanakan arahan berikut:
  8. pip install jupyter
  9. perintah berikut:

    jupyter toree install --spark_home=C:path    oyoursparkhome --user

    yang direktori pemasangan Anaconda yang sepadan Itu sahaja. Walau bagaimanapun, anda perlu memulakan Buku Nota Jupyter terlebih dahulu untuk melihat sambungan dalam Buku Nota Jupyter.

    val conf = new SparkConf().setAppName("test").setMaster("local")
    val sc = new SparkContext(conf)
  10. Selepas pemasangan selesai, mulakan Jupyter Notebook, buat Notebook baharu dalam Notebook dan pilih Scala sebagai Kernel.

    Penggunaan Asas
Buka Buku Nota Scala baharu dalam Buku Nota Jupyter untuk mula menggunakan Apache Toree dalam PHP untuk pembangunan sains data dan algoritma. Di sini kami menggunakan Spark sebagai contoh untuk menggambarkan.

Mula-mula anda perlu memuatkan dan memulakan konteks Spark, masukkan kod berikut:

val data = Array(1, 2, 3, 4)
val distData = sc.parallelize(data)
val result = distData.map(x => x * x).reduce((x, y) => x + y)
println(result)

Di sini, SparkConf ialah objek konfigurasi, yang digunakan untuk menyediakan maklumat konfigurasi untuk SparkContext. Di sini kami menyediakan aplikasi yang dipanggil "ujian" dan menjalankannya dalam mod tempatan.

SparkContext ialah konsep teras dalam Spark Ia adalah objek yang mewakili konteks di mana Spark dijalankan. Objek SparkContext ialah titik masuk utama untuk berinteraksi dengan Spark dalam aplikasi anda. Ia boleh digunakan untuk mencipta RDD, akumulator, pembolehubah siaran, dsb.

Seterusnya, kami akan menggunakan contoh mudah untuk menggambarkan proses asas menggunakan Apache Toree dalam PHP untuk pembangunan sains data dan algoritma. Katakan kita mempunyai tatasusunan integer 4 data dan kita meminta jumlah kuasa dua setiap elemen. Kita boleh mencapai tugas ini menggunakan kod berikut:

rrreee

Di sini, kita mula-mula mentakrifkan data tatasusunan dan kemudian menukarnya menjadi set data teragih distData. Seterusnya, kami mengubah set data yang diedarkan melalui operasi peta, menduakan setiap elemen. Akhir sekali, kami menjumlahkan set data yang diedarkan melalui operasi pengurangan untuk mendapatkan hasilnya.

Ringkasan

Dalam pembangunan PHP, menggunakan Apache Toree untuk pembangunan sains data dan algoritma ialah pilihan yang baik. Dengan memuatkan Apache Toree, pembangun PHP boleh menggunakan Jupyter Notebooks untuk pembangunan sains data dan algoritma. Dengan menyambung ke Apache Spark, pembangun PHP boleh melaksanakan pengkomputeran teragih dan memproses data besar-besaran dengan cepat. Selain itu, Apache Toree juga menyokong operasi berbilang bahasa, termasuk Python, R, dsb., menyediakan pembangun PHP dengan pelbagai pilihan yang lebih luas.

Atas ialah kandungan terperinci Cara menggunakan Apache Toree untuk pembangunan sains data dan algoritma dalam pembangunan PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn