Heim  >  Artikel  >  Backend-Entwicklung  >  So verwenden Sie Apache Toree für Datenwissenschaft und Algorithmenentwicklung in der PHP-Entwicklung

So verwenden Sie Apache Toree für Datenwissenschaft und Algorithmenentwicklung in der PHP-Entwicklung

王林
王林Original
2023-06-25 18:41:351188Durchsuche

Apache Toree ist ein Open-Source-Jupyter-Kernel, der eine gemeinsame Schnittstelle für die Algorithmenentwicklung und datenwissenschaftliche Forschung in verschiedenen Sprachen bereitstellt, darunter Python, R, Scala und Java usw. In kleinen bis mittelgroßen Projekten und Teams ist PHP oft die Web-Programmiersprache der Wahl. Aber in Bezug auf Datenanalyse und Wissenschaft gibt es für PHP relativ wenige Möglichkeiten. Das Aufkommen von Apache Toree löst dieses Problem. In diesem Artikel wird erläutert, wie Sie Apache Toree für die Datenwissenschaft und Algorithmenentwicklung in der PHP-Entwicklung verwenden.

Apache Toree Installation und Bereitstellung
Zunächst ist es notwendig, Apache Toree in der PHP-Entwicklungsumgebung zu installieren und bereitzustellen. Unter dem CentOS-System können Sie den folgenden Befehl zur Installation verwenden:

sudo yum -y install python-pip
sudo yum -y install scala
sudo pip install --upgrade pip
sudo pip install jupyter
sudo pip install toree
sudo jupyter toree install --user --interpreters=Scala

Unter dem Windows-Betriebssystem führen Sie den folgenden Befehl in der Eingabeaufforderung aus, um die Vorbereitungsarbeiten abzuschließen:

  • Python2 installieren
  • Scala installieren
  • JDK installieren, make Stellen Sie sicher, dass die Java-Version mit dem Server übereinstimmt.
  • Installieren Sie Anaconda.
  • Installieren Sie Toree.
  • Installieren Sie Jupyter Notebook.
  • Installieren Sie den Toree-Kernel.

Das Folgende sind die Installationsschritte für Windows-Systeme:

  1. Installieren Sie Python2.
    Apache Toree unterstützt sowohl Python2- als auch Python3-Versionen. Damit Apache Toree ordnungsgemäß funktioniert, muss eine Python2-Umgebung installiert werden. Laden Sie das Python2-Installationspaket von der offiziellen Website herunter und klicken Sie zum Installieren.
  2. Scala installieren
    Laden Sie das Scala-Installationspaket von der offiziellen Website herunter und klicken Sie zum Installieren.
  3. JDK installieren
    Toree erfordert eine Java-Umgebung zum Ausführen. Laden Sie die zu Ihrem Betriebssystem passende JDK-Version von der offiziellen Website herunter und installieren Sie sie, oder verwenden Sie den folgenden Befehl zur Online-Installation:

    sudo yum install java-1.8.0-openjdk
  4. Anaconda installieren
    Laden Sie das Anaconda-Installationspaket herunter, um Jupyter Notebook zu installieren.
  5. Toree installieren
    Um Toree zu installieren, führen Sie den folgenden Befehl aus:

    pip install toree
  6. Jupyter Notebook installieren
    Um Jupyter Notebook zu installieren, führen Sie den folgenden Befehl aus:

    pip install jupyter
  7. Toree Kernel installieren
    Führen Sie die folgende Befehlszeile in der aus entsprechendes Anaconda-Installationsverzeichnis Das ist es. Allerdings müssen Sie Jupyter Notebook zuerst starten, um die Verbindung in Jupyter Notebook zu sehen.

    jupyter toree install --spark_home=C:path    oyoursparkhome --user

Nachdem die Installation abgeschlossen ist, starten Sie Jupyter Notebook, erstellen Sie ein neues Notebook in Notebook und wählen Sie Scala als Kernel aus.

Grundlegende Verwendung

Öffnen Sie ein neues Scala-Notebook in Jupyter Notebook, um mit der Verwendung von Apache Toree in PHP für Datenwissenschaft und Algorithmenentwicklung zu beginnen. Hier verwenden wir Spark als Beispiel zur Veranschaulichung.

Zuerst müssen Sie den Spark-Kontext laden und initialisieren. Geben Sie den folgenden Code ein:

val conf = new SparkConf().setAppName("test").setMaster("local")
val sc = new SparkContext(conf)

Hier ist SparkConf ein Konfigurationsobjekt, das zur Bereitstellung von Konfigurationsinformationen für SparkContext verwendet wird. Hier richten wir eine Anwendung namens „test“ ein und führen sie im lokalen Modus aus.

SparkContext ist ein Kernkonzept in Spark. Es handelt sich um ein Objekt, das den Kontext darstellt, in dem Spark ausgeführt wird. Das SparkContext-Objekt ist der Haupteinstiegspunkt für die Interaktion mit Spark in Ihrer Anwendung. Es kann zum Erstellen von RDDs, Akkumulatoren, Broadcast-Variablen usw. verwendet werden.

Als nächstes werden wir anhand eines einfachen Beispiels den grundlegenden Prozess der Verwendung von Apache Toree in PHP für Datenwissenschaft und Algorithmenentwicklung veranschaulichen. Angenommen, wir haben ein ganzzahliges Array mit 4 Daten und fragen nach der Summe der Quadrate jedes Elements. Diese Aufgabe können wir mit dem folgenden Code lösen:

val data = Array(1, 2, 3, 4)
val distData = sc.parallelize(data)
val result = distData.map(x => x * x).reduce((x, y) => x + y)
println(result)

Hier definieren wir zunächst ein Datenarray und konvertieren es dann in einen verteilten Datensatz distData. Als nächstes transformieren wir den verteilten Datensatz über eine Kartenoperation und quadrieren jedes Element. Schließlich summieren wir den verteilten Datensatz durch die Reduzierungsoperation, um das Ergebnis zu erhalten.

Zusammenfassung

In der PHP-Entwicklung ist die Verwendung von Apache Toree für Datenwissenschaft und Algorithmenentwicklung eine gute Wahl. Durch das Laden von Apache Toree können PHP-Entwickler Jupyter Notebooks für die Datenwissenschaft und Algorithmenentwicklung nutzen. Durch die Verbindung mit Apache Spark können PHP-Entwickler verteiltes Computing implementieren und große Datenmengen schnell verarbeiten. Darüber hinaus unterstützt Apache Toree auch mehrsprachige Operationen, einschließlich Python, R usw., was PHP-Entwicklern eine größere Auswahl bietet.

Das obige ist der detaillierte Inhalt vonSo verwenden Sie Apache Toree für Datenwissenschaft und Algorithmenentwicklung in der PHP-Entwicklung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn