Heim  >  Artikel  >  Backend-Entwicklung  >  Maschinelles Lernen in PHP: Erstellen Sie einen Nachrichtenklassifikator mit Rubix ML

Maschinelles Lernen in PHP: Erstellen Sie einen Nachrichtenklassifikator mit Rubix ML

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-11-03 03:33:31278Durchsuche

Machine Learning in PHP: Build a News Classifier Using Rubix ML

Einführung

Maschinelles Lernen ist überall – Filme empfehlen, Bilder markieren und jetzt sogar Nachrichtenartikel klassifizieren. Stellen Sie sich vor, Sie könnten das in PHP tun! Mit Rubix ML können Sie die Leistungsfähigkeit des maschinellen Lernens auf unkomplizierte und zugängliche Weise in PHP integrieren. Dieser Leitfaden führt Sie durch die Erstellung eines einfachen Nachrichtenklassifikators, der Artikel in Kategorien wie „Sport“ oder „Technologie“ sortiert. Am Ende verfügen Sie über einen funktionierenden Klassifikator, der Kategorien für neue Artikel anhand ihres Inhalts vorhersagen kann.

Dieses Projekt ist perfekt für Anfänger, die sich mit maschinellem Lernen mit PHP vertraut machen möchten, und Sie können den vollständigen Code auf GitHub verfolgen.

Inhaltsverzeichnis

  1. Was ist Rubix ML?
  2. Einrichten des Projekts
  3. Erstellen der Nachrichtenklassifizierungsklasse
  4. Training des Modells
  5. Vorhersage neuer Proben
  6. Abschließende Gedanken

Was ist Rubix ML?

Rubix ML ist eine maschinelle Lernbibliothek für PHP, die ML-Tools und -Algorithmen in eine PHP-freundliche Umgebung bringt. Egal, ob Sie an Klassifizierung, Regression, Clustering oder sogar der Verarbeitung natürlicher Sprache arbeiten, Rubix ML ist genau das Richtige für Sie. Es ermöglicht Ihnen, Daten zu laden und vorzuverarbeiten, Modelle zu trainieren und die Leistung zu bewerten – alles in PHP.

Rubix ML unterstützt eine breite Palette maschineller Lernaufgaben, wie zum Beispiel:

  • Klassifizierung: Kategorisieren von Daten, z. B. E-Mails als Spam oder Nicht-Spam kennzeichnen.
  • Regression: Vorhersage kontinuierlicher Werte, wie z. B. Immobilienpreise.
  • Clustering: Gruppieren von Daten ohne Labels, wie das Finden von Kundensegmenten.
  • Natural Language Processing (NLP): Arbeiten mit Textdaten, z. B. deren Tokenisierung und Umwandlung in verwendbare Formate für ML.

Sehen wir uns an, wie Sie mit Rubix ML einen einfachen Nachrichtenklassifikator in PHP erstellen können!

Einrichten des Projekts

Wir beginnen mit der Einrichtung eines neuen PHP-Projekts mit Rubix ML und der Konfiguration des automatischen Ladens.

Schritt 1: Initialisieren Sie das Projektverzeichnis

Erstellen Sie ein neues Projektverzeichnis und navigieren Sie dorthin:

mkdir NewsClassifier
cd NewsClassifier

Schritt 2: Installieren Sie Rubix ML mit Composer

Stellen Sie sicher, dass Composer installiert ist, und fügen Sie dann Rubix ML zu Ihrem Projekt hinzu, indem Sie Folgendes ausführen:

composer require rubix/ml

Schritt 3: Konfigurieren Sie das automatische Laden in Composer.json

Um Klassen automatisch aus dem src-Verzeichnis unseres Projekts zu laden, öffnen oder erstellen Sie eine Composer.json-Datei und fügen Sie die folgende Konfiguration hinzu:

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

Dadurch wird Composer angewiesen, alle Klassen im src-Ordner unter dem NewsClassifier-Namespace automatisch zu laden.

Schritt 4: Führen Sie Composer Autoload Dump aus

Führen Sie nach dem Hinzufügen der Autoload-Konfiguration den folgenden Befehl aus, um den Autoloader von Composer neu zu generieren:

mkdir NewsClassifier
cd NewsClassifier

Schritt 5: Verzeichnisstruktur

Ihr Projektverzeichnis sollte so aussehen:

composer require rubix/ml
  • src/: Enthält Ihre PHP-Skripte.
  • Speicher/: Wo das trainierte Modell gespeichert wird.
  • Anbieter/: Enthält von Composer installierte Abhängigkeiten.

Erstellen der Nachrichtenklassifizierungsklasse

Erstellen Sie in src/ eine Datei namens Classification.php. Diese Datei enthält die Methoden zum Trainieren des Modells und zur Vorhersage von Nachrichtenkategorien.

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

Diese Klassifizierungsklasse enthält Methoden für:

  • Trainieren: Erstellen und trainieren Sie ein Pipeline-basiertes Modell.
  • Modell speichern: Speichern Sie das trainierte Modell im angegebenen Pfad.
  • Vorhersage: Laden Sie das gespeicherte Modell und prognostizieren Sie die Kategorie für neue Proben.

Trainieren des Modells

Erstellen Sie in src/ ein Skript namens train.php, um das Modell zu trainieren.

composer dump-autoload

Führen Sie dieses Skript aus, um das Modell zu trainieren:

NewsClassifier/
├── src/
│   ├── Classification.php
│   └── train.php
├── storage/
├── vendor/
├── composer.json
└── composer.lock

Bei Erfolg sehen Sie Folgendes:

<?php

namespace NewsClassifier;

use Rubix\ML\Classifiers\KNearestNeighbors;
use Rubix\ML\Datasets\Labeled;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\PersistentModel;
use Rubix\ML\Pipeline;
use Rubix\ML\Tokenizers\Word;
use Rubix\ML\Transformers\TfIdfTransformer;
use Rubix\ML\Transformers\WordCountVectorizer;
use Rubix\ML\Persisters\Filesystem;

class Classification
{
    private $modelPath;

    public function __construct($modelPath)
    {
        $this->modelPath = $modelPath;
    }

    public function train()
    {
        // Sample data and corresponding labels
        $samples = [
            ['The team played an amazing game of soccer'],
            ['The new programming language has been released'],
            ['The match between the two teams was incredible'],
            ['The new tech gadget has been launched'],
        ];

        $labels = [
            'sports',
            'technology',
            'sports',
            'technology',
        ];

        // Create a labeled dataset
        $dataset = new Labeled($samples, $labels);

        // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier
        $estimator = new Pipeline([
            new WordCountVectorizer(10000, 1, 1, new Word()),
            new TfIdfTransformer(),
        ], new KNearestNeighbors(4));

        // Train the model
        $estimator->train($dataset);

        // Save the model
        $this->saveModel($estimator);

        echo "Training completed and model saved.\n";
    }

    private function saveModel($estimator)
    {
        $persister = new Filesystem($this->modelPath);
        $model = new PersistentModel($estimator, $persister);
        $model->save();
    }

    public function predict(array $samples)
    {
        // Load the saved model
        $persister = new Filesystem($this->modelPath);
        $model = PersistentModel::load($persister);

        // Predict categories for new samples
        $dataset = new Unlabeled($samples);
        return $model->predict($dataset);
    }
}

Vorhersage neuer Proben

Erstellen Sie ein weiteres Skript, Predict.php, in src/, um neue Artikel basierend auf dem trainierten Modell zu klassifizieren.

<?php

require __DIR__ . '/../vendor/autoload.php';

use NewsClassifier\Classification;

// Define the model path
$modelPath = __DIR__ . '/../storage/model.rbx';

// Initialize the Classification object
$classifier = new Classification($modelPath);

// Train the model and save it
$classifier->train();

Führen Sie das Vorhersageskript aus, um die Proben zu klassifizieren:

php src/train.php

Die Ausgabe sollte jeden Beispieltext mit seiner vorhergesagten Kategorie anzeigen.

Letzte Gedanken

Mit dieser Anleitung haben Sie mit Rubix ML erfolgreich einen einfachen Nachrichtenklassifikator in PHP erstellt! Dies zeigt, dass PHP vielseitiger sein kann, als Sie vielleicht denken, und Funktionen für maschinelles Lernen für Aufgaben wie Textklassifizierung, Empfehlungssysteme und mehr bietet. Der vollständige Code für dieses Projekt ist auf GitHub verfügbar.

Experimentieren Sie mit verschiedenen Algorithmen oder Daten, um den Klassifikator zu erweitern. Wer hätte gedacht, dass PHP maschinelles Lernen ermöglichen kann? Jetzt tust du es.
Viel Spaß beim Codieren!

Das obige ist der detaillierte Inhalt vonMaschinelles Lernen in PHP: Erstellen Sie einen Nachrichtenklassifikator mit Rubix ML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn