suchen
HeimBackend-EntwicklungPHP-TutorialMaschinelles Lernen in PHP: Erstellen Sie einen Nachrichtenklassifikator mit Rubix ML

Machine Learning in PHP: Build a News Classifier Using Rubix ML

Einführung

Maschinelles Lernen ist überall – Filme empfehlen, Bilder markieren und jetzt sogar Nachrichtenartikel klassifizieren. Stellen Sie sich vor, Sie könnten das in PHP tun! Mit Rubix ML können Sie die Leistungsfähigkeit des maschinellen Lernens auf unkomplizierte und zugängliche Weise in PHP integrieren. Dieser Leitfaden führt Sie durch die Erstellung eines einfachen Nachrichtenklassifikators, der Artikel in Kategorien wie „Sport“ oder „Technologie“ sortiert. Am Ende verfügen Sie über einen funktionierenden Klassifikator, der Kategorien für neue Artikel anhand ihres Inhalts vorhersagen kann.

Dieses Projekt ist perfekt für Anfänger, die sich mit maschinellem Lernen mit PHP vertraut machen möchten, und Sie können den vollständigen Code auf GitHub verfolgen.

Inhaltsverzeichnis

  1. Was ist Rubix ML?
  2. Einrichten des Projekts
  3. Erstellen der Nachrichtenklassifizierungsklasse
  4. Training des Modells
  5. Vorhersage neuer Proben
  6. Abschließende Gedanken

Was ist Rubix ML?

Rubix ML ist eine maschinelle Lernbibliothek für PHP, die ML-Tools und -Algorithmen in eine PHP-freundliche Umgebung bringt. Egal, ob Sie an Klassifizierung, Regression, Clustering oder sogar der Verarbeitung natürlicher Sprache arbeiten, Rubix ML ist genau das Richtige für Sie. Es ermöglicht Ihnen, Daten zu laden und vorzuverarbeiten, Modelle zu trainieren und die Leistung zu bewerten – alles in PHP.

Rubix ML unterstützt eine breite Palette maschineller Lernaufgaben, wie zum Beispiel:

  • Klassifizierung: Kategorisieren von Daten, z. B. E-Mails als Spam oder Nicht-Spam kennzeichnen.
  • Regression: Vorhersage kontinuierlicher Werte, wie z. B. Immobilienpreise.
  • Clustering: Gruppieren von Daten ohne Labels, wie das Finden von Kundensegmenten.
  • Natural Language Processing (NLP): Arbeiten mit Textdaten, z. B. deren Tokenisierung und Umwandlung in verwendbare Formate für ML.

Sehen wir uns an, wie Sie mit Rubix ML einen einfachen Nachrichtenklassifikator in PHP erstellen können!

Einrichten des Projekts

Wir beginnen mit der Einrichtung eines neuen PHP-Projekts mit Rubix ML und der Konfiguration des automatischen Ladens.

Schritt 1: Initialisieren Sie das Projektverzeichnis

Erstellen Sie ein neues Projektverzeichnis und navigieren Sie dorthin:

mkdir NewsClassifier
cd NewsClassifier

Schritt 2: Installieren Sie Rubix ML mit Composer

Stellen Sie sicher, dass Composer installiert ist, und fügen Sie dann Rubix ML zu Ihrem Projekt hinzu, indem Sie Folgendes ausführen:

composer require rubix/ml

Schritt 3: Konfigurieren Sie das automatische Laden in Composer.json

Um Klassen automatisch aus dem src-Verzeichnis unseres Projekts zu laden, öffnen oder erstellen Sie eine Composer.json-Datei und fügen Sie die folgende Konfiguration hinzu:

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

Dadurch wird Composer angewiesen, alle Klassen im src-Ordner unter dem NewsClassifier-Namespace automatisch zu laden.

Schritt 4: Führen Sie Composer Autoload Dump aus

Führen Sie nach dem Hinzufügen der Autoload-Konfiguration den folgenden Befehl aus, um den Autoloader von Composer neu zu generieren:

mkdir NewsClassifier
cd NewsClassifier

Schritt 5: Verzeichnisstruktur

Ihr Projektverzeichnis sollte so aussehen:

composer require rubix/ml
  • src/: Enthält Ihre PHP-Skripte.
  • Speicher/: Wo das trainierte Modell gespeichert wird.
  • Anbieter/: Enthält von Composer installierte Abhängigkeiten.

Erstellen der Nachrichtenklassifizierungsklasse

Erstellen Sie in src/ eine Datei namens Classification.php. Diese Datei enthält die Methoden zum Trainieren des Modells und zur Vorhersage von Nachrichtenkategorien.

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

Diese Klassifizierungsklasse enthält Methoden für:

  • Trainieren: Erstellen und trainieren Sie ein Pipeline-basiertes Modell.
  • Modell speichern: Speichern Sie das trainierte Modell im angegebenen Pfad.
  • Vorhersage: Laden Sie das gespeicherte Modell und prognostizieren Sie die Kategorie für neue Proben.

Trainieren des Modells

Erstellen Sie in src/ ein Skript namens train.php, um das Modell zu trainieren.

composer dump-autoload

Führen Sie dieses Skript aus, um das Modell zu trainieren:

NewsClassifier/
├── src/
│   ├── Classification.php
│   └── train.php
├── storage/
├── vendor/
├── composer.json
└── composer.lock

Bei Erfolg sehen Sie Folgendes:

<?php namespace NewsClassifier;

use Rubix\ML\Classifiers\KNearestNeighbors;
use Rubix\ML\Datasets\Labeled;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\PersistentModel;
use Rubix\ML\Pipeline;
use Rubix\ML\Tokenizers\Word;
use Rubix\ML\Transformers\TfIdfTransformer;
use Rubix\ML\Transformers\WordCountVectorizer;
use Rubix\ML\Persisters\Filesystem;

class Classification
{
    private $modelPath;

    public function __construct($modelPath)
    {
        $this->modelPath = $modelPath;
    }

    public function train()
    {
        // Sample data and corresponding labels
        $samples = [
            ['The team played an amazing game of soccer'],
            ['The new programming language has been released'],
            ['The match between the two teams was incredible'],
            ['The new tech gadget has been launched'],
        ];

        $labels = [
            'sports',
            'technology',
            'sports',
            'technology',
        ];

        // Create a labeled dataset
        $dataset = new Labeled($samples, $labels);

        // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier
        $estimator = new Pipeline([
            new WordCountVectorizer(10000, 1, 1, new Word()),
            new TfIdfTransformer(),
        ], new KNearestNeighbors(4));

        // Train the model
        $estimator->train($dataset);

        // Save the model
        $this->saveModel($estimator);

        echo "Training completed and model saved.\n";
    }

    private function saveModel($estimator)
    {
        $persister = new Filesystem($this->modelPath);
        $model = new PersistentModel($estimator, $persister);
        $model->save();
    }

    public function predict(array $samples)
    {
        // Load the saved model
        $persister = new Filesystem($this->modelPath);
        $model = PersistentModel::load($persister);

        // Predict categories for new samples
        $dataset = new Unlabeled($samples);
        return $model->predict($dataset);
    }
}

Vorhersage neuer Proben

Erstellen Sie ein weiteres Skript, Predict.php, in src/, um neue Artikel basierend auf dem trainierten Modell zu klassifizieren.

<?php require __DIR__ . '/../vendor/autoload.php';

use NewsClassifier\Classification;

// Define the model path
$modelPath = __DIR__ . '/../storage/model.rbx';

// Initialize the Classification object
$classifier = new Classification($modelPath);

// Train the model and save it
$classifier->train();

Führen Sie das Vorhersageskript aus, um die Proben zu klassifizieren:

php src/train.php

Die Ausgabe sollte jeden Beispieltext mit seiner vorhergesagten Kategorie anzeigen.

Letzte Gedanken

Mit dieser Anleitung haben Sie mit Rubix ML erfolgreich einen einfachen Nachrichtenklassifikator in PHP erstellt! Dies zeigt, dass PHP vielseitiger sein kann, als Sie vielleicht denken, und Funktionen für maschinelles Lernen für Aufgaben wie Textklassifizierung, Empfehlungssysteme und mehr bietet. Der vollständige Code für dieses Projekt ist auf GitHub verfügbar.

Experimentieren Sie mit verschiedenen Algorithmen oder Daten, um den Klassifikator zu erweitern. Wer hätte gedacht, dass PHP maschinelles Lernen ermöglichen kann? Jetzt tust du es.
Viel Spaß beim Codieren!

Das obige ist der detaillierte Inhalt vonMaschinelles Lernen in PHP: Erstellen Sie einen Nachrichtenklassifikator mit Rubix ML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
PHP vs. Python: Verständnis der UnterschiedePHP vs. Python: Verständnis der UnterschiedeApr 11, 2025 am 12:15 AM

PHP und Python haben jeweils ihre eigenen Vorteile, und die Wahl sollte auf Projektanforderungen beruhen. 1.PHP eignet sich für die Webentwicklung mit einfacher Syntax und hoher Ausführungseffizienz. 2. Python eignet sich für Datenwissenschaft und maschinelles Lernen mit präziser Syntax und reichhaltigen Bibliotheken.

PHP: Stirbt es oder passt es sich einfach an?PHP: Stirbt es oder passt es sich einfach an?Apr 11, 2025 am 12:13 AM

PHP stirbt nicht, sondern sich ständig anpasst und weiterentwickelt. 1) PHP hat seit 1994 mehreren Versionen für die Version unterzogen, um sich an neue Technologietrends anzupassen. 2) Es wird derzeit in E-Commerce, Content-Management-Systemen und anderen Bereichen häufig verwendet. 3) PHP8 führt den JIT -Compiler und andere Funktionen ein, um die Leistung und Modernisierung zu verbessern. 4) Verwenden Sie Opcache und befolgen Sie die PSR-12-Standards, um die Leistung und die Codequalität zu optimieren.

Die Zukunft von PHP: Anpassungen und InnovationenDie Zukunft von PHP: Anpassungen und InnovationenApr 11, 2025 am 12:01 AM

Die Zukunft von PHP wird erreicht, indem sich an neue Technologietrends angepasst und innovative Funktionen eingeführt werden: 1) Anpassung an Cloud Computing, Containerisierung und Microservice -Architekturen, Unterstützung von Docker und Kubernetes; 2) Einführung von JIT -Compilern und Aufzählungsarten zur Verbesserung der Leistung und der Datenverarbeitungseffizienz; 3) die Leistung kontinuierlich optimieren und Best Practices fördern.

Wann würden Sie ein Merkmal gegenüber einer abstrakten Klasse oder Schnittstelle in PHP verwenden?Wann würden Sie ein Merkmal gegenüber einer abstrakten Klasse oder Schnittstelle in PHP verwenden?Apr 10, 2025 am 09:39 AM

In PHP eignet sich das Merkmal für Situationen, in denen die Wiederverwendung von Methoden erforderlich ist, aber nicht zur Erbschaft geeignet ist. 1) Das Merkmal ermöglicht Multiplexing -Methoden in Klassen, um die Komplexität mehrerer Vererbungskomplexität zu vermeiden. 2) Bei Verwendung von Merkmalen müssen Sie auf Methodenkonflikte achten, die durch die Alternative und als Schlüsselwörter gelöst werden können. 3) Überbeanspruchte des Merkmals sollte vermieden werden und seine einzelne Verantwortung sollte beibehalten werden, um die Leistung zu optimieren und die Code -Wartbarkeit zu verbessern.

Was ist ein Abhängigkeitsinjektionsbehälter (DIC) und warum eine in PHP verwenden?Was ist ein Abhängigkeitsinjektionsbehälter (DIC) und warum eine in PHP verwenden?Apr 10, 2025 am 09:38 AM

Abhängigkeitsinjektionsbehälter (DIC) ist ein Tool, das Objektabhängigkeiten für die Verwendung in PHP -Projekten verwaltet und bereitstellt. Die Hauptvorteile von DIC sind: 1. Entkopplung, Machen von Komponenten unabhängig, und der Code ist leicht zu warten und zu testen; 2. Flexibilität, leicht zu ersetzen oder zu ändern; 3.. Testbarkeit, bequem für die Injektion von Scheinobjekten für Unit -Tests.

Erklären Sie die SPLFixedArray und seine Leistungseigenschaften im Vergleich zu regulären PHP -Arrays.Erklären Sie die SPLFixedArray und seine Leistungseigenschaften im Vergleich zu regulären PHP -Arrays.Apr 10, 2025 am 09:37 AM

SplfixedArray ist ein Array mit fester Größe in PHP, das für Szenarien geeignet ist, in denen hohe Leistung und geringe Speicherverbrauch erforderlich sind. 1) Es muss die Größe beim Erstellen angeben, um den durch dynamischen Einstellungen verursachten Overhead zu vermeiden. 2) Basierend auf C -Spracharray betreibt direkt Speicher und schnelle Zugriffsgeschwindigkeit. 3) Geeignet für eine großräumige Datenverarbeitung und speicherempfindliche Umgebungen, muss jedoch mit Vorsicht verwendet werden, da seine Größe festgelegt ist.

Wie kann PHP -Datei sicher sicher hochladen?Wie kann PHP -Datei sicher sicher hochladen?Apr 10, 2025 am 09:37 AM

PHP überlädt Datei -Hochladen über die Variable $ \ _ Dateien. Zu den Methoden zur Sicherstellung gehören: 1. Upload -Fehler, 2. Dateityp und -größe überprüfen, 3.. Dateiüberschreibung verhindern, 4. Verschieben von Dateien auf einen dauerhaften Speicherort.

Was ist der Null -Koalescing -Operator (??) und der Null -Koalescing -Zuweisungsoperator (?? =)?Was ist der Null -Koalescing -Operator (??) und der Null -Koalescing -Zuweisungsoperator (?? =)?Apr 10, 2025 am 09:33 AM

In JavaScript können Sie NullCoalescingoperator (??) und NullCoalescingAssignmentoperator (?? =) verwenden. 1.??? 2.??= Weisen Sie den Wert des rechten Operanden die Variable zu, jedoch nur, wenn die Variable null oder undefiniert ist. Diese Operatoren vereinfachen die Codelogik und verbessern die Lesbarkeit und Leistung.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

mPDF

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)