検索
ホームページバックエンド開発PHPチュートリアルPHP での機械学習: Rubix ML を使用してニュース分類器を構築する

Machine Learning in PHP: Build a News Classifier Using Rubix ML

導入

機械学習はあらゆるところに使われており、映画の推奨、画像のタグ付け、そして今ではニュース記事の分類にも使用されています。 PHP 内でそれができるかどうか想像してみてください。 Rubix ML を使用すると、簡単でアクセスしやすい方法で機械学習のパワーを PHP に導入できます。このガイドでは、記事を「スポーツ」や「テクノロジー」などのカテゴリに分類する簡単なニュース分類子を構築する手順を説明します。最終的には、新しい記事の内容に基づいてカテゴリを予測できる実用的な分類器が完成します。

このプロジェクトは、PHP を使用した機械学習に少し足を踏み入れたい初心者に最適で、GitHub で完全なコードに従うことができます。

目次

  1. Rubix ML とは何ですか?
  2. プロジェクトのセットアップ
  3. ニュース分類クラスの作成
  4. モデルのトレーニング
  5. 新しいサンプルの予測
  6. 最終的な感想

Rubix MLとは何ですか?

Rubix ML は、ML ツールとアルゴリズムを PHP に適した環境に組み込む、PHP 用の機械学習ライブラリです。分類、回帰、クラスタリング、さらには自然言語処理に取り組んでいる場合でも、Rubix ML が対応します。これにより、データのロードと前処理、モデルのトレーニング、パフォーマンスの評価をすべて PHP で行うことができます。

Rubix ML は、次のような幅広い機械学習タスクをサポートします。

  • 分類: 電子メールをスパムまたはスパムではないというラベル付けなど、データを分類します。
  • 回帰: 住宅価格などの連続値を予測します。
  • クラスタリング: 顧客セグメントの検索など、ラベルを付けずにデータをグループ化します。
  • 自然言語処理 (NLP): テキスト データのトークン化や ML で使用可能な形式への変換などの作業。

Rubix ML を使用して、PHP で単純なニュース分類子を構築する方法を詳しく見てみましょう!

プロジェクトのセットアップ

まず、Rubix ML を使用して新しい PHP プロジェクトをセットアップし、自動読み込みを構成します。

ステップ 1: プロジェクト ディレクトリを初期化する

新しいプロジェクト ディレクトリを作成し、そこに移動します:

mkdir NewsClassifier
cd NewsClassifier

ステップ 2: Composer を使用して Rubix ML をインストールする

Composer がインストールされていることを確認し、次のコマンドを実行して Rubix ML をプロジェクトに追加します。

composer require rubix/ml

ステップ 3:composer.json で自動ロードを構成する

プロジェクトの src ディレクトリからクラスを自動ロードするには、composer.json ファイルを開くか作成し、次の構成を追加します。

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

これは、NewsClassifier 名前空間の下の src フォルダー内のクラスを自動ロードするように Composer に指示します。

ステップ 4: Composer 自動ロード ダンプを実行する

オートロード構成を追加した後、次のコマンドを実行して Composer のオートローダーを再生成します。

mkdir NewsClassifier
cd NewsClassifier

ステップ 5: ディレクトリ構造

プロジェクト ディレクトリは次のようになります:

composer require rubix/ml
  • src/: PHP スクリプトが含まれます。
  • storage/: トレーニングされたモデルが保存される場所。
  • vendor/: Composer によってインストールされた依存関係が含まれます。

ニュース分類クラスの作成

src/ で、Classification.php というファイルを作成します。このファイルには、モデルをトレーニングし、ニュース カテゴリを予測するためのメソッドが含まれます。

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}

この分類クラスには次のメソッドが含まれています:

  • トレーニング: パイプラインベースのモデルを作成してトレーニングします。
  • モデルを保存: トレーニングされたモデルを指定されたパスに保存します。
  • 予測: 保存されたモデルをロードし、新しいサンプルのカテゴリを予測します。

モデルのトレーニング

モデルをトレーニングするために、src/ に train.php というスクリプトを作成します。

composer dump-autoload

次のスクリプトを実行してモデルをトレーニングします:

NewsClassifier/
├── src/
│   ├── Classification.php
│   └── train.php
├── storage/
├── vendor/
├── composer.json
└── composer.lock

成功すると、以下が表示されます:

<?php namespace NewsClassifier;

use Rubix\ML\Classifiers\KNearestNeighbors;
use Rubix\ML\Datasets\Labeled;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\PersistentModel;
use Rubix\ML\Pipeline;
use Rubix\ML\Tokenizers\Word;
use Rubix\ML\Transformers\TfIdfTransformer;
use Rubix\ML\Transformers\WordCountVectorizer;
use Rubix\ML\Persisters\Filesystem;

class Classification
{
    private $modelPath;

    public function __construct($modelPath)
    {
        $this->modelPath = $modelPath;
    }

    public function train()
    {
        // Sample data and corresponding labels
        $samples = [
            ['The team played an amazing game of soccer'],
            ['The new programming language has been released'],
            ['The match between the two teams was incredible'],
            ['The new tech gadget has been launched'],
        ];

        $labels = [
            'sports',
            'technology',
            'sports',
            'technology',
        ];

        // Create a labeled dataset
        $dataset = new Labeled($samples, $labels);

        // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier
        $estimator = new Pipeline([
            new WordCountVectorizer(10000, 1, 1, new Word()),
            new TfIdfTransformer(),
        ], new KNearestNeighbors(4));

        // Train the model
        $estimator->train($dataset);

        // Save the model
        $this->saveModel($estimator);

        echo "Training completed and model saved.\n";
    }

    private function saveModel($estimator)
    {
        $persister = new Filesystem($this->modelPath);
        $model = new PersistentModel($estimator, $persister);
        $model->save();
    }

    public function predict(array $samples)
    {
        // Load the saved model
        $persister = new Filesystem($this->modelPath);
        $model = PersistentModel::load($persister);

        // Predict categories for new samples
        $dataset = new Unlabeled($samples);
        return $model->predict($dataset);
    }
}

新しいサンプルの予測

トレーニングされたモデルに基づいて新しい記事を分類するために、src/ に別のスクリプト、predict.php を作成します。

<?php require __DIR__ . '/../vendor/autoload.php';

use NewsClassifier\Classification;

// Define the model path
$modelPath = __DIR__ . '/../storage/model.rbx';

// Initialize the Classification object
$classifier = new Classification($modelPath);

// Train the model and save it
$classifier->train();

予測スクリプトを実行してサンプルを分類します:

php src/train.php

出力には、各サンプル テキストとその予測されたカテゴリが表示されます。

最終的な考え

このガイドでは、Rubix ML を使用して PHP で単純なニュース分類器を構築することに成功しました。これは、PHP が想像以上に多用途であり、テキスト分類や推奨システムなどのタスクに機械学習機能を組み込むことができることを示しています。このプロジェクトの完全なコードは GitHub で入手できます。

さまざまなアルゴリズムやデータを試して、分類器を拡張します。 PHP で機械学習ができるなんて誰が知っていたでしょうか?さあ、そうしましょう。
コーディングを楽しんでください!

以上がPHP での機械学習: Rubix ML を使用してニュース分類器を構築するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
Laravelでフラッシュセッションデータを使用しますLaravelでフラッシュセッションデータを使用しますMar 12, 2025 pm 05:08 PM

Laravelは、直感的なフラッシュメソッドを使用して、一時的なセッションデータの処理を簡素化します。これは、アプリケーション内に簡単なメッセージ、アラート、または通知を表示するのに最適です。 データは、デフォルトで次の要求のためにのみ持続します。 $リクエスト -

PHPのカール:REST APIでPHPカール拡張機能を使用する方法PHPのカール:REST APIでPHPカール拡張機能を使用する方法Mar 14, 2025 am 11:42 AM

PHPクライアントURL(CURL)拡張機能は、開発者にとって強力なツールであり、リモートサーバーやREST APIとのシームレスな対話を可能にします。尊敬されるマルチプロトコルファイル転送ライブラリであるLibcurlを活用することにより、PHP Curlは効率的なexecuを促進します

Laravelテストでの簡略化されたHTTP応答のモッキングLaravelテストでの簡略化されたHTTP応答のモッキングMar 12, 2025 pm 05:09 PM

Laravelは簡潔なHTTP応答シミュレーション構文を提供し、HTTP相互作用テストを簡素化します。このアプローチは、テストシミュレーションをより直感的にしながら、コード冗長性を大幅に削減します。 基本的な実装は、さまざまな応答タイプのショートカットを提供します。 Illuminate \ support \ facades \ httpを使用します。 http :: fake([[ 'google.com' => 'hello world'、 'github.com' => ['foo' => 'bar']、 'forge.laravel.com' =>

PHPロギング:PHPログ分析のベストプラクティスPHPロギング:PHPログ分析のベストプラクティスMar 10, 2025 pm 02:32 PM

PHPロギングは、Webアプリケーションの監視とデバッグ、および重要なイベント、エラー、ランタイムの動作をキャプチャするために不可欠です。システムのパフォーマンスに関する貴重な洞察を提供し、問題の特定に役立ち、より速いトラブルシューティングをサポートします

Codecanyonで12の最高のPHPチャットスクリプトCodecanyonで12の最高のPHPチャットスクリプトMar 13, 2025 pm 12:08 PM

顧客の最も差し迫った問題にリアルタイムでインスタントソリューションを提供したいですか? ライブチャットを使用すると、顧客とのリアルタイムな会話を行い、すぐに問題を解決できます。それはあなたがあなたのカスタムにより速いサービスを提供することを可能にします

PHPにおける後期静的結合の概念を説明します。PHPにおける後期静的結合の概念を説明します。Mar 21, 2025 pm 01:33 PM

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。Mar 28, 2025 pm 05:12 PM

この記事では、フレームワークにカスタム機能を追加し、アーキテクチャの理解、拡張ポイントの識別、統合とデバッグのベストプラクティスに焦点を当てています。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境