영화 추천, 이미지 태그 지정, 뉴스 기사 분류 등 기계 학습은 어디에나 있습니다. PHP 내에서 그렇게 할 수 있다고 상상해보세요! Rubix ML을 사용하면 간단하고 접근 가능한 방식으로 PHP에 머신러닝의 강력한 기능을 적용할 수 있습니다. 이 가이드는 기사를 '스포츠' 또는 '기술'과 같은 카테고리로 분류하는 간단한 뉴스 분류기를 구축하는 과정을 안내합니다. 결국에는 콘텐츠를 기반으로 새 기사의 카테고리를 예측할 수 있는 작동하는 분류기를 갖게 됩니다.
이 프로젝트는 PHP를 사용하여 기계 학습을 시작하려는 초보자에게 적합하며 GitHub에서 전체 코드를 따라갈 수 있습니다.
Rubix ML은 ML 도구와 알고리즘을 PHP 친화적인 환경에 제공하는 PHP용 기계 학습 라이브러리입니다. 분류, 회귀, 클러스터링 또는 자연어 처리 등 어떤 작업을 하든 Rubix ML이 해결해 드립니다. 이를 통해 데이터 로드 및 전처리, 모델 교육, 성능 평가 등을 모두 PHP에서 수행할 수 있습니다.
Rubix ML은 다음과 같은 광범위한 기계 학습 작업을 지원합니다.
Rubix ML을 사용하여 PHP에서 간단한 뉴스 분류기를 구축하는 방법을 자세히 살펴보겠습니다!
Rubix ML을 사용하여 새 PHP 프로젝트를 설정하고 자동 로딩을 구성하는 것부터 시작하겠습니다.
새 프로젝트 디렉토리를 생성하고 탐색하세요.
mkdir NewsClassifier cd NewsClassifier
Composer가 설치되어 있는지 확인한 후 다음을 실행하여 프로젝트에 Rubix ML을 추가하세요.
composer require rubix/ml
프로젝트의 src 디렉터리에서 클래스를 자동 로드하려면 작곡가.json 파일을 열거나 생성하고 다음 구성을 추가하세요.
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
이것은 Composer가 NewsClassifier 네임스페이스 아래 src 폴더 내의 모든 클래스를 자동 로드하도록 지시합니다.
자동 로드 구성을 추가한 후 다음 명령을 실행하여 Composer의 자동 로더를 다시 생성하세요.
mkdir NewsClassifier cd NewsClassifier
프로젝트 디렉토리는 다음과 같습니다.
composer require rubix/ml
src/에 Classification.php라는 파일을 만듭니다. 이 파일에는 모델을 훈련하고 뉴스 카테고리를 예측하는 방법이 포함됩니다.
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
이 분류 클래스에는 다음을 수행하는 메서드가 포함되어 있습니다.
src/에 train.php라는 스크립트를 생성하여 모델을 훈련합니다.
composer dump-autoload
모델을 학습하려면 다음 스크립트를 실행하세요.
NewsClassifier/ ├── src/ │ ├── Classification.php │ └── train.php ├── storage/ ├── vendor/ ├── composer.json └── composer.lock
성공하면 다음이 표시됩니다.
<?php namespace NewsClassifier; use Rubix\ML\Classifiers\KNearestNeighbors; use Rubix\ML\Datasets\Labeled; use Rubix\ML\Datasets\Unlabeled; use Rubix\ML\PersistentModel; use Rubix\ML\Pipeline; use Rubix\ML\Tokenizers\Word; use Rubix\ML\Transformers\TfIdfTransformer; use Rubix\ML\Transformers\WordCountVectorizer; use Rubix\ML\Persisters\Filesystem; class Classification { private $modelPath; public function __construct($modelPath) { $this->modelPath = $modelPath; } public function train() { // Sample data and corresponding labels $samples = [ ['The team played an amazing game of soccer'], ['The new programming language has been released'], ['The match between the two teams was incredible'], ['The new tech gadget has been launched'], ]; $labels = [ 'sports', 'technology', 'sports', 'technology', ]; // Create a labeled dataset $dataset = new Labeled($samples, $labels); // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier $estimator = new Pipeline([ new WordCountVectorizer(10000, 1, 1, new Word()), new TfIdfTransformer(), ], new KNearestNeighbors(4)); // Train the model $estimator->train($dataset); // Save the model $this->saveModel($estimator); echo "Training completed and model saved.\n"; } private function saveModel($estimator) { $persister = new Filesystem($this->modelPath); $model = new PersistentModel($estimator, $persister); $model->save(); } public function predict(array $samples) { // Load the saved model $persister = new Filesystem($this->modelPath); $model = PersistentModel::load($persister); // Predict categories for new samples $dataset = new Unlabeled($samples); return $model->predict($dataset); } }
src/에 또 다른 스크립트인 예측.php를 생성하여 훈련된 모델을 기반으로 새 기사를 분류합니다.
<?php require __DIR__ . '/../vendor/autoload.php'; use NewsClassifier\Classification; // Define the model path $modelPath = __DIR__ . '/../storage/model.rbx'; // Initialize the Classification object $classifier = new Classification($modelPath); // Train the model and save it $classifier->train();
예측 스크립트를 실행하여 샘플을 분류합니다.
php src/train.php
출력에는 예측 카테고리와 함께 각 샘플 텍스트가 표시되어야 합니다.
이 가이드를 통해 Rubix ML을 사용하여 PHP로 간단한 뉴스 분류자를 성공적으로 구축했습니다! 이는 텍스트 분류, 추천 시스템 등과 같은 작업에 기계 학습 기능을 도입하여 PHP가 생각보다 더 다재다능할 수 있음을 보여줍니다. 이 프로젝트의 전체 코드는 GitHub에서 확인할 수 있습니다.
분류자를 확장하기 위해 다양한 알고리즘이나 데이터를 실험해 보세요. PHP가 머신러닝을 할 수 있다는 것을 누가 알았을까요? 이제 그렇습니다.
즐거운 코딩하세요!
위 내용은 PHP의 기계 학습: Rubix ML을 사용하여 뉴스 분류기 구축의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!