


Apprentissage automatique en PHP : créez un classificateur d'actualités à l'aide de Rubix ML
Introduction
L'apprentissage automatique est omniprésent : il recommande des films, marque des images et classe même désormais des articles d'actualité. Imaginez si vous pouviez faire cela en PHP ! Avec Rubix ML, vous pouvez apporter la puissance du machine learning à PHP d'une manière simple et accessible. Ce guide vous guidera dans la création d'un classificateur d'actualités simple qui trie les articles en catégories telles que « Sports » ou « Technologie ». À la fin, vous disposerez d'un classificateur fonctionnel capable de prédire les catégories de nouveaux articles en fonction de leur contenu.
Ce projet est parfait pour les débutants qui souhaitent se lancer dans l'apprentissage automatique à l'aide de PHP, et vous pouvez suivre le code complet sur GitHub.
Table des matières
- Qu'est-ce que Rubix ML ?
- Mise en place du projet
- Création de la classe de classification des actualités
- Formation du modèle
- Prédire de nouveaux échantillons
- Pensées finales
Qu’est-ce que Rubix ML ?
Rubix ML est une bibliothèque d'apprentissage automatique pour PHP qui intègre les outils et algorithmes de ML dans un environnement compatible PHP. Que vous travailliez sur la classification, la régression, le clustering ou même le traitement du langage naturel, Rubix ML est là pour vous. Il vous permet de charger et de prétraiter des données, d'entraîner des modèles et d'évaluer les performances, le tout en PHP.
Rubix ML prend en charge un large éventail de tâches d'apprentissage automatique, telles que :
- Classification : catégoriser les données, comme étiqueter les e-mails comme spam ou non spam.
- Régression : Prédire des valeurs continues, comme les prix de l'immobilier.
- Clustering : regrouper des données sans étiquettes, comme rechercher des segments de clientèle.
- Traitement du langage naturel (NLP) : Travailler avec des données textuelles, telles que leur tokenisation et leur transformation en formats utilisables pour le ML.
Voyons comment utiliser Rubix ML pour créer un classificateur d'actualités simple en PHP !
Mise en place du projet
Nous allons commencer par mettre en place un nouveau projet PHP avec Rubix ML et configurer le chargement automatique.
Étape 1 : initialiser le répertoire du projet
Créez un nouveau répertoire de projet et accédez-y :
mkdir NewsClassifier cd NewsClassifier
Étape 2 : Installez Rubix ML avec Composer
Assurez-vous que Composer est installé, puis ajoutez Rubix ML à votre projet en exécutant :
composer require rubix/ml
Étape 3 : Configurer le chargement automatique dans composer.json
Pour charger automatiquement les classes depuis le répertoire src de notre projet, ouvrez ou créez un fichier composer.json et ajoutez la configuration suivante :
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
Cela indique à Composer de charger automatiquement toutes les classes du dossier src sous l'espace de noms NewsClassifier.
Étape 4 : Exécutez le vidage du chargement automatique du Composer
Après avoir ajouté la configuration de chargement automatique, exécutez la commande suivante pour régénérer le chargeur automatique de Composer :
mkdir NewsClassifier cd NewsClassifier
Étape 5 : Structure des répertoires
Votre répertoire de projet devrait ressembler à ceci :
composer require rubix/ml
- src/ : Contient vos scripts PHP.
- stockage/ : Où le modèle entraîné sera enregistré.
- vendor/ : contient les dépendances installées par Composer.
Création de la classe de classification des actualités
Dans src/, créez un fichier appelé Classification.php. Ce fichier contiendra les méthodes d'entraînement du modèle et de prédiction des catégories d'actualités.
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
Cette classe de classification contient des méthodes pour :
- Train : créez et entraînez un modèle basé sur un pipeline.
- Enregistrer le modèle : enregistrez le modèle entraîné dans le chemin spécifié.
- Prédire : chargez le modèle enregistré et prédisez la catégorie pour les nouveaux échantillons.
Entraîner le modèle
Créez un script appelé train.php dans src/ pour entraîner le modèle.
composer dump-autoload
Exécutez ce script pour entraîner le modèle :
NewsClassifier/ ├── src/ │ ├── Classification.php │ └── train.php ├── storage/ ├── vendor/ ├── composer.json └── composer.lock
En cas de succès, vous verrez :
<?php namespace NewsClassifier; use Rubix\ML\Classifiers\KNearestNeighbors; use Rubix\ML\Datasets\Labeled; use Rubix\ML\Datasets\Unlabeled; use Rubix\ML\PersistentModel; use Rubix\ML\Pipeline; use Rubix\ML\Tokenizers\Word; use Rubix\ML\Transformers\TfIdfTransformer; use Rubix\ML\Transformers\WordCountVectorizer; use Rubix\ML\Persisters\Filesystem; class Classification { private $modelPath; public function __construct($modelPath) { $this->modelPath = $modelPath; } public function train() { // Sample data and corresponding labels $samples = [ ['The team played an amazing game of soccer'], ['The new programming language has been released'], ['The match between the two teams was incredible'], ['The new tech gadget has been launched'], ]; $labels = [ 'sports', 'technology', 'sports', 'technology', ]; // Create a labeled dataset $dataset = new Labeled($samples, $labels); // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier $estimator = new Pipeline([ new WordCountVectorizer(10000, 1, 1, new Word()), new TfIdfTransformer(), ], new KNearestNeighbors(4)); // Train the model $estimator->train($dataset); // Save the model $this->saveModel($estimator); echo "Training completed and model saved.\n"; } private function saveModel($estimator) { $persister = new Filesystem($this->modelPath); $model = new PersistentModel($estimator, $persister); $model->save(); } public function predict(array $samples) { // Load the saved model $persister = new Filesystem($this->modelPath); $model = PersistentModel::load($persister); // Predict categories for new samples $dataset = new Unlabeled($samples); return $model->predict($dataset); } }
Prédire de nouveaux échantillons
Créez un autre script, prédire.php, dans src/ pour classer les nouveaux articles en fonction du modèle entraîné.
<?php require __DIR__ . '/../vendor/autoload.php'; use NewsClassifier\Classification; // Define the model path $modelPath = __DIR__ . '/../storage/model.rbx'; // Initialize the Classification object $classifier = new Classification($modelPath); // Train the model and save it $classifier->train();
Exécutez le script de prédiction pour classer les échantillons :
php src/train.php
La sortie doit afficher chaque exemple de texte avec sa catégorie prédite.
Pensées finales
Avec ce guide, vous avez réussi à créer un classificateur d'actualités simple en PHP à l'aide de Rubix ML ! Cela démontre à quel point PHP peut être plus polyvalent que vous ne le pensez, en intégrant des capacités d'apprentissage automatique pour des tâches telles que la classification de texte, les systèmes de recommandation, etc. Le code complet de ce projet est disponible sur GitHub.
Expérimentez avec différents algorithmes ou données pour étendre le classificateur. Qui aurait cru que PHP pouvait faire du machine learning ? Maintenant c’est fait.
Bon codage !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Le type PHP invite à améliorer la qualité et la lisibilité du code. 1) Conseils de type scalaire: Depuis PHP7.0, les types de données de base sont autorisés à être spécifiés dans les paramètres de fonction, tels que INT, Float, etc. 2) Invite de type de retour: Assurez la cohérence du type de valeur de retour de fonction. 3) Invite de type d'union: Depuis PHP8.0, plusieurs types peuvent être spécifiés dans les paramètres de fonction ou les valeurs de retour. 4) Invite de type nullable: permet d'inclure des valeurs nulles et de gérer les fonctions qui peuvent renvoyer les valeurs nulles.

Dans PHP, utilisez le mot-clé Clone pour créer une copie de l'objet et personnalisez le comportement de clonage via la méthode de magie du clone \ _ \ _. 1. Utilisez le mot-clé Clone pour faire une copie peu profonde, en clonant les propriétés de l'objet mais pas aux propriétés de l'objet. 2. La méthode du clone \ _ \ _ peut copier profondément les objets imbriqués pour éviter les problèmes de copie superficiels. 3. Faites attention pour éviter les références circulaires et les problèmes de performance dans le clonage et optimiser les opérations de clonage pour améliorer l'efficacité.

PHP convient aux systèmes de développement Web et de gestion de contenu, et Python convient aux scripts de science des données, d'apprentissage automatique et d'automatisation. 1.Php fonctionne bien dans la création de sites Web et d'applications rapides et évolutifs et est couramment utilisé dans CMS tel que WordPress. 2. Python a permis de manière remarquable dans les domaines de la science des données et de l'apprentissage automatique, avec des bibliothèques riches telles que Numpy et Tensorflow.

Les acteurs clés des en-têtes de cache HTTP incluent le contrôle du cache, l'ETAG et la dernière modification. 1.CACHE-Control est utilisé pour contrôler les politiques de mise en cache. Exemple: Cache-Control: Max-Age = 3600, public. 2. Etag vérifie les changements de ressources par le biais d'identifiants uniques, exemple: ETAG: "686897696A7C876B7E". 3.Last-modifié indique le dernier temps de modification de la ressource, exemple: dernier modifié: mer, 21oct201507: 28: 00gmt.

Dans PHP, Password_Hash et Password_verify Les fonctions doivent être utilisées pour implémenter le hachage de mot de passe sécurisé, et MD5 ou SHA1 ne doit pas être utilisé. 1) Password_hash génère un hachage contenant des valeurs de sel pour améliorer la sécurité. 2) Password_verify Vérifiez le mot de passe et assurez-vous la sécurité en comparant les valeurs de hachage. 3) MD5 et SHA1 sont vulnérables et manquent de valeurs de sel, et ne conviennent pas à la sécurité de mot de passe moderne.

PHP est un langage de script côté serveur utilisé pour le développement Web dynamique et les applications côté serveur. 1.Php est un langage interprété qui ne nécessite pas de compilation et convient au développement rapide. 2. Le code PHP est intégré à HTML, ce qui facilite le développement de pages Web. 3. PHP traite la logique côté serveur, génère une sortie HTML et prend en charge l'interaction utilisateur et le traitement des données. 4. PHP peut interagir avec la base de données, traiter la soumission du formulaire et exécuter les tâches côté serveur.

PHP a façonné le réseau au cours des dernières décennies et continuera de jouer un rôle important dans le développement Web. 1) PHP est originaire de 1994 et est devenu le premier choix pour les développeurs en raison de sa facilité d'utilisation et de son intégration transparente avec MySQL. 2) Ses fonctions principales incluent la génération de contenu dynamique et l'intégration à la base de données, ce qui permet au site Web d'être mis à jour en temps réel et affiché de manière personnalisée. 3) La large application et l'écosystème de PHP ont motivé son impact à long terme, mais il fait également face à des mises à jour de version et à des défis de sécurité. 4) Les améliorations des performances ces dernières années, telles que la sortie de PHP7, lui permettent de rivaliser avec les langues modernes. 5) À l'avenir, PHP doit faire face à de nouveaux défis tels que la conteneurisation et les microservices, mais sa flexibilité et sa communauté active le rendent adaptable.

Les principaux avantages du PHP comprennent la facilité d'apprentissage, un soutien solide sur le développement Web, les bibliothèques et les cadres riches, les performances élevées et l'évolutivité, la compatibilité multiplateforme et la rentabilité. 1) Facile à apprendre et à utiliser, adapté aux débutants; 2) une bonne intégration avec les serveurs Web et prend en charge plusieurs bases de données; 3) ont des cadres puissants tels que Laravel; 4) Des performances élevées peuvent être obtenues grâce à l'optimisation; 5) prendre en charge plusieurs systèmes d'exploitation; 6) Open source pour réduire les coûts de développement.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

PhpStorm version Mac
Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Version Mac de WebStorm
Outils de développement JavaScript utiles

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)