Maison  >  Article  >  développement back-end  >  Ensemble de données sur l'heure du site Web

Ensemble de données sur l'heure du site Web

王林
王林original
2024-09-03 14:41:10487parcourir

Bonjour, j'ai trouvé un ensemble de données sur Kaggle dans le temps d'utilisation d'un site Web, je souhaite donc trouver un rapport entre le nombre de pages visitées et le temps total passé sur le site Web.

Vous pouvez retrouver l'ensemble de données et le code dans mon github : https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


I-Installation

Pour ce faire, j'utilise sqlalchemy en python pour convertir mon csv en base de données et tracer pour afficher mes résultats.

pip install plotly
pip install sqlalchemy

II-Code

Je crée une classe Main, dans laquelle je récupère mon csv et le mets dans une base de données, en utilisant la méthode get_data.
Le résultat est une liste de tuples, je crée donc la méthode transform_data pour obtenir une liste double.
Enfin, je peux afficher un graphique simple entre le nombre de pages vues et la durée totale.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - Résultat

L'axe des x indique le nombre de pages visitées par l'utilisateur, tandis que l'axe des y indique le temps passé sur le site en minutes.

On constate que les utilisateurs qui restent le plus longtemps visitent entre 4 et 6 pages, et qu'entre 11 et 15 pages tous les utilisateurs restent au moins quelques minutes.

Website Time dataset

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Premier message et AMAArticle suivant:Premier message et AMA