Heim  >  Artikel  >  Backend-Entwicklung  >  Website-Zeitdatensatz

Website-Zeitdatensatz

王林
王林Original
2024-09-03 14:41:10637Durchsuche

Hallo, ich habe auf Kaggle einen Datensatz zur Nutzungsdauer einer Website gefunden, daher möchte ich ein Verhältnis zwischen der Anzahl der besuchten Seiten und der Gesamtzeit auf der Website ermitteln.

Sie finden den Datensatz und den Code in meinem Github: https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


I - Installation

Dazu verwende ich sqlalchemy in Python, um meine CSV-Datei in eine Datenbank umzuwandeln und meine Ergebnisse anzuzeigen.

pip install plotly
pip install sqlalchemy

II - Kodex

Ich erstelle eine Hauptklasse, in der ich meine CSV-Datei abrufe und sie mit der Methode get_data in eine Datenbank lege.
Das Ergebnis ist eine Liste von Tupeln, also erstelle ich die Methode transform_data, um eine doppelte Liste zu erhalten.
Schließlich kann ich eine einfache Grafik zwischen der Anzahl der aufgerufenen Seiten und der Gesamtzeit anzeigen.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - Ergebnis

Die x-Achse gibt die Anzahl der vom Benutzer besuchten Seiten an, während die y-Achse die auf der Website verbrachte Zeit in Minuten anzeigt.

Wir können sehen, dass die Benutzer, die am längsten bleiben, zwischen 4 und 6 Seiten besuchen, und dass zwischen 11 und 15 Seiten alle Benutzer mindestens ein paar Minuten bleiben.

Website Time dataset

Das obige ist der detaillierte Inhalt vonWebsite-Zeitdatensatz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:Erster Beitrag und AMANächster Artikel:Erster Beitrag und AMA