ホームページ  >  記事  >  バックエンド開発  >  ウェブサイトの時刻データセット

ウェブサイトの時刻データセット

王林
王林オリジナル
2024-09-03 14:41:10485ブラウズ

こんにちは、kaggle で Web サイトの使用時間のデータセットを見つけたので、訪問したページ数と Web サイトの総滞在時間の比率を求めたいと思います。

データセットとコードは私の github にあります: https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


I - インストール

これを行うには、Python で sqlalchemy を使用して CSV をデータベースに変換し、結果をプロットして表示します。

pip install plotly
pip install sqlalchemy

II - コード

Main クラスを作成し、get_data メソッドを使用して CSV を取得し、データベースに格納します。
結果はタプルのリストなので、二重リストを取得するためにtransform_dataメソッドを作成します。
最後に、閲覧されたページ数と合計時間の単純なグラフを表示できます。

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - 結果

X 軸はユーザーが訪問したページ数を示し、Y 軸は Web サイトで費やした時間を分単位で示します。

最も長く滞在するユーザーは 4 ページから 6 ページの間に訪問し、11 ページから 15 ページの間にはすべてのユーザーが少なくとも数分間滞在していることがわかります。

Website Time dataset

以上がウェブサイトの時刻データセットの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
前の記事:最初の投稿と AMA次の記事:最初の投稿と AMA