Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Set data Masa Laman Web

Set data Masa Laman Web

王林
王林asal
2024-09-03 14:41:10660semak imbas

Helo, saya menemui set data pada kaggle pada masa penggunaan tapak web, jadi saya ingin mencari nisbah antara bilangan halaman yang dilawati dan jumlah masa dalam tapak web.

Anda boleh mencari set data dan kod dalam github saya : https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


I - Pemasangan

Untuk melakukan ini, saya menggunakan sqlalchemy dalam python untuk menukar csv saya kepada pangkalan data dan merancang untuk memaparkan hasil saya.

pip install plotly
pip install sqlalchemy

II - Kod

Saya mencipta kelas Utama, di mana saya mendapatkan csv saya dan meletakkannya dalam pangkalan data, menggunakan kaedah get_data.
Hasilnya ialah senarai tupel, jadi saya mencipta kaedah transform_data untuk mendapatkan senarai berganda.
Akhir sekali, saya boleh memaparkan graf ringkas antara bilangan halaman yang dilihat dan jumlah masa.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - Keputusan

Paksi-x menunjukkan bilangan halaman yang dilawati oleh pengguna, manakala paksi-y menunjukkan masa yang dihabiskan di tapak web dalam beberapa minit.

Kami dapat melihat bahawa pengguna yang tinggal paling lama melawat antara 4 dan 6 halaman, dan antara 11 dan 15 halaman semua pengguna tinggal sekurang-kurangnya beberapa minit.

Website Time dataset

Atas ialah kandungan terperinci Set data Masa Laman Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel sebelumnya:Jawatan pertama dan AMAArtikel seterusnya:Jawatan pertama dan AMA