抓取新的 Telegram 頻道-Python教學-PHP中文網

首頁

後端開發

Python教學

抓取新的 Telegram 頻道

Barbara Streisand

Nov 09, 2024 pm 10:12 PM

Scraping New Telegram Channels

使用 Python 和 GroupFind API 每天抓取新的 Telegram 頻道

Telegram 頻道每天都在成長，找到最新的頻道可以讓您深入了解熱門社群和熱門話題。使用 GroupFind API，我們可以輕鬆地每天提取新頻道並將其保存到 CSV 中以供分析或監控。在本教程中，我將引導您完成一個簡單的 Python 腳本來自動執行此過程。

群組查找 API

GroupFind API 提供了一個用於檢索新列出的 Telegram 群組的端點：

https://api.groupfind.org/api/groups?skip=0&sort=newest

此端點傳回 JSON 格式的數據，包含 groupTitle、category、memberCount、tags 等欄位。我們將使用這些資料來建立 CSV，並每天更新新清單。

設定 Python 腳本

讓我們先匯入必要的函式庫並設定一個函數來提取最新資料並將其儲存到 CSV 檔案。

第 1 步：導入所需的庫

import requests
import csv
from datetime import datetime
import time

第 2 步：定義獲取和保存資料的函數

在這裡，我們將設定一個函數：

向 API 發出 GET 請求。
擷取相關數據。
寫入或附加到 CSV 檔案。

def fetch_and_save_new_telegram_channels():
    url = "https://api.groupfind.org/api/groups?skip=0&sort=newest"
    response = requests.get(url)

    if response.status_code == 200:
        channels = response.json()

        filename = "new_telegram_channels.csv"
        fieldnames = [
            "ID", "Title", "Category", "Member Count", "NSFW", 
            "Description", "Tags", "Profile Photo URL", "Added Date"
        ]

        with open(filename, mode="a", newline="", encoding="utf-8") as file:
            writer = csv.DictWriter(file, fieldnames=fieldnames)

            if file.tell() == 0:
                writer.writeheader()  # Write header only once

            for channel in channels:
                writer.writerow({
                    "ID": channel["id"],
                    "Title": channel["groupTitle"],
                    "Category": channel["category"],
                    "Member Count": channel["memberCount"],
                    "NSFW": channel["isNsfw"],
                    "Description": channel["groupDescription"],
                    "Tags": ", ".join(channel["tags"]),
                    "Profile Photo URL": channel["profilePhoto"],
                    "Added Date": channel["addedDate"]
                })

        print(f"Successfully added {len(channels)} new channels to {filename}.")
    else:
        print("Failed to fetch data. Status code:", response.status_code)

第 3 步：使用排程器自動執行每日抓取

為了讓這個腳本每天自動運行，為了簡單起見，我們可以使用 Python 的內建時間模組，或將其設定為伺服器上的 cron 作業。

def run_daily():
    while True:
        print(f"Running script at {datetime.now()}")
        fetch_and_save_new_telegram_channels()
        time.sleep(86400)  # Wait for 24 hours

運行腳本

只需執行該腳本，它就會每天取得新的 Telegram 頻道，並將它們附加到 new_telegram_channels.csv 中。文件將隨著時間的推移累積數據，提供不斷增長的新 Telegram 社群記錄。

if __name__ == "__main__":
    run_daily()

以上是抓取新的 Telegram 頻道的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

了解差異：用於循環和python中的循環May 16, 2025 am 12:17 AM

theDifferenceBetweewneaforoopandawhileLoopInpythonisthataThataThataThataThataThataThataNumberoFiterationSiskNownInAdvance，而leleawhileLoopisusedWhenaconDitionNeedneedneedneedNeedStobeCheckedStobeCheckedStobeCheckedStobeCheckedStobeceDrepeTysepectients.peatsiveSectlyStheStobeCeptellyWithnumberofiterations.1）forloopsareAceareIdealForitoringercortersence

Python循環控制：對於vs -a -a比較May 16, 2025 am 12:16 AM

在Python中，for循環適用於已知迭代次數的情況，而while循環適合未知迭代次數且需要更多控制的情況。 1）for循環適用於遍歷序列，如列表、字符串等，代碼簡潔且Pythonic。 2）while循環在需要根據條件控制循環或等待用戶輸入時更合適，但需注意避免無限循環。 3）性能上，for循環略快，但差異通常不大。選擇合適的循環類型可以提高代碼的效率和可讀性。

如何在Python中結合兩個列表：5種簡單的方法May 16, 2025 am 12:16 AM

在Python中，可以通過五種方法合併列表：1)使用運算符，簡單直觀，適用於小列表；2)使用extend()方法，直接修改原列表，適用於需要頻繁更新的列表；3)使用列表解析式，簡潔且可對元素進行操作；4)使用itertools.chain()函數，內存高效，適合大數據集；5)使用*運算符和zip()函數，適用於需要配對元素的場景。每種方法都有其特定用途和優缺點，選擇時應考慮項目需求和性能。

循環時循環：python語法，用例和示例May 16, 2025 am 12:14 AM

foroopsare whenthenemberofiterationsisknown，而whileLoopsareUseduntilacTitionismet.1）ForloopSareIdealForeSequencesLikeLists，UsingSyntaxLike'forfruitinFruitinFruitinFruitIts：print（fruit）'。 2）'

python串聯列表列表May 16, 2025 am 12:08 AM

toConcateNateAlistofListsInpython，useextend，listComprehensions，itertools.Chain，orrecursiveFunctions.1）ExtendMethodStraightForwardButverBose.2）listComprechencomprechensionsareconconconciseandemandeconeandefforlargerdatasets.3）