Maison  >  Article  >  développement back-end  >  Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Go语言进阶学习
Go语言进阶学习avant
2023-07-24 14:55:56890parcourir

1. Introduction

Les amis qui ont joué au jeu Honor of Kings savent tous qu'un équipement de héros est très important, associé à des inscriptions, peut vous rendre imparable et. imparable sur le champ de bataille des rois !

Il y a quelques jours, j'ai vu dans le groupe [Minglao] qu'il partageait un robot d'exploration Python pour obtenir les instructions d'équipement du héros Honor of Kings, et utilisait le pool de threads pour télécharger les images d'équipement, puis générait automatiquement une démarque fichiers. Il y a beaucoup de contenu utile, et je vais le partager avec vous ici. Tout le monde est invité à l'essayer.

2. Acquisition de données

Notre site Web cible ici est le site officiel de King of Glory, comme le montre l'image ci-dessous. Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Cliquez ensuite sur le bouton [Plus] de [Héros/Skins] sur le côté droit de la page d'accueil pour accéder à la page de détails, comme indiqué dans l'image ci-dessous. Cliquez sur [Objets du jeu] pour voir les informations sur l'équipement, qui. comprend l'obtention des informations cibles que nous souhaitons. Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

En capturant des paquets via le navigateur, vous pouvez obtenir des informations spécifiques et les voir stockées au format json.

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.L'image ci-dessous est une capture d'écran des détails des données. Vous pouvez voir qu'il y a des caractères chinois tronqués. Cela ne l'affecte pas. Au moins, les données peuvent être obtenues.

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Processus d'implémentation du code

Après avoir trouvé la source de données, l'étape suivante consiste à implémenter le code. Jetons un coup d'œil. Le code [Minglao] est directement appliqué ici et est exécuté dans jupyter notebook.

Obtenir les données de l'équipement

import requests
import pandas as pd

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                  'Chrome/88.0.4324.104 Safari/537.36 '
}
target = 'https://pvp.qq.com/web201605/js/item.json'
item_list = requests.get(target, headers=headers).json()
item_df = pd.DataFrame(item_list)
item_df.sort_values(["item_type", "price", "item_id"], inplace=True)
item_df.fillna("", inplace=True)
item_df.des1 = item_df.des1.str.replace("</?p>", "", regex=True)
item_df.des2 = item_df.des2.str.replace("</?p>", "", regex=True)
item_df

Le résultat est comme indiqué dans la figure ci-dessous :

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Téléchargement d'images multithread

Ensuite, utilisez la méthode du pool de threads pour télécharger des images. La méthode d'épissage des images est également très simple, cela sera clair en un coup d'œil en regardant l'image ci-dessous.

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.Voici l'implémentation du code :

import os
from concurrent.futures import ThreadPoolExecutor


def download_img(item_id):
    if os.path.exists(f"imgs/{item_id}.jpg"):
        return
    imgurl = f"http://game.gtimg.cn/images/yxzj/img201606/itemimg/{item_id}.jpg"
    res = requests.get(imgurl)
    with open(f"imgs/{item_id}.jpg", "wb") as f:
        f.write(res.content)


os.makedirs("imgs", exist_ok=True)
with ThreadPoolExecutor(max_workers=8) as executor:
    nums = executor.map(download_img, item_df.item_id)

La vitesse de téléchargement est très rapide, quelques secondes seulement, et le résultat est comme le montre la figure ci-dessous :

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Ensuite, nous générerons automatiquement le document Markdown à partir des données, jetons un coup d'œil.

Générer le document Markdown

Le code est le suivant La première partie est le prétraitement des données, suivi de l'écriture du fichier :

item_type_dict = {1: &#39;攻击&#39;, 2: &#39;法术&#39;, 3: &#39;防御&#39;, 4: &#39;移动&#39;, 5: &#39;打野&#39;, 7: &#39;游走&#39;}
item_ids = item_df.item_id.values
item_df.item_id = item_df.item_id.apply(
    lambda item_id: f"![{item_id}](imgs/{item_id}.jpg)")
item_df.item_type = item_df.item_type.map(item_type_dict)
item_df.columns = ["图片", "装备名称", "类型", "售价", "总价", "基础描述", "扩展描述"]
item_df

Le code pour écrire le fichier et générer le document Markdown :

with open("王者装备说明.md", "w") as f:
    for item_type, item_split in item_df.groupby("类型", sort=False):
        f.write(f"# {item_type}\n")
        item_split.drop(columns="类型", inplace=True)
        f.write(item_split.to_markdown(index=False))
        f.write("\n\n")

. Le résultat est le suivant :

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

Ensuite, un document Markdown nommé [King Equipment Description.md] sera généré localement. Double-cliquez sur le fichier pour l'ouvrir. Le contenu est tel qu'indiqué ci-dessous :

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.Quoi. un gars génial ! Lorsque j'ai implémenté cette étape, j'ai rencontré une erreur, comme indiqué ci-dessous :

Missing optional dependency &#39;tabulate&#39;.  Use pip or conda to install tabulate.

提示却少依赖库,只需要在cmd下进行安装即可pip install tabulate,之后就可以正常运行了。

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

生成Excel表格

不过Markdown的表格无法任意调整,图片需要点击后才会放大,下面我们考虑生成Excel表格:首先需要整理数据,代码如下:

item_df.图片 = ""
item_df.基础描述 = item_df.基础描述.str.replace("<br>", "\n")
item_df.扩展描述 = item_df.扩展描述.str.replace("<br>", "\n")
item_df

生成结果如下图所示:

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.之后将结果写入到Excel中去,代码如下所示:

# 写入Excel表格
from openpyxl.drawing.image import Image
from openpyxl.styles import Alignment

with pd.ExcelWriter("王者装备说明.xlsx", engine=&#39;openpyxl&#39;) as writer:
    item_df.to_excel(writer, sheet_name=&#39;装备说明&#39;, index=False)
    worksheet = writer.sheets[&#39;装备说明&#39;]
    worksheet.column_dimensions["A"].width = 11
    for item_id, (cell,) in zip(item_ids, worksheet.iter_rows(2, None, 1, 1)):
        worksheet.row_dimensions[cell.row].height = 67
        worksheet.add_image(Image(f"imgs/{item_id}.jpg"), f&#39;A{cell.row}&#39;)
    worksheet.column_dimensions["F"].width = 15
    worksheet.column_dimensions["G"].width = 35
    writer.save()

打开文件,效果图如下图所示:

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

当然了,大家也可以根据自己想要的效果生成HTML和Word等等。

三、总结

大家好,我是Python进阶者。这篇文章主要分享了一个使用Python网络爬虫获取王者荣耀英雄出装说明,并使用线程池的方式下载了出装图片,之后还自动化生成了markdown文件,干货内容很多,欢迎大家积极尝试,如果有遇到问题,请添加我好友,我帮助解决。

最后感谢粉丝【明佬】分享的代码喝王者荣耀出装攻略,真是太强了,上王者指日可待!

Apprenez étape par étape à utiliser le robot d'exploration Web Python pour obtenir les instructions sur l'équipement du héros King of Glory et générer automatiquement des fichiers de démarques.

最后放上【明佬】的csdn链接:https://xxmdmst.blog.csdn.net/article/details/124035041,点击阅读原文可以直达噢!

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer