Heim >Backend-Entwicklung >PHP-Tutorial >Beispiel für PHP-Schreiben von WeChat-Artikelseitensammlungsmethoden für öffentliche WeChat-Konten

Beispiel für PHP-Schreiben von WeChat-Artikelseitensammlungsmethoden für öffentliche WeChat-Konten

韦小宝
韦小宝Original
2017-12-05 09:24:212123Durchsuche

Heutzutage gibt es immer mehr WeChat-Benutzer, und natürlich werden sie auf viele öffentliche WeChat-Konten achten. Die Artikel im öffentlichen WeChat-Konto sind auch sehr Heute möchte ich analysieren, wie man mit PHP eine Methode zum Sammeln von WeChat Public Account-Artikeln schreibt und den Code im Detail erläutern!

Es gibt mehrere Probleme beim Sammeln historischer Nachrichten öffentlicher Konten:

1. Es gibt einen Bestätigungscode

2 Die historische Nachrichtenliste enthält nur die letzten 10 massenhaft veröffentlichten Inhalte.

3 Die Artikeladresse hat eine Gültigkeitsdauer 🎜>

Für diese Probleme gibt es keinen Weg durch die Methode in meinem vorherigen Artikel, obwohl der Aufbau des Sammelsystems nicht so einfach ist wie das Schreiben von Regeln für das Crawlen traditioneller Sammler. Allerdings ist die Effizienz der Batch-Sammlung nach einmaliger Einrichtung immer noch akzeptabel. Darüber hinaus sind die gesammelten Artikeladressen dauerhaft gültig und alle historischen Nachrichten eines öffentlichen Kontos können gesammelt werden.

Beginnen wir mit der Linkadresse eines öffentlichen Kontoartikels:

1 Kopieren Sie die Linkadresse aus dem Menü in der oberen rechten Ecke von WeChat:

http:/ /mp.weixin.qq.com/s/fF34bERZ0je_8RWEJjoZ5A

2. Die aus der historischen Nachrichtenliste erhaltene Adresse:

http:/ /mp. weixin.qq.com/s?biz=MjM5NDAwMTA2MA==&mid=2695729619&idx=1&sn=8be0b6bd0210cee0d492ebdf20f7371f&chksm=83d74818b4a0c10ef286b33bb7deb73226125f866 ddb 5b2781166066a69afef3705eabdb3b85&scene=4#wechat_redirect

3. Vollständige echte Adresse:

https: // mp.weixin.qq.com/s?biz=mjm5ndawmta2ma==&mid=2695729619&IDX=1&SN=8BE0210d0210f20f7371F&CHKHKSM= 83D74818B4A0C10EF286B33bb7Deb73226125F866DDB5B278166069AFEF3705EABDB3B85 & Scene = 37 & Key A7436AEBA2C1D47A20D02194D1C944A8286A8Eded93495EEADD05DA412BBFA A638A379750AEAA4CF5C00E4D78573C72777777715C23F23F f2400 & ascene = 3 & uin = mzuyotiynq%3d%3D & DeviceType =iOS10.1.1&version=16050120&nettype=WIFI&fontScale=100&pass_ticket=FGRyGfXLPEa4 AeOsIZu7KFJo6CiXOZex83Y5YBRglW4%3D&wx_header=1

Die oben genannten drei Adressen sind die Adressen der Gleicher Artikel, an verschiedenen Orten erhalten Sie erhalten völlig unterschiedliche 3 Ergebnisse. Ähnlich wie die Seite mit historischen Nachrichten verfügt WeChat über einen Mechanismus zur automatischen Ergänzung von Parametern. Die erste Adresse wird durch Kopieren des Links erhalten und scheint eine getarnte Verschlüsselung zu sein. Tatsächlich ist es nutzlos und wir werden es nicht in Betracht ziehen. Die zweite Adresse ist die Linkadresse, die mit der im vorherigen Artikel vorgestellten Methode aus der JSON-Artikelliste der historischen Nachrichten abgerufen wird. Wir können diese Adresse in der Datenbank speichern. Anschließend kann der Artikelinhalt über diese Adresse vom Server bezogen werden. Nachdem die Parameter zum dritten Link hinzugefügt wurden, besteht der Zweck darin, dem Lesevolumen js auf der Artikelseite zu ermöglichen, das JSON-Ergebnis des Lesevolumens und des ähnlichen Volumens zu erhalten. Bei der Methode unseres vorherigen Artikels wird die Artikelseite vom Client geöffnet und angezeigt. Aufgrund dieser Parameter erhält der js auf der Artikelseite automatisch das Lesevolumen, sodass wir das Lesevolumen dieses Artikels über den Proxy-Dienst erhalten können . .

Der Inhalt dieses Artikels besteht darin, im Detail zu untersuchen, wie man Artikelinhalte und andere nützliche Informationen basierend auf der im vorherigen Artikel dieser Kolumne vorgestellten Methode erhält.

(Liste der in meiner Datenbank gespeicherten Artikel, einige Felder)

1. Holen Sie sich den Quellcode des Artikels:

Sie können den Quellcode des Artikels über die PHP-Funktion file_get_content() in eine Variable einlesen. Da der Quellcode des WeChat-Artikels über den Browser geöffnet werden kann, werde ich ihn hier nicht einfügen, um Platzverschwendung auf der Seite zu vermeiden.


<?
//$content_url 变量的值为文章地址
$html = file_get_contents($content_url);
?>
2. Nützliche Informationen im Quellcode:


1) Originalinhalt:

Der Originalinhalt ist in einem cfd680454c127ace0ad40a8afa2cb84a94b3e26ee717c64999d7867364b1b4a3-Tag enthalten und wird über den PHP-Code

abgerufen:


Regelmäßige Erkennung am Anfang cfd680454c127ace0ad40a8afa2cb84a, Erkennung am Ende