Heim  >  Artikel  >  WeChat-Applet  >  Ausführliche Erläuterung von Beispielen für das Parsen von Webinhalten durch WeChat-Applets

Ausführliche Erläuterung von Beispielen für das Parsen von Webinhalten durch WeChat-Applets

高洛峰
高洛峰Original
2017-03-23 14:02:141839Durchsuche

In diesem Artikel werden hauptsächlich detaillierte Erklärungen und Beispiele für das Parsen von Webseiteninhalten durch WeChat-Applets vorgestellt. Wenn wir auf Probleme stoßen, werden wir sie hier aussortieren und lösen Sie können darauf verweisen.

Ausführliche Erklärung zum Parsen von Webinhalten durch das WeChat-Applet

Ich schreibe derzeit einen Crawler, der Webseiten für die Verwendung durch das WeChat-Applet analysieren muss. Sowohl die Text- als auch die Bildanalyse sind leicht verständlich und das Miniprogramm verfügt auch über entsprechende Text- und Bild-Tags zur Präsentation. Komplexere wie Tabellen sind schwieriger. Unabhängig davon, ob es sich um serverseitiges Parsen oder Miniprogramm-Rendering handelt, ist es sehr mühsam und schwierig, alle Situationen abzudecken. Deshalb dachte ich, dass die Konvertierung des HTML-Codes, der der Tabelle entspricht, in Bilder eine Lösung wäre.

Hier verwenden wir das Node-Webshot-Modul, das PhantomJS leicht kapselt und Webseiten problemlos als Screenshots speichern kann.

Installieren Sie zuerst Node.js und PhantomJS, erstellen Sie dann eine neue JS-Datei und laden Sie das Node-Webshot-Modul:

const webshot = require('webshot');

Optionen definieren:

const options = {
  // 浏览器窗口
  screenSize: {
    width: 755,
    height: 25
  },
  // 要截图的页面文档区域
  shotSize: {
    height: 'all'
  },
  // 网页类型
  siteType: 'html'
};

Hier , Durchsuchen Die Breite des Browserfensters sollte entsprechend der Situation der Webseite angemessen eingestellt werden. Die Höhe kann auf einen sehr kleinen Wert eingestellt werden. Dann muss die Breite des Seitendokuments auf „Alle“ eingestellt werden die Fensterbreite, damit die Tabelle in der kleinsten Größe vollständig gescreent werden kann.

Als nächstes definieren Sie die HTML-Zeichenfolge:

let html = "target rich text html code, eg: <table>...</table>";

Beachten Sie, dass der darin enthaltene HTML-Code Zeilenumbrüche entfernen und doppelte Anführungszeichen durch einfache Anführungszeichen ersetzen muss.

Abschließend Screenshot:

webshot(html, 'demo.png', options, (err) => {
  if (err)
    console.log(`Webshot error: ${err.message}`);
});

Auf diese Weise wird die Konvertierung vom HTML-Code in ein lokales Bild realisiert, das in die Qiniu Cloud usw. hochgeladen werden kann. Ob serverseitige Analyse oder Miniprogramm-Präsentation, es gibt überhaupt keine Schwierigkeiten...

Vielen Dank fürs Lesen, ich hoffe, es kann allen helfen, vielen Dank für Ihre Unterstützung dieser Website!

Das obige ist der detaillierte Inhalt vonAusführliche Erläuterung von Beispielen für das Parsen von Webinhalten durch WeChat-Applets. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn