Heim >WeChat-Applet >Mini-Programmentwicklung >Einführung in das WeChat-Applet zum Parsen von Webinhalten

Einführung in das WeChat-Applet zum Parsen von Webinhalten

不言
不言Original
2018-06-27 14:35:151714Durchsuche

In diesem Artikel werden hauptsächlich detaillierte Erklärungen und Beispiele für das Parsen von Webseiteninhalten durch WeChat-Applets vorgestellt. Wenn wir auf Probleme stoßen, werden wir sie hier aussortieren und lösen Sie können darauf verweisen.

Detaillierte Erklärung der Webinhaltsanalyse durch das WeChat-Applet

Ich schreibe derzeit einen Crawler, der Webseiten für die Verwendung durch WeChat analysieren muss Applet. Sowohl die Text- als auch die Bildanalyse sind leicht verständlich und das Miniprogramm verfügt auch über entsprechende Text- und Bild-Tags zur Präsentation. Komplexere wie Tabellen sind schwieriger. Unabhängig davon, ob es sich um serverseitiges Parsen oder Miniprogramm-Rendering handelt, ist es sehr mühsam und schwierig, alle Situationen abzudecken. Deshalb dachte ich, dass die Konvertierung des HTML-Codes, der der Tabelle entspricht, in Bilder eine Lösung wäre.

Hier verwenden wir das Node-Webshot-Modul, das PhantomJS leicht kapselt und Webseiten problemlos als Screenshots speichern kann.

Installieren Sie zuerst Node.js und PhantomJS, erstellen Sie dann eine neue JS-Datei und laden Sie das Node-Webshot-Modul:

const webshot = require('webshot');

Optionen definieren:

const options = {
  // 浏览器窗口
  screenSize: {
    width: 755,
    height: 25
  },
  // 要截图的页面文档区域
  shotSize: {
    height: 'all'
  },
  // 网页类型
  siteType: 'html'
};

Hier die Breite von Das Browserfenster sollte entsprechend der Situation der Webseite angemessen eingestellt werden. Die Höhe kann auf einen sehr kleinen Wert eingestellt werden. Dann muss die Höhe des Seitendokumentbereichs auf alle eingestellt werden, und die Breite entspricht standardmäßig der Fensterbreite , sodass die Tabelle in der kleinsten Größe vollständig als Screenshot erstellt werden kann.

Als nächstes definieren Sie die HTML-Zeichenfolge:

let html = "target rich text html code, eg: <table>...</table>";

Beachten Sie, dass der darin enthaltene HTML-Code Zeilenumbrüche entfernen und doppelte Anführungszeichen durch einfache Anführungszeichen ersetzen muss.

Abschließend Screenshot:

webshot(html, &#39;demo.png&#39;, options, (err) => {
  if (err)
    console.log(`Webshot error: ${err.message}`);
});

Auf diese Weise wird die Konvertierung vom HTML-Code in ein lokales Bild realisiert, das in die Qiniu Cloud usw. hochgeladen werden kann. Ob serverseitiges Parsen oder Miniprogrammpräsentation, es gibt keine Schwierigkeiten...

Das Obige ist der gesamte Inhalt dieses Artikels. Ich hoffe, er wird für das Lernen aller hilfreich sein Bitte achten Sie auf PHP Chinese Net!

Verwandte Empfehlungen:

Informationen zur dynamischen Parameterübertragung im WeChat-Miniprogramm

So erhalten Sie Albumfotos im WeChat-Miniprogramm

Sequentielle Ausführung des WeChat-Applets promsie.all und Promise

Das obige ist der detaillierte Inhalt vonEinführung in das WeChat-Applet zum Parsen von Webinhalten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn