Heim > Artikel > WeChat-Applet > Mini-Programmentwicklung und Analyse von Webinhalten
WeChat Mini-Programm Detaillierte Erklärung zum Parsen von Webinhalten
Ich schreibe kürzlich einen Crawler, der die Webseite zur Verwendung durch analysieren muss WeChat Mini-Programm. Sowohl die Text- als auch die Bildanalyse sind leicht verständlich und das Miniprogramm verfügt auch über entsprechende Text- und Bild-Tags zur Präsentation. Komplexere wie Tabellen sind schwieriger. Unabhängig davon, ob es sich um serverseitiges Parsen oder Miniprogramm-Rendering handelt, ist es sehr mühsam und schwierig, alle Situationen abzudecken. Deshalb dachte ich, dass die Konvertierung des HTML-Codes, der der Tabelle entspricht, in Bilder eine Lösung wäre.
Hier verwenden wir das Node-Webshot-Modul, das PhantomJS leicht kapselt und Webseiten problemlos als Screenshots speichern kann.
Installieren Sie zuerst Node.js und PhantomJS, erstellen Sie dann eine neue JS-Datei und laden Sie das Node-Webshot-Modul:
const webshot = require('webshot');
Optionen definieren:
const options = { // 浏览器窗口 screenSize: { width: 755, height: 25 }, // 要截图的页面文档区域 shotSize: { height: 'all' }, // 网页类型 siteType: 'html' };
Hier , Durchsuchen Die Breite des Browserfensters sollte entsprechend der Situation der Webseite angemessen eingestellt werden. Die Höhe kann auf einen sehr kleinen Wert eingestellt werden. Dann muss die Breite des Seitendokuments auf „Alle“ eingestellt werden die Fensterbreite, damit die Tabelle in der kleinsten Größe vollständig gescreent werden kann.
Als nächstes definieren Sie die HTML-Zeichenfolge:
let html = "target rich text html code, eg: <table>...</table>";
Beachten Sie, dass der darin enthaltene HTML-Code Zeilenumbrüche entfernen und doppelte Anführungszeichen durch einfache Anführungszeichen ersetzen muss.
Abschließend Screenshot:
webshot(html, 'demo.png', options, (err) => { if (err) console.log(`Webshot error: ${err.message}`);});
Auf diese Weise wird die Konvertierung vom HTML-Code in ein lokales Bild realisiert, das in die Qiniu Cloud usw. hochgeladen werden kann. Ob serverseitiges Parsen oder Miniprogramm-Präsentation, es gibt keine Schwierigkeiten...
Das obige ist der detaillierte Inhalt vonMini-Programmentwicklung und Analyse von Webinhalten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!