Maison  >  Article  >  interface Web  >  Comment le client Node.js implémente-t-il l'affichage des pages sans télécharger de ressources ?

Comment le client Node.js implémente-t-il l'affichage des pages sans télécharger de ressources ?

PHPz
PHPzoriginal
2023-04-05 09:09:18614parcourir

Avec le développement continu de la technologie Web, de plus en plus de sites Web commencent à utiliser la technologie JavaScript et Ajax pour obtenir des effets de page plus interactifs. En tant que langage de programmation back-end basé sur JavaScript, le client de Node.js est de plus en plus utilisé pour développer des applications web. Cependant, les pages frontales de certains sites Web doivent télécharger certaines ressources avant de pouvoir s'afficher normalement. Voici une méthode courante pour afficher des pages sur le client Node.js sans télécharger de ressources.

Généralement, si vous devez accéder à un site Web sur le client Node.js, vous demandez généralement la page HTML du site Web, puis analysez les liens de ressources qu'il contient, puis téléchargez et affichez la page en demandant ces ressources.

Si vous devez vous connecter pour télécharger une ressource, vous devez simuler la connexion sur le client Node.js et enregistrer les cookies afin que les demandes ultérieures puissent maintenir le statut de connexion. L'exemple de code est le suivant :

const superagent = require('superagent');
const cheerio = require('cheerio');

superagent.post('https://example.com/login')
  .send({
    username: 'your username',
    password: 'your password'
  })
  .end((err, res) => {
    const cookie = res.headers['set-cookie'];
    superagent.get('https://example.com/secret-page')
      .set('cookie', cookie)
      .end((err, res) => {
        const $ = cheerio.load(res.text);
        console.log($('p').text());
      });
  });

Dans le code ci-dessus, nous utilisons le module superagent pour implémenter les opérations de connexion et de demande de page. Parmi eux, la méthode .set() est utilisée pour définir Cookie afin que nous puissions rester connectés lors des requêtes ultérieures. .set() 方法用来设置 Cookie,这样我们就可以在后续的请求中保持登录状态了。

不过,如果某些资源的下载是可以不必要的,我们就可以使用一些技巧来避免下载这些不必要的资源。例如,一些网页上包含的图片、视频等资源,如果我们不需要显示它们,那么就可以将其 URL 改为空字符串或占位符,以达到不下载的目的。示例代码如下:

const superagent = require('superagent');
const cheerio = require('cheerio');

superagent.get('https://example.com')
  .end((err, res) => {
    const $ = cheerio.load(res.text);
    $('img').attr('src', '');  // 将所有图片链接修改为空字符串
    $('video').attr('src', 'placeholder.mp4'); // 将所有视频链接修改为占位符
    console.log($.html());
  });

上述代码中,我们使用了 cheerio 模块来解析 HTML 页面,然后使用 $().attr()

Cependant, si le téléchargement de certaines ressources est inutile, nous pouvons utiliser certaines techniques pour éviter de télécharger ces ressources inutiles. Par exemple, si nous n'avons pas besoin d'afficher des ressources telles que des images et des vidéos contenues sur certaines pages Web, nous pouvons modifier leurs URL en chaînes vides ou en espaces réservés pour empêcher le téléchargement. L'exemple de code est le suivant :

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com', {
    waitUntil: 'networkidle0'  // 告诉 Puppeteer 在所有网络请求结束后再进行页面渲染
  });
  await page.evaluate(() => {
    Array.from(document.querySelectorAll('img')).forEach(img => {
      img.src = '';
    });
    Array.from(document.querySelectorAll('video')).forEach(video => {
      video.src = 'placeholder.mp4';
    });
  });
  const html = await page.content();
  console.log(html);
  await browser.close();
})();
Dans le code ci-dessus, nous utilisons le module cheerio pour analyser la page HTML, puis utilisons la méthode $().attr() pour modifier le lien de ressource. qui doit être modifié par la chaîne que nous voulons.

En plus des méthodes ci-dessus, il existe un moyen plus avancé d'obtenir l'effet de ne pas télécharger de ressources, à savoir utiliser un navigateur sans tête. Puppeteer est une bibliothèque de navigateur sans tête développée par Google qui peut être utilisée dans Node.js. Grâce à Puppeteer, nous pouvons simuler le comportement du navigateur pour accéder aux pages Web et utiliser certaines technologies avancées pour contrôler le rendu des pages et le chargement des ressources. L'exemple de code est le suivant :

rrreee

Grâce à Puppeteer, nous pouvons modifier les liens de ressources qui doivent être chargés avant le rendu de la page HTML pour obtenir l'effet de ne pas télécharger les ressources. L'avantage de cette approche est qu'elle peut contrôler le comportement de chargement des ressources et le rendu des pages de manière plus efficace et plus précise. 🎜🎜En résumé, l'affichage de pages sans télécharger de ressources dans le client Node.js peut être réalisé de différentes manières, et la sélection de la méthode spécifique dépend de la situation réelle. Mais en général, la maîtrise de ces compétences peut nous permettre de mieux contrôler le rendu des pages et le chargement des ressources, améliorant ainsi les performances des applications et l'expérience utilisateur. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Nodejs est-il utile ?Article suivant:Nodejs est-il utile ?