JavaScript 为用户提供直观、动态和交互式的在线体验。当抓取传统的 HTML 页面时,一切都很简单,而且过程很快。 Googlebot 可能会在下载 HTML 文件并提取源代码的链接后同时访问。下载 CSS 文件后,该页面将由 Google 的索引器编制索引,该索引器还接收所有下载的资源。
当抓取主要使用 JavaScript 的网站时,事情变得充满挑战。 Googlebot 下载 HTML 文件。
Googlebot 在源代码中看不到链接,因为它们仅在 JavaScript 运行后插入。
接下来,下载 CSS 和 JS 文件。 Googlebot 必须使用 Google 网络渲染服务解析、构建和运行 JavaScript。
WRS 从数据库或其他 API 检索数据。
索引器可以索引材料。然后,Googlebot 可以将新找到的链接添加到其队列中以供进一步抓取。
这涉及到网页渲染。将 HTML、CSS 和 JavaScript 代码转换为访问者单击链接时预期看到的交互式网页的过程称为渲染网页。网站的每个页面都是以用户为中心创建的。
对于用户和 Google 来说,解析、构建和执行 JavaScript 文件需要花费大量时间。在网站完全生成之前,Google 通常无法对包含大量 JavaScript 的页面内容建立索引。
并不是所有较慢的事情都发生在渲染过程中。它还描述了寻找新联系的方法。在生成页面之前,Google 经常无法找到富含 JavaScript 的网站页面上的链接。 JavaScript 是一种计算机语言,必须先构建才能使用;任何与特定 JavaScript 版本不兼容的语法都会导致构建失败。
最新的 Chrome 版本是 Googlebot 的基础。这表明 Googlebot 使用最新版本的浏览器呈现网站。 Googlebot 浏览网站的方式与人使用浏览器的方式相同。然而,Googlebot 并不是标准的 Chrome 浏览器。 Googlebot 拒绝用户授权请求(即 Googlebot 将拒绝视频自动播放请求)。跨页面加载, cookie、本地存储和会话存储将被删除。如果您的内容依赖于 cookie 或其他本地保存的信息,Google 不会为您的内容建立索引。 Googlebot 可能会决定不下载所有资源,但浏览器总是会这样做。
Google 认为使用 JS 进行的规范标签更改是不可靠的。因此,请确保您的规范 URL 是 HTML 格式而不是 JS 格式。尽管 Google 有可能已经解决了这一问题,但在确定之前,不应冒险进行 SEO。
Google 对 JavaScript 有相当的了解。然而,JavaScript 确实比普通 HTML 需要更多的工作,因为爬虫试图理解全球数十亿个网站并对其进行排名。它有时可能会因此而受到影响。
Google 声称 Googlebot 分两个阶段使用 JavaScript 抓取网站。爬网程序将在初始扫描期间检查 HTML 并使用它来索引站点。他们稍后会回来显示必要的 JavaScript。但是,带有 HTML 标记的材料显示在使用服务器端渲染制作的网站上。 Googlebot 无需再次访问该网站即可在页面上呈现 JavaScript 来正确索引内容,因为主要内容已经可见。这可以极大地改进 JavaScript SEO 方法。
由于第一次和第二次浏览网站之间的时间差,JavaScript 中包含的内容不会被快速索引。因此,在确定初始排名时不会考虑这些材料,并且 Google 可能需要一些时间才能注意到更改并更新其结果。
因此,采用 JavaScript SEO 的企业应确保在其网站的 HTML 中包含尽可能多的重要材料。他们应该编写重要信息,以便爬虫能够立即理解它(如果他们希望这些信息计入排名)。
在 Googlebot 第二次浏览您的网站之前,JavaScript 不会呈现。因此,一些网站会错误地向 Google 首次扫描网站期间加载的 HTML 添加标记,例如“无索引”标记。此标记可能会阻止 Googlebot 再次访问该网站以执行 JavaScript,从而导致该网站无法正确编入索引。
随着企业利用 JavaScript 来标记其页面并使网站对访问者更具吸引力,它仍然是互联网的重要组成部分。但对于许多人来说,理解 Googlebot 和其他爬虫如何解释 JavaScript 以及它如何与 JavaScript SEO 交互仍然很重要。基于 JavaScript 的网站现在可以由爬虫和搜索引擎以与 基于 HTML 的网站可以。然而,开发人员有责任让他们的网站易于访问和抓取,并理解当代 JavaScript 网站的 SEO 如何发挥作用。
以上是搜索引擎可以索引 JavaScript 吗?的详细内容。更多信息请关注PHP中文网其他相关文章!