Naver搜索引擎针对JavaScript网站优化推出SPA平台

0oD三一o0

温馨提示:这篇文章已超过953天没有更新,请注意相关的内容是否还可用!

大多数网站都使用 JavaScript 来改善用户体验。最近,随着 JavaScript 技术的发展,很多开发者在建站时通过引入 Angular、React、Vue.js 等框架,将 Web 转换为单页应用(SPA)平台。当然,考虑到这些趋势,Naver 网站搜索也支持基于 SPA 的网站的收集和索引。

以 SPA 网站为例,由于 JavaScript 在决定网页结构方面起着主导作用,因此 Naver Search Robot 在收集和解释内容的过程中也会测量和解释 JavaScript 的影响。这一系列过程需要的资源比传统 HTML 页面的解释多几倍。因此,即使是 SPA 网站,也建议在服务器上处理渲染(Server Side Rendering),以便搜索机器人能够识别主要的 HTML 区域。

本指南说明 Naver Search Robot 如何处理收集到的 HTML 中包含的 JavaScript。如果您正在使用 SPA 方法构建站点,请参阅本指南以优化 JavaScript 搜索。

检查 robots.txt 中的 JavaScript 和 CSS 是否被阻止

有时,某些网站会将 JavaScript 和 CSS 等资源 URL 视为搜索机器人无法收集的内容。

User-agent: *Disallow: /your-javascript-urlDisallow: /your-css-url

请检查 robots.txt 的内容以允许搜索机器人收集 JavaScript。

User-agent: *Allow: /your-javascript-urlAllow: /your-css-url혹은 별도로 지정 하지 않음

作为参考,Naver 搜索机器人在收集 JavaScript 等资源时,会在浏览器 User-Agent 的末尾添加 Yeti。User-Agent 中指定的版本可能会不时更改,更多信息请参阅如何检查搜索机器人

Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebit/53.7.36 (KHTML, like Gecko) Chrome/63.0.3239.0 Safari/537.36 (compatible; Yeti/1.1; +http://naver.me/spd)

不要使用片段 (#) URL

片段是为指定页面中的特定位置而创建的规则。

https://www.mysite.com/page#subsection-1https://www.mysite.com/page#subsection-2

NAVER 搜索机器人在解析要收集的 URL 的过程中去除片段部分。因此,对于上例中的 URL,更改为 https://www.mysite.com/page 并继续收集。

如果您的站点 URL 是作为单页应用程序 (SPA) 的片段 (#) URL 构建的,并且每个
URL 都保证内容独立,则应将其更改为永久链接

예) fragment (#) 또는 해쉬뱅 (#!) 으로 구축된 URL https://www.mysite.com/#homehttps://www.mysite.com/#producthttps://www.mysite.com/path/to/#!/faq-1https://www.mysite.com/path/to/#!/faq-2 
예) permalink 로 변경https://www.mysite.com/homehttps://www.mysite.com/producthttps://www.mysite.com/path/to/faq-1https://www.mysite.com/path/to/faq-2


基于 Web 浏览器的解释(渲染)

Naver 搜索机器人按照与您使用的一般 Web 浏览器相同的方式解释(呈现)网页的过程如下。

  1. 当搜索机器人发现一个使用 JavaScript 动态处理 HTML 的页面时,它会检查该页面中包含的 JavaScript 资源是否被收集。

  2. 如果不收集 JavaScript,则首先收集静态 HTML 的内容并编制索引。

  3. HTML 中包含的 JavaScript 资源经过单独的收集过程,并在渲染服务器上存储一段时间。偶尔会发现,通过在 JavaScript url 中插入时间戳或哈希值来强制资源的最新性。我们不建议这样做,因为它可能会导致在收集过程中对页面内容的解释出现问题。

  4. 当搜索机器人重新访问页面时,如果存在安全的 JavaScript,则该脚本将包含在呈现中。

  5. 判断渲染结果页面的主要内容内容是否发生变化后,判断是否更新索引。

问:使用 JavaScript 构建的 SPA 网站是否会被排除在搜索范围之外?

Naver搜索机器人有一个确定每个页面的“收集优先级”的过程,以便高效收集互联网上存在的众多网页。由于分配给搜索机器人的收集资源是有限的,选择URL后,收集继续进行.

由于文档索引的大小以及网页的收集存在物理限制,因此我们不保证索引和搜索的曝光,即使它们已经收集。因此,不要简单地假设您的基于 SPA 的网站不会出现在搜索中。


免责声明:本文来自Naver站长平台,不代表0oD三一o0的观点和立场,如有侵权请联系本平台处理。

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,935人围观)

还没有评论,来说两句吧...

取消
微信二维码
微信二维码
支付宝二维码