Question 1

Google 搜索被官方拆成哪三个独立阶段（按顺序）？

Accepted Answer

抓取（crawling）→ 索引（indexing）→ 排序 / 呈现（serving）。Google 官方文档把搜索拆成三个独立阶段：抓取（爬虫沿链接发现并下载页面）、索引（分析内容与关键标签后存入索引数据库）、排序 / 呈现（用户查询时从索引找相关结果按相关性与质量排序）。三步缺一不可，任一步出问题页面都拿不到自然流量。

Question 2

Google 是怎么发现一个新页面的？

Accepted Answer

靠之前访问过的页面，以及从已知页面里抽取出来的链接。Google 明确说「没有一个所有网页的中央注册表」，所以它靠两类途径主动发现新页面：之前已经访问过的页面，以及从已知页面里抽取出来的链接。这也是为什么内链 / 外链是被发现的前提，孤岛页面可能永远抓不到。

Question 3

判断：只要页面被 Google 收录（索引），就一定能在搜索结果里排上名。

Accepted Answer

错误。错误。被索引 ≠ 能排名 / 出现——一个页面可能被索引，却因为内容不相关、质量低或 robots 规则而压根不出现在结果里。而且在此之前，「被处理」也不等于「被索引」，Google 明说索引并不保证。

Question 4

判断：只要在 robots.txt 里把某页 Disallow，这个页面就一定不会出现在 Google 搜索结果里。

Accepted Answer

错误。错误。robots.txt 是「禁抓取」不是「禁索引」——被屏蔽的 URL 如果别处有链接指向它，Google 仍可能发现并索引它，URL 照样出现在结果里。而且屏蔽后爬虫读不到页面里的 noindex 标签，noindex 反而失效。要真正不被索引，得用 noindex 并保证该页没被 robots.txt 挡住。

Question 5

判断：可以通过向 Google 付费，直接把某个自然搜索结果排得更靠前。

Accepted Answer

错误。错误。Google 不接受付费来把页面在自然结果里排得更靠前，排名由程序完成（自然结果和广告是两码事）。所以 SEO 的功夫在内容的相关性与质量，而不是「提交」或买排名。

Google 搜索的三步流水线：抓取、索引、排序 | SEO 入门

三步流水线：抓取 → 索引 → 排序

第一步抓取：Google 怎么找到你的页面

两个最坑人的误区：收录≠排名，robots.txt≠隐藏

自测 · 学完检查一下