キャッシュページの日時は最終インデックス日、最終クロール日ではない。キャッシュはSEO診断には不向き

[レベル: 中級]

Google のキャッシュの説明に含まれる日時は、最後にインデックスされたときの日時を示します。
最後にクロールされたときではありません。

また、SEO のために利用するにはキャッシュは不向きです。

キャッシュの日付はインデックス日であってクロール日ではない

今朝方、Google の Gary Illyes(ゲイリー・イリェーシュ)氏が次のようなツイートを投稿していました。

キャッシュページに表示される日付について、ここ数週間ほどの間に何人かに尋ねられた。

明確にしておきたいのだが、その日付は、最後にインデックスまたは再インデックスされたときのものあって、最後にクロールされたときのものではない。Googlebot はページをクロールするかもしれないが、インデックス(のシステム)が、前のバージョン(のキャッシュ)を再利用しようと判断することがときにはある。

検索結果の「キャッシュ」リンクあるいは cache: コマンドを利用することでそのページのキャッシュを見ることができます。

キャッシュリンク

キャッシュページにはキャッシュの取得日が書かれています。

Google キャッシュの日付

この日付のことをゲイリーは説明しているのです。
最終クロール日ではなく、最終インデックス日になります。

したがってクロールされたとしても、そのページの最新の状態がキャッシュには反映されていないことがありえます。

SEO にキャッシュページを使うべきではない

そもそも、SEO の分析を目的に利用するにはキャッシュページは適していません。
利用価値がまったくないということではありませんが、検索の仕組みに精通しているのでなければ不正確な情報を手にしてしまうことがあるからです。

ゲイリーが指摘した日付がその一例です。ほかには、キャッシュは Googlebot がレンダリングした結果ではないということを知らないのもありがちです。

キャッシュと Google のインデックスは別のデータです。
実際のインデックスは更新されていても、キャッシュは更新されていないということもありえます(新規ページで、本当はインデックスされているのにキャッシュを見られないということもある)。

日付を含め、キャッシュのデータを検索の診断に使うべきではないことをゲイリーもジョンもたびたび指摘しています。

そのようなこと(インデックスの更新頻度を知ること)にキャッシュ日を使うのは気をつけたほうがいい。日付はそういったことを示すものではない。

インデックスしたページをすべてキャッシュ表示するとは限らない。キャッシュページが 404 を返すことがありうる。キャッシュページが表示されるまでにはしばらく時間がかかることがあるし、単にまったくキャッシュしないことだってある。

キャッシュされないことの理由としては、重複や正規ページではないこと、noarchive が設定されていることに加えて、あらゆる種類の予想しない動きによるものがある。

キャッシュはいわば分離している。私たちがインデックスやランキング付けするものを何か指し示すものではない。

キャッシュの日付は診断ツールではない。(キャッシュ日が一致しなかったとしても)無視しなさい。

キャッシュされたページがあるかないかは、何らかの特定の問題の兆候を示すものではない。キャッシュページが 404 を返してもまったく普通だ。心配しなくていい。

ということで、SEO の分析にキャッシュを使うのはやめましょう。