このブログの記事、最近は Google ウェブ検索でまったく上位に現れない。ちょっと前と比べてあまりに極端に出現数が減って不思議だったんだけど、Google がいつのころからか JavaScript で出力するテキストやリンクも考慮するようになったのが原因の一つかもしれない。(もちろんそうでもないかもしれない。)
例えば、各記事ページのサイドバーに最新記事一覧を JavaScript で出力して載せているんだけど、なぜかそのアンカーテキスト(記事タイトル)もページのコンテンツとしてインデックスに使われている。
サイト内検索ではキーワード検索しても関係ないページがたくさん出てきて、個人的に使いづらい。結局 chalow のデフォルト検索 CGI ばっかり使ってる。
全体検索ではキーワードスパム入りページだと思われて上位に出てこなくなったのかも。
あと、今回 Google Search Console で内部リンクを見てみたら、前述の JavaScript で貼ったリンクが機能しちゃってる。すべての記事ページに最新記事一覧が出るわけで、新しいページへの被リンク数がすごいことになってた。リンクスパムと思われて、SEO 的に悪影響を与えていそう。
試しに先日のプチリニューアル[2015-06-24-1]の際に JavaScript で表示するリンクに「rel="nofollow"」を付けるようにしたら、それ以降の記事ページの被リンク数は増えてない模様。
以上のように、リンクは nofollow でなんとかなりそうだけど、テキストは無理みたい。つまり、シンプルに両方を解決する方法はなさそう。YST だとそれ用の記述方法があったんだけどなあ。(ref. [2007-05-09-4])
なので、当面の間 robots.txt で記事リンク用の JavaScript を拒否する設定にしてみた。 Google Search Console から「クロール」→「Fetch as Google」で実際に Googlebot がどういうテキストを持っていくかを確認。想定通りに記事リストが非表示になった。
同じような現象が zenback でもあって、関連記事のタイトルなんかでもヒットしちゃうんだよね。こちらも検証のためしばらく zenback をはずしてみた。
いろいろ考えて対策してるけど、基本的に全部妄想の独り相撲かと。うまくいけばラッキー、くらいな感じ。
アンカーテキストの問題
例えば、各記事ページのサイドバーに最新記事一覧を JavaScript で出力して載せているんだけど、なぜかそのアンカーテキスト(記事タイトル)もページのコンテンツとしてインデックスに使われている。
サイト内検索ではキーワード検索しても関係ないページがたくさん出てきて、個人的に使いづらい。結局 chalow のデフォルト検索 CGI ばっかり使ってる。
全体検索ではキーワードスパム入りページだと思われて上位に出てこなくなったのかも。
リンクの問題
あと、今回 Google Search Console で内部リンクを見てみたら、前述の JavaScript で貼ったリンクが機能しちゃってる。すべての記事ページに最新記事一覧が出るわけで、新しいページへの被リンク数がすごいことになってた。リンクスパムと思われて、SEO 的に悪影響を与えていそう。
試しに先日のプチリニューアル[2015-06-24-1]の際に JavaScript で表示するリンクに「rel="nofollow"」を付けるようにしたら、それ以降の記事ページの被リンク数は増えてない模様。
対策
以上のように、リンクは nofollow でなんとかなりそうだけど、テキストは無理みたい。つまり、シンプルに両方を解決する方法はなさそう。YST だとそれ用の記述方法があったんだけどなあ。(ref. [2007-05-09-4])
なので、当面の間 robots.txt で記事リンク用の JavaScript を拒否する設定にしてみた。 Google Search Console から「クロール」→「Fetch as Google」で実際に Googlebot がどういうテキストを持っていくかを確認。想定通りに記事リストが非表示になった。
同じような現象が zenback でもあって、関連記事のタイトルなんかでもヒットしちゃうんだよね。こちらも検証のためしばらく zenback をはずしてみた。
いろいろ考えて対策してるけど、基本的に全部妄想の独り相撲かと。うまくいけばラッキー、くらいな感じ。