TOP
メディア
E-A-Tの仕組みをGoogleの特許から読み解く

E-A-Tの仕組みをGoogleの特許から読み解く

公開日：2020/11/12

最終更新日：2024/02/17

ブログ

品質評価ガイドラインが公開されて以降、YMYLやE-A-Tは、SEOにおける大きな注目点でありつづけています。にわかに改善することは難しく、一夜にして大きな効果を得ることは不可能でしょう。

SEOのハックの手段として調査する意味はほぼないと言えますが、長期的な戦略やGoogleの考えを推測する上で、E-A-Tについて詳細を知ることはプラスになると思います。

今回は、Googleの特許について深い知識を持つビル・スラウスキ氏との共作によるE-A-T分析の記事をSearch Engine Journalより紹介いたします。

E-A-Tが検索に与える影響の全てを知る術はないが、Googleの特許を見ることで、Googleのアルゴリズムの能力を理解することができる。

E-A-TがSEOについての議論の中心を担うようになって以来、多くの都市伝説や誤解が生まれてきた。

また、我々の業界の誰しもが、理解することが難しいトピックであることも明らかになった。

その理由は明白だ。

E-A-Tについての情報をGoogleは僅かしか共有しておらず、PageRankやリンク以外で、どのランキング要素がE-A-Tの評価の一部となっているか、はっきりと説明されていないのだ。

https://twitter.com/dannysullivan/status/1182673025692340225?s=20

コンテンツの内容が正確かどうかを完全に特定することはできない

我々は、正確性を担保するにふさわしいシグナルを探している。

ゲイリー氏は「正確なコンテンツを持っていることが良い順位を導く要因になる」と話していたが、正確であることそれ自体より、シグナルに沿っていることが要因となりうる。

（中略）

それは専門性・権威性・信頼性に沿ったシグナルを探しているようなものだ。E-A-Tのような名称を与え、それを得られるように提案すべきだろう。

ああ、そういえば、我々は既に提案していた。
What webmasters should know about Google’s core updates

これにより、E-A-TがGoogleのアルゴリズム内でどのような役割を果たしているかについて、多くの疑問を我々に残すことになった。

「品質評価者がGoogleの検索結果に直接影響を与えることはない」とGoogleは明らかにしている。しかし、E-A-Tについて蔓延している多くの質問やその仕組については明らかにしていない。

Googleはどのようにして、著者や専門家を特定しているのか？
Googleはどのようにして、そのWebサイトがYMYL（Your Money, Your Life）に分類されているかどうかを判断しているのか？
Googleはどのようにして、科学的、医療的、歴史的なコンセンサスとの一致を判断しているのか？
E-A-Tは、ページ、ドメイン、エンティティ、企業の各レベルで評価されているのか？

幸運にも、（他の要素と同様に）順位を決定するプロセスの詳細を説明しているGoogleの特許を読み解くことで、このような問いに対する回答を拾い集めることができる。

近年申請されたものは特にであるが、いくつかのGoogleの特許は、著者の特定、Webサイトの区別、専門性のレベルの分類などに関連した情報を含んでいる。それらは、GoogleがE-A-Tをアルゴリズム的に使用している可能性を説明する手助けとなり得る。

Googleの特許についての免責事項
Googleはどのようにして、そのWebサイトのオーナーが把握しているのか？
Googleは、著者と専門家を特定するため、ページ内の要素とリンクだけを見ているのか？
Googleは、ナレッジグラフに含まれているエンティティのみ認識しているのか？
Googleはどのようにして、その人物やブランドが、その業界における権威があり、本当の専門家であると判断しているのか？
各Webサイトはどのようにして、YMYLに分類されるのか？
GoogleはE-A-Tを著者、ページ、ドメイン、ブランドのレベルで測定しているのか？
アドバイスと結論

Googleの特許についての免責事項

Googleの特許は、Googleのアルゴリズムの仕組みを正確に説明したものではない。

また、どの特許が実際に使用され、Googleのどのプロダクトに使用されているかを、我々が正確に知ることはできない。

しかし、Googleのアルゴリズムの能力や機能の理解の手がかりとなるはずだ。

私は、Googleの特許のエキスパートである、ビル・スラウスキ氏に、Googleの特許がE-A-Tの仕組みを理解する手助けとなり得ることへの説明を求めた。

我々は協力してこの記事を作成した。

下記は、E-A-Tについてのよくある質問である。そして、Googleの特許は、これらの質問に答える手がかりとなりうる。

Googleはどのようにして、そのWebサイトのオーナーが誰であるかを知るのか？
Googleは、著者と専門家を特定するため、ページ内の要素とリンクだけを見ているのか？
Googleは、ナレッジグラフに含まれているエンティティのみ認識しているのか？
Googleはどのようにして、その人物やブランドが、その業界における権威があり、本当のエキスパートであると判断しているのか？
各Webサイトはどのようにして、YMYLに分類されるのか？
GoogleはE-A-Tを著者、ページ、ドメイン、ブランドのレベルで測定しているのか？

Googleはどのようにして、そのWebサイトのオーナーが把握しているのか？

この問いに対する回答の手助けとなり得るGoogleの特許は複数ある。

まず、Googleは2007年にAgent Rankの特許を出願している。

スラウスキ氏によれば、この特許は、「そのページの著者、編集者、コメンテーター、評価者の身元をベースとして、各ページのランキングを上昇させる可能性がある」とのことだ。

この特許は、署名欄のようなデジタルのサインによって、（「エージェント」として知られている）著者や専門家を特定し、それらを組み合わせた評価スコアに従って、そのコンテンツを順位付ける機能を含んでいる。

しかし、2018年8月１日のコア・アップデート後、Googleは個々の著者の評判をランキング要素として使用していないことを、Googleのジョン・ミュラー氏は明言した。

いずれにせよ、「評判」を「専門性」や「権威性」と区別することは重要であるとスラウスキ氏は述べている。

評判は、「他者」がその著者をどのように認知しているか、ということである。

権威性や専門性は、Google自身が評価し、特定の著者やエンティティに割りあてる属性である。

これ以降、オーサーシップのコンセプトが大きく進化したが、近年のGoogleの特許を見てみると、Googleはオンラインで著者を特定する仕組みに取り組んでいることを指し示している。

2020年3月に、Googleはオーサーベクトルの生成と呼ばれる特許を出願している。

これにより、そのページに著者の名前が明確に言及されていなくても、文章のスタイルに基づいて、インターネット上で著者を特定することができるとのことだ。

スラウスキ氏は、「Author Vectors: Google Knows Who Wrote Which Articles」（※）という記事を執筆している。

その記事でスラウスキ氏は、「この新しい特許は、その著者によって書かれているというラベル付けされているテキストがなくとも、著者を特定するために使用される言葉のセットによって学習されたニューラルネットワークのシステムを活用している」と説明する。

※Googleは記事の著者をどのように特定しているのか？オーサーベクトルと特許について

Googleの「オーサーベクトル」は下記のように使用できる。

著者を特徴づける
ライティングのスタイルについて固有の特徴を識別する
似た特徴を持つ他の著者を特定する

もし、この特許がGoogleの検索アルゴリズムに実際に使用されているのであれば、これはSEOにとって様々な興味深い示唆を含むことになる。

例えば、

専門家の名前を偽って使用しているページを、特定できる可能性がある
著者が明記されていない場合でも、ライティングスタイルからその記事の著者を特定できる可能性がある
専門家のライティングスタイルと品質を分析し、そのトピックにおける専門家のコンテンツがどのようなものになるかを判断できる可能性がある。これに関連して、n-gramの活用と、Webサイト間のn-gram統計の比較から、コンテンツの品質を分類できることを指し示す特許もGoogleは保持している。

こうした事項が指し示すことは、「良いE-A-Tを偽装することはあなたが思うほど簡単ではない」ということだ。

あなたのコンテンツの品質が期待されるレベルの専門性に達していなかった場合、そのコンテンツが専門家によって書かれ、レビューされていると主張したとしても、それはE-A-Tの改善において十分な施策ではない。

Googleは、著者と専門家を特定するため、ページ内の要素とリンクだけを見ているのか？

2020年の初頭、興味深いことに、音声認識によって話者を特定する、「Speaker Identification」と呼ばれる特許をGoogleは付与されている。

Googleは、話者のアクセントなど、話者のコミュニケーションにおける固有の側面に着目して、これを実現している。

この特許は、Googleが大量の音声と動画のデータベースを保持し、話者についての情報を分析、取得できるYouTubeのようなプロダクトで適用されていることだろう。

スラウスキ氏は、彼が特許の分析を行った16年間の中で、これは注目すべき大きなトレンドの一部であると指摘する。

Googleは実際の話者、著者、Webサイトをインデックスし、それらをエンティティとして扱い、それら自身を固有のものとする特徴に基づいて、それらを理解し、インデックスすることを求めている。

この特許は、「GoogleによるE-A-Tへの注力が潜在的にどの程度までその範囲を広げていくか」を示している。

自然検索結果におけるテキストコンテンツは、Googleが専門家を評価するために活用する唯一の情報ではないようだ。

そのプロセスは、音声、動画、そして、潜在的には画像も対象とし、Googleの全てのプロダクトにまたがって、その範囲を広げることができるかもしれない。

Googleは、ナレッジグラフに含まれているエンティティのみ認識しているのか？

ナレッジグラフに含まれていない著者やその他のエンティティをGoogleがどのように評価しているか、我々が正確に知ることはできない。

しかし、先日Googleが公開したSearch on 2020という動画では、ユーザーの疑問への回答を手助けするため、「複数のソース間に広がるデータ」の使用を示唆している。

2018年以降、GoogleはU.S. Census、World Bank、その他のデータソースとともに、Data Commonsと呼ばれるオープンなデータベースで連携してきた。

Googleは、こうしたデータを「ナレッジグラフの新しいレイヤー」として含めることにより、その歩みをさらに進めるだろうと述べている。

Googleはユーザーのインテントのより良い理解のために自然言語処理を活用し、クエリをData Commons内の関連するソースへ割り当てるようになるだろう。

こうしたデータセットのリストはLinked Open Data Cloudで閲覧することができる。

こうした取り組みがGoogleの検索結果を変容させるかどうか、それを断言することは難しい。

しかし、Data Commons内で活用できる大量のデータを活用することで、現在はナレッジグラフに格納されていない数千もの新しいエンティティをGoogleが認識できるようになる可能性がある。

特に、Googleが現在エンティティとして認識していない、何百万人もの個人についての情報を含むU.S. Censusにおいて、これは当てはまるだろう。

Googleはどのようにして、その人物やブランドが、その業界における権威があり、本当の専門家であると判断しているのか？

これは、E-A-Tに関連する質問において、最もよくある質問の１つである。多くのSEOの専門家が注目していることだ。

ある領域において、専門性や権威性があると認められるために、特定のしきい値は存在するのだろうか？

リマインドではあるが、E-A-TスコアやYMYLスコアといったものは存在しない。昨年、Googleはそれを認めている。

しかし、Googleが近年取得した特許を見てみることで、特定のエンティティにおける専門性のレベルを測定するために、Googleがどのように取り組んでいるかの理解の手がかりとなる。

この質問に対する回答として最も近しい特許は、Webサイト・レプリゼンテーション・ベクトルという特許である。

重要なことは、この特許が、2018年８月１日の（非公式に「メディック（医療系）」と呼ばれている）コア・アップデートと同じ時期に出願されていることだ。

Googleは、エキスパート、初心者、素人といった具合に複数の専門性の区分にWebサイトを分類することができ、これらのページ内のコンテンツの権威性をベースにページを順位付けることができることを、この特許は指し示している。

この特許は、Googleはこれらの分類を生成するために、「それに適したあらゆる方法」を用いていると主張している。

また、Googleが使用する可能性のあるいくつかの例も上げている。

Webサイトのテキストや画像の分析
他のWebサイトのコンテンツを見る（例：リンク）
上記の組み合わせ

2017年にGoogleに付与された別の特許「Obtaining authoritative search results
」では、Googleが権威ある検索結果を必要とするクエリに対して権威あるサイトをランク付けするために使用するプロセスと、Googleが権威あるサイトと低品質の低いサイトを品質の低いコンテンツや大量の広告などの観点から区分するプロセスが説明されている。

上記の様々な特許を見ていくと、少なくともGoogleは（ページ上で明記されているかどうかに関わらず）著者を特定し、オンページおよびオフページの様々な要素を分析することで、特定のトピックに関する権威性や専門性のレベルを評価することに向けての取り組みを行っていることは明らかだ。

Googleは、バイオグラフィに記載された著者の経歴や、オンラインで言及された場所へのリンクなどのステップが、E-A-Tを評価する際に見ている要素であると明言していない。

しかし、「数百万もの小さなアルゴリズム」がE-A-TとYMYLを概念化するために作用していることを、Googleは示している。

そのため、これらのシグナルがプロセスの一部であると考えるのは妥当だろう。

ミュラー氏も最近、「健康や医療系のコンテンツのパフォーマンスを向上させるためには、SEOの専門家がE-A-Tについて述べていることに注目するのが重要である」という考えを支持している。

少なくとも、一般的に推奨されるアプローチはユーザーにとって有益ではあり、ミュラー氏は、Googleもそれらをピックアップできると述べている。

More from @johnmu: Look at what SEOs are explaining about E-A-T. Understand how to best present your content, author profiles, & more. John can't guarantee that will improve rankings, but make sure you have all of those signals for users. Google can pick those up too: https://t.co/IPg9MI5r08

— Glenn Gabe (@glenngabe) October 16, 2020

各Webサイトはどのようにして、YMYLに分類されるのか？

前述した「Webサイト・レプリゼンテーション・ベクトル」の特許は、GoogleがコンテンツをYMYL（Your Money, Your Life）だと認識する際に、使用されるメカニズムを理解するために最適な特許である。

この特許では、健康、医療、金融などのカテゴリにWebサイトを分類する手段として、Webサイトの背後にあるパターンや特徴を理解するためにニューラルネットワークを活用する。

このプロセスの一環として、Googleは以下のような特定のトピックに必要とされる専門性のレベルも判断している。

たとえば、「ナレッジドメイン内の専門性（例：医師）、ナレッジドメイン内の初心者によって書かれたWebサイトの第二のカテゴリ（例：医学部の学生）、ナレッジドメイン内の素人によって書かれたWebサイトの第三のカテゴリ」などである。

この特許では、どのカテゴリがYMYLとみなされるかについては明確に定義されていないが、Googleがどのようにサイトを各領域に区分し、その権威性を評価しているかが示されている。

さらに、特定のクエリでは、一定のカテゴリに属するドメインのみに、検索結果を制限する可能性を示している。

これが実際に発生する場合のスラウスキ氏の説明は下記である。

「このプロセスが、Googleが検索結果に表示させるサイト数を制限しているのであれば、Googleはインデックス全体ではなく、より少ないサイト数を見ていることを示している。

検索システムは、特定の分類内のWebサイトのみのデータを選択、検索、またはその両方を行うことができ、検索結果を見つけるのに必要なコンピューターのリソースを削減していることになる。例えば、分類に関係なくWebサイトの選択、検索、またはその両方を行わないことによって。」

Googleの特許の上記部分が指し示していることは、「特定のクエリにおいては、Googleがページをランキングする際、特定のカテゴリ内の権威性の高いWebサイトのセットのみを見ているかもしれない」ということだ。

特にYMYLのトピックにおいて、任意のトピックで10～20の権威性の高いドメインしか検索結果に表示されない理由を疑問に感じているのであれば、これが理由であるかもしれない。

GoogleはE-A-Tを著者、ページ、ドメイン、ブランドのレベルで測定しているのか？

この問いに明確に答えている特許はない。

しかし、品質評価ガイドラインにおいて、E-A-Tは「メインコンテンツの作成者、メインコンテンツ自体、Webサイト」に適用されると、Googleは述べている。

Googleは2019年に品質評価ガイドラインを編集しているが、YMYLの概念が、ページレベルの考察から、「トピック」への関連付けへ拡大している。

Googleドキュメント全体で繰り返されているこのフレーズは、GoogleのE-A-Tの評価はエンティティのレベルで行われているであろうことを指し示している。

50億のエンティティについて、5,000億の事実のレポジトリであるナレッジグラフの構築と、それらのつながりを考えると、これは意味を成すように思える。

E-A-Tを考慮するにあたり、エンティティを評価していることをGoogleは明確に述べているわけではないが、ゲイリー・イリェーシュ氏は2019年のPubconのカンファレンスにて、以下のように述べている。

「我々はとても有名な著者についてのエンティティを保持している。例えば、あなたがワシントン・ポスト紙のエグゼクティブであったなら、あなたはエンティティの対象だろう。これは、著者についてではなく、エンティティについてなのだ。」

それゆえ、「YMYL」がページ内のトピックとなり得るように、ページ内の認識されたエンティティは良いE-A-Tにもなりうるし、悪いE-A-Tにもなりうる。

これは、Googleのナレッジグラフとして認識されている著者の場合は特に、著者のバイオグラフィを追加するようなステップを取ることが、効果的なSEOの戦略になりうる理由となる。

その上で、SEOの専門家は、E-A-Tの改善のために構造化データを用いるといったように、Googleが容易にそのページのエンティティを特定できる状況を作るべきだ。

さらに詳細を知りたければ、2013年の関連エンティティの特許を読むことで、Googleがエンティティを特定し、順位付けする方法について理解が深まるだろう。

アドバイスと結論

E-A-TはSEOにおける、不明瞭な領域だ。

しかし、Googleの特許を理解することで、Googleによる一貫したミッションとなっているものを把握する手助けとなるだろう。

・著者、組織、そして、他の多くの種類のエンティティの特定
・エンティティの分類とトピックの専門家となるために求められる権威性のレベルの理解
・エンティティ間のつながり
・各トピックの権威性のあるエンティティへの理解
・権威性のあるエンティティと専門性の特徴の判断、順位を考慮する上で使用できる可能性のあるナレッジ

それゆえ、こうしたステップをSEOの戦略に組み込み、Googleが取るであろうプロセスを考慮することで、SEOのパフォーマンスがより強力なものとなるだろう。

E-A-Tに注力したSEOは、簡単な修正や短期間でのハックについてのものではない。

ブランド、著者、専門性について最適な特徴の全てをWebサイトではっきりと明示することを再確認するのだ。

SEOの利益だけでなく、もっと重要なことは、ユーザーに信頼感を植え付けることである。

難解な概念も複数でてきているため、何回か読み直して理解しようと思う記事でした。E-A-Tをさまざまな確度から分析した記事であり、非常に読み応えがありました。

もちろん、「良いE-A-Tを偽装することはあなたが思うほど簡単ではない」という考えは持っていましたが、今回の記事を読むことで、さらにその認識が強まったと思います。

少しずつですが、確実な積み重ねによって取り組んでいきたいですね。

この記事は、SearchEngineJournalに掲載された「The Mechanics of E-A-T: How Google Patents Can Help Explain How E-A-T Works」を翻訳した内容です。