Google Exploit - Канонические негативные черные ссылки SEO

Google Exploit - Канонические негативные черные ссылки SEO


07.05.2018 00:59

192

Обнаружен новый метод негативной SEO атаки. Что делает этот exploit особенно плохим, так это то, что его практически невозможно обнаружить. Нет никакого способа, восстановления, если атакующий веб-сайт неизвестен.

До сих пор Google молчит о том, что они намерены предпринять, чтобы закрыть этот exploit в том, как Google ранжирует и де ранги веб страниц.

Примечательно, что этот exploit был замечен, но не протестирован и не проверен. Если этот exploit является реальным, он имеет потенциал, в том чтобы в основном нарушать результаты поиска Google.

Как была раскрыта атака

На cross сайте каноническая негативная индексация ссылок была обнаружена Bill Hartzer из Hartzer Consulting. Он заметил её из-за внезапного падения рейтинга сайта. В ходе проверки обратных ссылок, Hartzer обнаружен ссылки на странный сайт.

Но клиент не ссылался на этот сайт. Расследование показало, что другой сайт привел его к негативной индексация ссылок.

Если бы этот атакующий сайт не был связан с третьей страницей, Hartzer не смог бы идентифицировать атакующий веб-сайт. Именно благодаря новому индексу SEO Data mining company Majestic, который включает канонические данные, Hartzer смог обнаружить атакующий сайт. (Примечание редактора: Hartzer - это амбасадор в Majestic Brand.)

Google Exploit - Канонические негативные черные ссылки SEO pumpkin-webstudio.ru (1).png

Как работает негативная каноническая индексация SEO ссылок

Атака работает путем копирования всего раздела "head" веб страницы жертвы, в раздел head веб страницы спама, включая канонический тег. Канонический тег сообщает Google, что эта страница спама является веб страницей жертвы.

Затем Google предположительно назначает все содержимое (и отрицательные оценки спама) с веб страницы спама на веб страницу жертвы.

Что говорит страница поддержки Google на Rel=Canonical?

Вот собственная страница поддержки Google о том, как Google обрабатывает rel=canonical. Ниже представлена собственная страница поддержки Google:

Почему вы должны выбрать канонический URL?
Существует ряд причин, по которым вы хотите явно выбрать каноническую страницу в наборе повторяющихся / похожих страниц:

Консолидация сигналов разных ссылок для похожих или дублирующихся страниц, помогает поисковым системам консолидировать информацию, которую они имеют для отдельных URL адресов (например, ссылки на них) в одном предпочтительном URL адресе. Это означает, что ссылки с других сайтов на example.com/dresses/cocktail?gclid=ABCD консолидируются со ссылками на example.com/dresses/green/greendress.html.

Какой же ответ дал Google?


До сих пор Google, похоже, сосредоточен на том, чтобы отклонить идею, не рассмотрев ее. Джон Мюллер написал в Твиттере, что Rel-Canonical была десятилетней давности технологией, и что-то вроде этого уже всплыло. Вот что "Мюллер написал в Твиттере:

Rel canonical существует уже более десяти лет, люди пробовали много вещей с ним. Это сигнал для канонизации; один URL выигрывает, другие обходы отбрасываются.

Его аргумент противоречит недавнему XML Sitemap Exploit, который был официально подтвержден Google. Просто потому, что технология десятилетней давности не означает, что она не может быть использована. Недавний XML Sitemap Exploit противоречит заявлению Мюллера.

Кроме того, rel=Canonical не только влияет на бюджет обхода контента. Как вы можете видеть из приведенной выше страницы поддержки Google, Rel=Canonical объединяет оценки разных ссылок.

Мюллер сообщил:

"Предположение о том, что rel canonical объединяет страницы, неверно. Это не так."

Но кто - то еще в Twitter отметил, что это заявление противоречит собственным словам Мюллера, где он заявлял в интервью:

"С каноникал вы говорите нам, что эта страница на самом деле такая же, как и другая страница. И это может помочь нам, мы можем взять все сигналы, что у нас есть для обеих этих страниц, и объединить их в одну."

В последнем утверждение Мюллер описывает что происходит, со слов Hartzer. Hartzer утверждает, что отрицательный рейтинг идет от сигналов атакующих страницы, в том числе исходящих так называемых черных ссылок на сайты для взрослых, азартные игры и так далее, что сочетаются со страницами на сайте жертвы.

В результате жертва теряет свой сайт в поисковой выдаче, по-видимому, из-за всех негативных спам сигналов (черных ссылок), приписываемых сайту жертвы.

  1. Заявление No 1 от Google, что Rel-Canonicals - десятилетней давности не является уважительной причиной, чтобы отклонить Hartzer заявление. Подтвержденный XML Sitemap Exploit противоречит заявлению Google.
  2. Утверждение No 2 от Google, что Rel-canonicals не комбинирует страницы, недействительно, потому что собственные слова Мюллера и собственная страница поддержки Google противоречат его утверждению.

Издатели могут чувствовать себя немного лучше, зная, что Google серьезно отнесется к отчету и изучат его. Это лучший ответ, чем не рассматривать заявление и просто отклонять его противоречивыми заявлениями.

Как обнаружить эту атаку

Вопрос был задан Hartzer есть ли другой способ, обнаружить эти нападения так называемыми черными ссылками. Он сообщил, что попробовал ряд программных средств, в том числе Copyscape и многие другие. Но пока только Majestic смог выявить некоторые из атакующих объектов разных ссылок.

"Я попробовал поиск исходного кода publicwww, но он не показывает данные – только Majestic на самом деле показывает проблему, и это потому, что тот, кто делает отрицательное SEO ссылки, тоже связан", - сказал Hartzer. "В других случаях я обнаружил, что сайты не связаны. Я знаю, что есть другие сайты, которые делают это, чтобы ... увидеть несколько других."

Google делает что-нибудь, чтобы остановить Cross Site Exploits?

Kristine Schachinger, которая недавно выявила подобный exploit, предложила эти наблюдения:

"Обычно метод атаки и результаты могут быть непосредственно отслежены друг к другу. Но на этот раз вектор атаки заключается не в атаке сайта, а в слабости алгоритмов Google.

Атака основана на том, что Google "воспринимает" два сайта как один. Это переносит положительные или отрицательные переменные между сайтами злоумышленника и жертвы.

Путаница сохраняется в течение некоторого времени, что означает, что атака имеет постоянство за пределами жизненного цикла фактической атаки. Это проблема Google, которая, похоже, не активно решается Google."

Является ли этот exploit реальным?

Этот exploit был задокументирован как произошедший с несколькими сайтами. Но стоит отметить, что на сегодняшний день не было никаких экспериментов, чтобы подтвердить, что такая атака возможна.

Что Google может сделать, чтобы остановить этот exploit?

Если этот exploit реален, он влияет на то, как Google и Bing используют канонический тег.

На практике канонический тег не является директивой. Это значит, что в отличие от файла robots.txt, поисковые системы не обязаны подчиняться тег Canonical. Канонический тег рассматривается поисковыми системами как предложение.

Если подтверждение, как недостаток в том, как канонический тег работает, то возможное решение может быть для поисковых систем, чтобы обновить канонические спецификации, так он больше не сможет быть использован для канонизации в разных доменах. В идеале, это то, что должно быть сделано через консоль поиска Google.