Рубрики

Полезные материалы

Как мы взломали поисковый рейтинг Google по поиску

  1. Фон
  2. Эксперимент
  3. Заключительные мысли
  4. 1. 302 перенаправить не (полностью), чтобы обвинить
  5. 2. Используйте канонические
  6. 3. Хотя и редко, угон может произойти

Я хотел поделиться некоторыми заметками об эксперименте, проведенном моим агентством недавно, в результате чего Google поверил, что наш веб-сайт является их собственной канонической версией. руководство по поисковой оптимизации для начинающих PDF - и ранжирование нас вместо собственного контента для «поисковой оптимизации» и тысяч других фраз.

Мы проводим множество внутренних тестов, как для нашего программного обеспечения SEO Spider, так и в качестве агентства для клиентов. Этот конкретный эксперимент был просто для забавы, чтобы подчеркнуть проблему, которую мы обнаружили, без намерения причинить кому-либо вред или даже ради какой-либо прибыли. Мы закончили эксперимент и удалили содержимое.

Фон

Ранее мы связывались с Google после того, как заметили странное поведение в результатах поиска. В то время как их руководство по поиску SEO в PDF занимало место по релевантным терминам, таким как «SEO» и «руководство по SEO Google», что-то было не совсем правильно….

Для выполненных нами поисков появится список для начинающего руководства PDF, но он будет ссылаться на другие загруженные сайты, а не на собственный сайт Google. Так что Google по какой-то причине не занимал рейтинг своей собственной страницы; вместо этого появились другие сайты, использующие контент Google.

Вот мнение некоторых сайтов, занимающих это место в Великобритании. Каждый сайт, казалось, выбивал другой из результатов поиска, поскольку Google изменил ту, которую он считал канонической версией.

Мы решили выяснить, почему страница Google не индексируется, а другие страницы, похоже, показываются на своем месте. Мы заметили, что Google использует временное перенаправление 302 в своем руководстве по поисковой оптимизации, которое размещено в отдельном домене.

Перенаправление 302 должно означать оригинальный URL на google.com был проиндексирован, а не целевой URL Размещено на static.googleusercontent.com.

Однако ни один URL не был проиндексирован, и они, похоже, изо всех сил пытались понять каноническое и проиндексировать свое оригинальное содержание и URL. Google не использовал «noindex», ничего не было заблокировано через robots.txt, другой контент был проиндексирован на поддомене, и у них, похоже, не было никаких конфликтующих директив с каноническими или чем-либо еще на странице или в заголовке HTTP.

Google сказал, что PageRank течет так же независимо от того, является ли это 302 временным перенаправлением или 301 постоянным перенаправлением - это действительно вопрос того, какой URL они индексируют и показывают в результатах поиска. Теоретически, исходный URL должен быть проиндексирован и ранжирован, но это не так.

В то время как каждый тип перенаправления должен передавать PageRank одинаковым образом, Гэри Иллис сказал, что 301s помогают с канонизацией.

Мы знали из предыдущих экспериментов, что идентичный контент может быть захвачен, но, как правило, более авторитетными веб-сайтами. Руководство по SEO для начинающих около 2100 ссылок на корневые домены на исходный URL и еще 485 к цели перенаправления (комбинированные протоколы HTTP / HTTPS), так что это очень мощная страница с большой видимостью.

Руководство для начинающих также есть на Google.com, который имеет огромное количество репутации. Конечная цель была в отдельном домене.

Очевидно, что веб-сайт Screaming Frog не так авторитетен, как Google, но гораздо менее авторитетные веб-сайты уже заменили их ранее из-за проблем, описанных выше.

Эксперимент

Мы решили провести краткосрочный эксперимент и просто загрузить руководство по поисковой оптимизации Google в наш домен. Затем мы проиндексировали его через консоль поиска Google и забыли об этом.

Неделю спустя мы заметили, что мы похитили собственные рейтинги Google (и всех предыдущих угонщиков, из-за нашего более высокого «авторитета»), поскольку их алгоритм, по-видимому, теперь считал нас каноническим источником их собственного контента. Наш URL будет возвращаться под запросом info: и cache: для любого из URL Google.

Мы угнали угонщиков - и Google.

Несмотря на то, что мы являемся британским сайтом, мы поднялись на 4-ю позицию по «поисковой оптимизации» и в топ-10 по «SEO» в США - из топ-50.

Этот PDF-файл получил оценку «Google SEO», «Руководство по Google SEO», «www google com» и все остальные фразы, для которых должен быть виден контент Google.

Этот PDF-файл был оценен по множеству запросов других типов брендов в Великобритании и США, что можно увидеть благодаря SEMrush (США, в частности, на снимке экрана).

И Sistrix выделил неожиданные «новые» ключевые слова, которые мы теперь органично обозначали:

Консоль поиска Google записала около 800 тыс. Показов PDF-документа специально за четыре дня.

Этот эксперимент получил большое внимание, когда мы написали в твиттере ,

Таким образом, мы следили за этим в течение следующих дней, чтобы увидеть, вносит ли Google какие-либо изменения в правильную индексацию, канонизацию и ранжирование. Примерно через 48 часов мы заметили, что руководство Google заняло ранжирование и теперь явно проиндексировано (и будет отображаться под сайтом: запрос), когда раньше оно не возвращало бы результат.

Затем мы заметили, что Google добавил HTTP-код, канонический для их PDF, к исходному URL, что помогло его проиндексировать.

Тем не менее, мы все еще выглядели как канонические под запросом info: query и ранжированием их запросов. Это означало, что оба руководства теперь ранжировались в результатах поиска, часто с нашим сайтом выше собственного Google.

Мы ожидали, что это изменится - чтобы Google снова стал каноническим, а наша страница выпала из рейтинга. Спустя пять дней мы все еще были рядом с Google в результатах поиска по тысячам поисковых запросов. Затем наш PDF исчез из результатов поиска, и мы довольно быстро завершили эксперимент.

Заключительные мысли

Прежде всего, мы не рекомендуем возиться с чужим контентом. Это не жизнеспособная стратегия или тактика для получения более высоких рейтингов, а просто необычный и интересный пример. Делать выводы может быть очень сложно, так как мы не всегда можем быть уверены, какие другие факторы или неизвестные могут быть в игре.

Хотя у нас есть много теорий и мыслей внутри, мы закончим на трех заключительных моментах.

1. 302 перенаправить не (полностью), чтобы обвинить

Хотя мы изначально полагали, что первопричиной может быть перенаправление 302, я знаю, что Google твердо убежден, что при использовании перенаправлений 302 проблем не возникает. Мы считаем, что существует несколько причин, по которым файлы размещаются.

Мы обнаружили несколько других странностей, связанных с изменением URL-адресов с течением времени (на основе значений, указанных в заголовке Accept-Language) и неправильной канонизации HTTPS, просто для хорошей меры.

2. Используйте канонические

Очень разумно использовать канонические символы, чтобы помочь с индексацией. Как только Google обновил канонические файлы HTTP в формате PDF для одного URL, он сразу же был проиндексирован.

Используя сканер, вы можете сканировать свой сайт на предмет отсутствия канонических элементов ссылок или канонических ссылок в заголовке HTTP.

Для PDF и документов вы можете легко установить HTTP каноническое использование .htaccess , например.

3. Хотя и редко, угон может произойти

Рейтинги страницы могут быть захвачены другим доменом, который использует идентичный контент при определенных обстоятельствах, таких как проблемы с индексацией или более авторитетный источник. Это обычно маловероятно, но, возможно, есть некоторые вещи, которые Google все еще может улучшить в ранжировании исходного источника.

Мнения, выраженные в этой статье, принадлежат автору гостя и не обязательно относятся к Search Engine Land. Штатные авторы перечислены Вот ,


Об авторе