После семантического апокалипсиса большинство маркетологов поняло, что продвижение нельзя строить исключительно на ключевых словах. Однако слова о первичности контента и ущербности тактики манипуляции выдачей с помощью ключей часто остаются пустыми клише. Исследование компании Searchmetrics Ranking Factors 2014 помогает наполнить их практическим смыслом.
В ходе исследования эксперты Searchmetrics изучили топ-30 ресурсов по 10 тыс. запросов или приблизительно 300 000 URL. Ключевые результаты и выводы исследователей описаны ниже.
Вес ключевых слов в совокупности факторов ранжирования снижается. Эта тенденция наблюдается с 2013 года. Например, еще в 2012 году существовала достаточно сильная корреляция между позицией ресурса в выдаче и наличием ключевых слов в доменном имени или URL страницы. В 2013 корреляция уменьшилась, а в 2014 стала негативной. Это значит, что наличие ключевых слов в доменном имени сайта или URL страницы приводит к падению позиции ресурса в выдаче при прочих равных.
Специалисты Searchmetrics установили позитивную корреляцию между позицией сайта в выдаче и наличием ключевых слов в title, заголовках H2 и description. При этом коэффициент корреляции для заголовков H2 и description за последний год снизился, а для title вырос. Следует отметить низкое значение коэффициента: наличие ключей в title, description и H2 оказывает незначительное положительное влияние на позицию в выдаче.
Корреляция между наличием ключевых слов в заголовке H1 и позицией в выдаче является отрицательной. Ключи в H1 оказывают слабое негативное влияние на позицию ресурса в выдаче.
Слабое влияние ключевых слов иллюстрируется следующим графиком:
В 2014 году только 12 % сайтов, ранжирующихся на первой позиции в SERP, имеют ключ в заголовке H1. В топ-30 доля сайтов с ключами в H1 в 2013 и 2014 годах не превышала 18 %. Для подзаголовка H2 этот показатель не превышает 13 %.
Обратите внимание, первая и вторая позиции в выдаче имеют более низкую долю сайтов с ключами в заголовках по сравнению с более низкими позициями. Это объясняется фактором брендов: очень часто первые позиции в выдаче по коммерческим запросам занимают сайты брендов. Это замечание верно и для других графиков.
Ключевые слова в анкорах ссылок теряют влияние на позиции ресурсов в выдаче. Обратите внимание на иллюстрацию:
В 2013 году около 40 % сайтов из топ-30 имели бэклинки с ключами в анкорах. В 2014 году этот показатель снизился до 27 % и продолжает падать. Стоит подчеркнуть, что в 2014 году доля сайтов с ключами в обратных ссылках снижается в зависимости от позиции ресурса в выдаче, что четко видно на графике. В 2013 году этой зависимости не было. Это значит, что ключи в анкорах ссылок все-таки оказывают небольшое влияние на ранжирование. Однако вес этого фактора падает.
Google и другие поисковики остаются машинами, которые не могут не учитывать релевантность выдачи ключевым словам. Это значит, что ключевые слова влияют на позиции сайтов в SERP. Однако это влияние уменьшается. Эта тенденция особенно четко прослеживается в выдаче Google, который значительно усовершенствовал семантический поиск после внедрения алгоритма «Колибри».
Маркетологам можно не тратить время на поиск оптимальной плотности ключей, вписывание ключевых фраз в заголовки, подзаголовки и дескрипшены, погоню за ссылками с ключами в анкорах. Влияние этих факторов на ранжирование упало и продолжает падать. В настоящее время маркетологи должны сфокусироваться на других факторах ранжирования.
По данным Searchmetrics, одним из основных факторов ранжирования сайтов в Google является качество контента. Большинство людей без труда отличает качественный контент от некачественного. А маркетологам важно понять, какой контент считают качественным поисковые системы.
Google старается уйти от определения релевантности контента путем поиска ключевых фраз и подсчета числа их употребления на странице. Вместо этого крупнейший поисковик мира анализирует контент-кластеры или тематические области. Это завершенные контент-единицы: абзацы, разделы, статьи и главы. Google вычисляет семантические связи между словами с помощью технологии deep learning, имитирующей человеческие способы работы с данными. Благодаря этому поисковик высоко ранжирует в выдаче контент, релевантный не поисковому запросу, а намерению пользователя. Преимущество получают целостные контент-единицы, глубоко раскрывающие основную и смежные темы. Такой контент часто занимает в выдаче топ-позиции сразу по нескольким ключевым запросам.
Google подтверждает релевантность контента намерению пользователя, определяя одновременное присутствие в контент-кластере устойчивых терминов или терминов-подтверждений (proof terms), а также релевантных тематике терминов (relevant terms).
Устойчивые термины — это слова или словосочетания, смысловое значение которых сильно связано с поисковым запросом или основным ключевым словом. Эти термины с высокой долей вероятности естественно употребляются в тексте, тематика которого связана с главным ключом. Релевантные термины — это слова или словосочетания, смысловое значение которых имеет связь с основным ключевым словом. Эта связь не такая очевидная, как в случае устойчивых терминов. Однако вероятность появления релевантных терминов в тексте остается высокой.
Например, для поискового запроса «алгоритм Panda» устойчивыми терминами будут «Google Panda» и «поисковый алгоритм». Релевантными терминами можно считать «обновление», «уникальный контент», «переоптимизация», «продажа ссылок», «ранжирование». Термины «вебвизор», «миратулс», «директ» нерелевантны запросу «алгоритм Panda», хоть они и относятся к тематике поискового маркетинга.
Благодаря анализу устойчивых и релевантных терминов Google изучает семантику и контекст контента. Именно так поисковик определяет качество публикаций. На иллюстрациях ниже показана корреляция позиции сайта в выдаче и устойчивых и релевантных терминов.
Для определения корреляции Google использует частоту употребления терминов, частоту употребления других устойчивых и релевантных терминов, количество слов между терминами и другие факторы. Обратите внимание, поисковик анализирует именно частоту употребления терминов, но не количество их употреблений. Слишком частое использование ключа роботы Google считают спамом.
Маркетологи могут сломать голову, пытаясь понять принципы определения качества контента поисковиками. Все эти устойчивые и релевантные термины, технологии deep learning и контент-кластеры сведут с ума технаря и порвут в клочья гуманитария. На самом деле, специалистам важно понять один тезис. Google использует deep learning, чтобы имитировать человеческие способы работы с информацией. Иными словами, поисковик пытается определять качество контента так, как это делает человек.
Чтобы создавать качественный контент, специалисты должны глубоко погружаться в тему, объяснять закономерности, давать полезные советы, делиться опытом. Это невозможно сделать без использования устойчивых и релевантных терминов. Чтобы раскрыть тему, вам придется использовать связанные с ней ключевые слова. Употребляйте их естественно — в этом случае они будут присутствовать в тексте с нужной частотой, на оптимальном расстоянии друг от друга, в правильном порядке и окружении.
Поисковые системы используют и другие критерии оценки контента: читабельность, длину текста, использование визуальных элементов.
По данным Searchmetrics, существует корреляция между читабельностью текста и позицией сайта в выдаче. Специалисты компании использовали для определения читабельности формулу Флеша, в которой учитывается длина предложений и длина слов. Тексты с короткими предложениями и словами считаются более читабельными, чем тексты с длинными предложениями и словами.
По данным Searchmetrics, топ-30 выдачи Google формируют сайты, контент которых легко воспринимается подростками в возрасте от 13 до 15 лет по тесту Флеша. Это подтверждает, что Google в первую очередь предлагает пользователям понятный и легкий для восприятия контент.
Также существует корреляция между длиной контента и позицией сайта в выдаче. По сравнению с 2013 годом длина текстов, попавших в топ-30, выросла для всех позиций.
Изображения и видео делают тексты более привлекательными для пользователей. Это учитывает Google, отдавая сайтам, использующим медиаконтент, более высокие позиции.
Олдскульные сеошники оптимизировали страницы под запросы пользователя. Из-за этого на сайтах появлялись посадочные страницы для каждого значимого ключа. Например, сеошники на своих сайтах делали отдельные лэндинги для ключей «раскрутка сайта» и «продвижение сайта».
Сегодня необходимо оптимизировать поисковый опыт пользователя. Потенциальный посетитель ищет сайт, на котором глубоко раскрывается та или иная тема. Благодаря качественному контенту страница может занимать топ-позиции в выдаче по нескольким запросам, например, «раскрутка сайта» и «продвижение сайта». А качественным люди и поисковые системы считают контент, обладающий следующими характеристиками:
В погоне за качеством контента не стоит забывать о других факторах ранжирования: социальных сигналах, удовлетворенности пользователя, естественным обратным ссылкам, юзабилити и функциональности ресурса, соответствии сайта техническим требованиям поисковиков.
Прежде всего — хотелось бы сказать большое спасибо Дмитрию за его статьи, особенно за переводы с частичной адаптацией под Рунет. Хотелось бы, конечно, помимо адаптаций, — видеть больше критики «западного SEO». Полагаю, в данном случае, — мой комментарий органично дополнит материал Дмитрия, ведь замечания будут относится не к нему, а к авторам «исследования».
Приведённая в статье интерпретация проведённого исследования — классический пример, когда отдельные SEO-специалисты, и даже SEO-гуру, — чрезмерно увлекаются самим процессом, углубляются в теорию и забывают о практике. Именно в таких случаях и появляются смехотворные выводы. На их базе формируется набор вечных истин, которые преподносятся как нечто совершенно новое, некий прорыв, таковым в реальности не являющийся.
Использование медиаконтента, подробная информация экспертного уровня, читабельные тексты ВСЕГДА нравились пользователям и поисковым системам. Потом из этого выросло «новое» понятие контент-маркетинга и его стали активно продавать, как спасение от всех бед, принесённых переоптимизированными сайтами.
Текст, который понимают подростки, — это не всегда хорошо. Текст должен соответствовать целевой аудитории, с ней нужно говорить на её же языке. И если в случае с инвестициями в бинарные опционы и тяжёлую промышленность — язык подростка ещё уместен, то с действительно научными статьями — ситуация совсем другая. Сколько подростковых фраз вы не вставите в такую статью, при наличии достойных конкурентов по запросу — ваши позиции будут хуже.
Остальные случаи манипулирования результатами исследования в статье — ещё более очевидны...
Ключевые слова в доменном имени или URL страницы почти никогда не могут стать причиной падения позиции ресурса в выдаче, несмотря на отрицательную корреляцию в 2014 году между позицией сайта в выдаче и наличием ключей в URL или доменном имени. Ключевое слово в домене или URL\’е в результатах выдачи продолжает выделяться жирным, а значит привлекает пользователя кликнуть, т.е. считается сигналом релевантности сайта.
Просто большинство сайтов, которые имели ключевые слова в доменном имени или URL, были переоптимизированы и получили наказание от Google. Но это наказание было далеко не за ключевики в URL\’ах, а за ссылки, переспам текста и т.п. Наказание за ключевик в домене / URL — возможно лишь в тех случаях, когда это делается бездумно, только ради наличия самого ключевика. И уж точно нельзя говорить о том, что вы никогда не попадёте в топ из-за случайно оказавшегося ключевика в имени домена.
Тоже самое и про негативное влияние на позиции в выдаче — наличия ключей в H1. При использовании H1 по назначению — для указания заголовка страницы 1-го уровня, без чрезмерного насыщения ключевиками — сам факт наличия H1 не может влиять отрицательно.
Получается, что при интерпретации данных исследования, его авторы просто подвели желаемое под действительное (с какой целью — не ясно), забыв про причинно-следственную связь. Изменения на сайтах влияют на то, кто будет в топ10, но есть и обратная связь — изменения алгоритмов меняют состав выдачи и в ней просто исчезают сайты с давно известными нами факторами ранжирования. Пройдёт время — и, при отсутствии массовой истерии, всё встанет на свои места — сайты с H1 снова будут в ТОПах, а их домены будут содержать ключевики. Изменится одно — качественный контент, соответствующий не только запросам вашей аудитории, но и самой аудитории, её «языку» — мы будем воспринимать также, как и все остальные факторы.
Проведите конкурс среди участников CMS Magazine
Узнайте цены и сроки уже завтра. Это бесплатно и займет ≈5 минут.
Руководитель отдела продвижения в Russian IT group
Исследование Searchmetrics в целом не показало ничего кардинально нового по сравнению с 2013 г. Тренд на качественный контент и поведенческие факторы сохраняется, как и на отход поисковых машин от технических факторов ранжирования.
Однако два вывода, мягко говоря, сомнительны: