Война клонов: все об атрибуте rel=canonical

Маркетинг10 Контекстная реклама6 Создание сайтов5 Комплекс услуг7 SEO6 Дизайн2 Программирование4 SMM2 Использование сервиса4 Менеджмент Интернет-маркетинг Digital3 Брендинг2 Юзабилити Мобильная разработка4 Интранет Мониторинг

SEOСтатья

Поисковая оптимизацияСоветы

Специальный атрибут rel=canonical помогает поисковику устранить путаницу с дубликатами страниц. Рассмотрим типичные ошибки оптимизаторов и вебмастеров по использованию этого важного тега.

ПД

Питер Дж. Мейер (Peter J. Meyer)

15 октября 2014

Прошло более четырех лет (с февраля 2009) с тех пор, как Google и Yahoo объявили о поддержке атрибута rel=canonical, но эта строка HTML-кода по-прежнему приводит в замешательство многих оптимизаторов и веб-мастеров. Недавно компания Google опубликовала обзор 5 типичных ошибок при работе с атрибутом rel=canonical. Это содержательная и простая для понимания статья, но, к сожалению, в ней нет ответов на многие вопросы, которые каждый день появляются в нашем разделе Q&A. Поэтому я подумал, что пора разобраться с некоторыми часто задаваемыми вопросами (и, пожалуйста, простите за глупую шутку)....

Что такое rel=canonical?

Попросту говоря, тег rel=canonical — это способ сообщить Google об эквивалентности двух URL, в целях оптимизации поиска. Как правило, URL (B) является копией URL (A), и канонический тег указывает на (A) как на каноническую страницу. На странице с URL (B) в блоке <head></head> будет отображаться следующий код:

Справка Google о rel=canonical довольно подробно всё это описывает. Дублированный контент — весьма непростая тема, и ранее я подробно разбирал её. Сегодня я хочу продолжить обсуждение, предполагая, что мои читатели владеют практическими знаниями технического SEO и уже пробовали использовать атрибут rel=canonical на своем сайте.

Обратите внимание: тег rel=canonical часто называют «rel-canonical» или «каноническим тегом». В этой статье я постараюсь придерживаться написания «rel=canonical».

Надо ли использовать rel=сanonical для ряда пронумерованных страниц?

Я не собираюсь повторять справку Google, но этот вопрос задают так часто, что он заслуживает более развёрнутого ответа. Допустим, у вас есть ряд пронумерованных страниц с результатами поиска (1,2,3...n). С точки зрения информативности они могут показаться бедными, так должна ли страница n ссылаться на страницу 1 как на каноническую?

Официальный ответ — нет, Google не рекомендует этого делать. В компании рекомендуют указывать в качестве канонической страницу с полным перечнем (если на сайте есть такая страница, где отображены сразу все результаты) либо прописывать тег rel=prev/next. Rel=canonical можно использовать вместе с rel=prev/next для организации выборочного поиска, фильтров и т.д., но в последнем случае процедура заметно усложнится.

С точки зрения SEO разбивка на страницы — очень сложный вопрос. Рекомендую вам изучить следующие статьи:

«Как оформить пагинацию — Руководство по консолидации контента» («Conquering Pagination — A Guide to Consolidating your Content»)
«Всёсамоесвежееиполезноеопагинациии SEO» («The Latest & Greatest On SEO Pagination»)

Могу ли я делать связку rel=canonical между доменами?

Да, в конце 2009 Google объявил о поддержке кросс-доменной канонизации. Эта ситуация типична для партнёрских сайтов, когда разработчики стремятся избежать дублирования контента и хотят, чтобы только одна версия материала участвовала в ранжировании.

Стоит ли связывать тегом rel=canonical страницы на разных доменах?

Этот вопрос будет посложнее. Во-первых, Google может проигнорировать кросс-доменную канонизацию, если материал на страницах не будет совпадать, или в самом факте использования тега система усмотрит манипуляцию результатами поиска. Идеальные условия для связывания каноническим тегом разных доменов — это ситуация, при которой разные сайты одного владельца публикуют один и тот же контент, причём он оказывается полезен для посетителей всех ресурсов. В этом случае, вы, скорее всего, не захотите использовать 301-редирект (это может запутать пользователей и навредить отдельным брендам), но, вероятно, захотите избежать проблем с дублированием контента и самостоятельно решать, какой именно сайт попадёт в поисковую выдачу. Я бы не стал связывать тегом rel=canonical страницы на разных доменах только для того, чтобы консолидировать PageRank.

Больше не нужно искать и обзванивать каждое диджитал-агентство
Создайте конкурс на workspace.ru – получите предложения от участников CMS Magazine по цене и срокам. Это бесплатно и займет 5 минут. В каталоге 15 617 диджитал-агентств, готовых вам помочь – выберите и сэкономьте до 30%.
Создать конкурс →

Следует ли использовать rel=canonical для близких по содержанию страниц?

Как показал мой «катастрофический» эксперимент по канонизации и последующие опыты, в некоторых случаях Google одобряет использование атрибута rel=canonical для страниц с разным контентом. Но это не значит, что это хорошая идея. В целом, я считаю, что лучше приберечь rel=canonical для идентичных страниц или страниц с очень близким содержанием. Например, если продукт имеет несколько страниц, которые различаются лишь цветом, парой предложений и изображениями, я считаю, что использование rel=canonical для указания на родительскую страницу будет вполне уместно.

Не используйте rel=canonical там, где должны быть 301-редирект и/или 404 ошибка. Разумеется, ничего страшного не произойдёт, но я подозреваю, что Google проигнорирует канонические теги, и вы полностью потеряете контроль над тем, как индексируется ваш дублированный контент.

Могу ли я использовать rel=canonical на канонической странице?

Другими словами, можно ли добавлять на каноническую страницу тег rel=canonical, указывающий сам на себя? С практической точки зрения — да, но делать это вовсе необязательно. Ранее считалось, что и Google, и Bing не одобряют злоупотребление атрибутом. Однако, кажется, со временем их позиция стала менее жёсткой, и за последнее время я не помню ни одного случая, когда бы корректное использованние тега на самой канонической странице принесло сайту какой-либо вред.

Зачастую все проблемы сводятся к реализации решения — многие страницы имеют один и тот же шаблон, и необходимость вставлять код только на дочерние страницы, минуя родительскую, может стать причиной путаницы и ошибок. Я думаю, что поисковые системы осознали реалии, с которыми сталкивается большинство веб-мастеров, и откорректировали свою первоначальную «консервативную» позицию в соответствии с ними.

Можно ли использовать rel=canonical для всего сайта?

Следует ли добавлять тег rel=canonical на все страницы сайта — даже если многие из них не содержат дублированного контента? Думаю, это спорный вопрос. Специалисты Moz рекомендовали такой подход в прошлом, и я считаю его вполне безопасным. Но меня беспокоит, что злоупотребление тегом rel=canonical может вызвать недоверие или привести к игнорированию тега поисковыми системами, но я не могу привести никаких доказательств в защиту этой точки зрения. Кроме того, меня беспокоит тот факт, что зачастую атрибут rel=canonical используется неумело, и в масштабе целого сайта это приводит к тому, что канонический тег указывает не на те страницы.

Я убеждён, что присвоение атрибута rel=canonical по умолчанию домашней странице вполне оправдано, поскольку для домашних страниц характерно разнообразие URL-адресов. В идеале я бы рекомендовал прописать rel=canonical на домашних страницах, известных дубликатах и всех страницах, где вероятно появление дублированного контента, а все остальные оставить в покое. Однако реализовать это зачастую очень сложно. В некоторых случаях использование rel=canonical на всем сайте более оправдано; это лучше, чем полностью потерять контроль над индексацией ресурса.

Что мне использовать: rel=canonical или 301-редирект?

Вам надо понять, что, хотя эти подходы могут иметь сходное действие, с точки зрения SEO они не являются взаимозаменяемыми. Принципиальное отличие состоит в следующем: 301-редирект перенаправляет посетителя на канонический URL, а rel=canonical никого никуда не перенаправляет. Как правило, только одно решение может считаться правильным с точки зрения удобства для посетителей. Если вы хотите навсегда объединить две страницы и избавиться от дублированного контента — используйте 301-редирект. Если вы хотите, чтобы обе страницы были доступны для посетителей, но только одна из них была представлена в результатах поиска — используйте rel=canonical.

Передаётли rel=canonical PageRank ивессайта?

Это сложно измерить, но если вы правильно используете rel=canonical, и Google засчитывает его, то он работает так же, как 301-редирект. Мы предполагаем, что он передаёт PageRank и вес, полученные за ссылки на неканонические страницы с небольшими потерями (как и в случае c 301-редиректом).

Могу ли я связать несколько канонических страниц (вместе с 301, 302 и т.д.)?

Что происходит, если одна каноническая страница указывает на другую как на каноническую, или дочерняя страница указывает как на каноническую на страницу, с которой осуществляется 301-редирект? Ситуация непростая. В некоторых случаях такое решение может работать, и, возможно, будет даже передаваться Page Rank. Хотя, в целом, это плохая идея. В лучшем случае, это посчитают небрежностью. В худшем — решение не будет работать, или значительная часть Page Rank потеряется где-то внутри цепи. По возможности избегайте таких цепочек и применяйте rel=canonical в пределах одного шага.

Индексируются ли неканонические страницы?

Нет, и на то есть все причины. Если Google засчитывает тег rel=canonical, то неканоническая страница не ранжируется. У неё не будет уникальной кэшированной копии, и она не появится в результатах поиска. Сохраняет ли Google записи о неканонических URL-адресах? Допускаю, что да. Однако продвижение неканонических страниц в поисковых системах не имеет никакого смысла.

Может ли кто-то другой назначать мои страницы каноническими?

Мне приходилось сталкиваться с беспокойством по поводу того, что кто-то может использовать канонизацию, особенно кросс-доменную, чтобы навредить сайту или присвоить его вес. Помните, что вы можете принимать канонизацию только от тех страниц, которые контролируете. Вы, конечно, можете назначить для всех своих страниц страницу-родителя, принадлежащую другому человеку, но кому это нужно? Чтобы добиться каких-то реальных целей, злоумышленникам придётся взломать ваш сайт. Если это произойдёт, то теги rel=canonical — это последнее, о чём надо думать. Основной вред от использования rel=canonical связан с действиями самих веб-мастеров.

Могу ли я приготовить омлет, не разбив яиц?

Нет. Знаю, вы надеялись услышать другой ответ. Как минимум треть вопросов о rel=canonical сводится к следующему: «Я хочу, чтобы все мои страницы ранжировались, и да — они одинаковые, но я не хочу никаких проблем с дублированным контентом!» Я не знаю никаких секретных способов как этого добиться.

Вы не обязаны использовать rel=canonical, но, как показывает опыт, лучше самостоятельно решить все вопросы с дублированным контентом на своём сайте, иначе это сделает Google, а они это сделают, поверьте мне. Раньше это привело бы к тому, что забракованная страница просто выпала из результатов поиска. Теперь, после 25 обновлений Panda, в результате ошибки может пострадать весь сайт. Выберите что-то одно: либо избавьтесь от дублированного контента, либо оформите его правильно, либо переработайте его.

Статья переведена и опубликована с разрешения компании Moz. Компания Moz не является партнером данного сайта. Мнение автора данного материала может не совпадать с мнением компании Moz.

Оригинал: http://moz.com/blog/rel-confused-answers-to-your-rel-canonical-questions

Иллюстрация: http://bit.ly/1zeX3Ql

Игорь Голдобин
SEO-специалист в Uplab

В нашей компании в требованиях к разработке, а также в чек-листе для приходящих на продвижение сайтов есть требование о необходимости внедрения rel="canonical" на типовые дублирующие страницы (например, пагинации, где в качестве канонической стоит первая страница, или страницы фильтров и сортировки). Это очень удобный и логичный инструмент.

Указание канонической страницы разом решает несколько проблем.

Это исключает ошибки с индексацией контента на неканонических страницах (если сравнивать с вариантом, когда все страницы пагинации закрываются от индексации в robots.txt или через метатег). В этом случае, несмотря на индексацию неканонических страниц, робот без проблем переходит по ссылкам на неканонических страницах.
Правильное распределение относительных весов страниц сайта. Поисковые системы ранжируют только каноническую страницу, а веса неканонических страниц передаются канонической (подобно 301 редиректу).

Статья отличная. Хочется добавить, что rel="canonical" актуален и для Яндекса (правда, не всегда подходит для кроссдоменного использования, но при внутридоменном работает хорошо), что делает его универсальным и обязательным для использования на всех ваших сайтах.