Прошло более четырех лет (с февраля 2009) с тех пор, как Google и Yahoo объявили о поддержке атрибута rel=canonical, но эта строка HTML-кода по-прежнему приводит в замешательство многих оптимизаторов и веб-мастеров. Недавно компания Google опубликовала обзор 5 типичных ошибок при работе с атрибутом rel=canonical. Это содержательная и простая для понимания статья, но, к сожалению, в ней нет ответов на многие вопросы, которые каждый день появляются в нашем разделе Q&A. Поэтому я подумал, что пора разобраться с некоторыми часто задаваемыми вопросами (и, пожалуйста, простите за глупую шутку)....
Попросту говоря, тег rel=canonical — это способ сообщить Google об эквивалентности двух URL, в целях оптимизации поиска. Как правило, URL (B) является копией URL (A), и канонический тег указывает на (A) как на каноническую страницу. На странице с URL (B) в блоке <head></head> будет отображаться следующий код:
Справка Google о rel=canonical довольно подробно всё это описывает. Дублированный контент — весьма непростая тема, и ранее я подробно разбирал её. Сегодня я хочу продолжить обсуждение, предполагая, что мои читатели владеют практическими знаниями технического SEO и уже пробовали использовать атрибут rel=canonical на своем сайте.
Обратите внимание: тег rel=canonical часто называют «rel-canonical» или «каноническим тегом». В этой статье я постараюсь придерживаться написания «rel=canonical».
Я не собираюсь повторять справку Google, но этот вопрос задают так часто, что он заслуживает более развёрнутого ответа. Допустим, у вас есть ряд пронумерованных страниц с результатами поиска (1,2,3...n). С точки зрения информативности они могут показаться бедными, так должна ли страница n ссылаться на страницу 1 как на каноническую?
Официальный ответ — нет, Google не рекомендует этого делать. В компании рекомендуют указывать в качестве канонической страницу с полным перечнем (если на сайте есть такая страница, где отображены сразу все результаты) либо прописывать тег rel=prev/next. Rel=canonical можно использовать вместе с rel=prev/next для организации выборочного поиска, фильтров и т.д., но в последнем случае процедура заметно усложнится.
С точки зрения SEO разбивка на страницы — очень сложный вопрос. Рекомендую вам изучить следующие статьи:
Да, в конце 2009 Google объявил о поддержке кросс-доменной канонизации. Эта ситуация типична для партнёрских сайтов, когда разработчики стремятся избежать дублирования контента и хотят, чтобы только одна версия материала участвовала в ранжировании.
Этот вопрос будет посложнее. Во-первых, Google может проигнорировать кросс-доменную канонизацию, если материал на страницах не будет совпадать, или в самом факте использования тега система усмотрит манипуляцию результатами поиска. Идеальные условия для связывания каноническим тегом разных доменов — это ситуация, при которой разные сайты одного владельца публикуют один и тот же контент, причём он оказывается полезен для посетителей всех ресурсов. В этом случае, вы, скорее всего, не захотите использовать
Как показал мой «катастрофический» эксперимент по канонизации и последующие опыты, в некоторых случаях Google одобряет использование атрибута rel=canonical для страниц с разным контентом. Но это не значит, что это хорошая идея. В целом, я считаю, что лучше приберечь rel=canonical для идентичных страниц или страниц с очень близким содержанием. Например, если продукт имеет несколько страниц, которые различаются лишь цветом, парой предложений и изображениями, я считаю, что использование rel=canonical для указания на родительскую страницу будет вполне уместно.
Не используйте rel=canonical там, где должны быть
Другими словами, можно ли добавлять на каноническую страницу тег rel=canonical, указывающий сам на себя? С практической точки зрения — да, но делать это вовсе необязательно. Ранее считалось, что и Google, и Bing не одобряют злоупотребление атрибутом. Однако, кажется, со временем их позиция стала менее жёсткой, и за последнее время я не помню ни одного случая, когда бы корректное использованние тега на самой канонической странице принесло сайту какой-либо вред.
Зачастую все проблемы сводятся к реализации решения — многие страницы имеют один и тот же шаблон, и необходимость вставлять код только на дочерние страницы, минуя родительскую, может стать причиной путаницы и ошибок. Я думаю, что поисковые системы осознали реалии, с которыми сталкивается большинство веб-мастеров, и откорректировали свою первоначальную «консервативную» позицию в соответствии с ними.
Следует ли добавлять тег rel=canonical на все страницы сайта — даже если многие из них не содержат дублированного контента? Думаю, это спорный вопрос. Специалисты Moz рекомендовали такой подход в прошлом, и я считаю его вполне безопасным. Но меня беспокоит, что злоупотребление тегом rel=canonical может вызвать недоверие или привести к игнорированию тега поисковыми системами, но я не могу привести никаких доказательств в защиту этой точки зрения. Кроме того, меня беспокоит тот факт, что зачастую атрибут rel=canonical используется неумело, и в масштабе целого сайта это приводит к тому, что канонический тег указывает не на те страницы.
Я убеждён, что присвоение атрибута rel=canonical по умолчанию домашней странице вполне оправдано, поскольку для домашних страниц характерно разнообразие URL-адресов. В идеале я бы рекомендовал прописать rel=canonical на домашних страницах, известных дубликатах и всех страницах, где вероятно появление дублированного контента, а все остальные оставить в покое. Однако реализовать это зачастую очень сложно. В некоторых случаях использование rel=canonical на всем сайте более оправдано; это лучше, чем полностью потерять контроль над индексацией ресурса.
Вам надо понять, что, хотя эти подходы могут иметь сходное действие, с точки зрения SEO они не являются взаимозаменяемыми. Принципиальное отличие состоит в следующем:
Это сложно измерить, но если вы правильно используете rel=canonical, и Google засчитывает его, то он работает так же, как
Что происходит, если одна каноническая страница указывает на другую как на каноническую, или дочерняя страница указывает как на каноническую на страницу, с которой осуществляется
Нет, и на то есть все причины. Если Google засчитывает тег rel=canonical, то неканоническая страница не ранжируется. У неё не будет уникальной кэшированной копии, и она не появится в результатах поиска. Сохраняет ли Google записи о неканонических URL-адресах? Допускаю, что да. Однако продвижение неканонических страниц в поисковых системах не имеет никакого смысла.
Мне приходилось сталкиваться с беспокойством по поводу того, что кто-то может использовать канонизацию, особенно кросс-доменную, чтобы навредить сайту или присвоить его вес. Помните, что вы можете принимать канонизацию только от тех страниц, которые контролируете. Вы, конечно, можете назначить для всех своих страниц страницу-родителя, принадлежащую другому человеку, но кому это нужно? Чтобы добиться каких-то реальных целей, злоумышленникам придётся взломать ваш сайт. Если это произойдёт, то теги rel=canonical — это последнее, о чём надо думать. Основной вред от использования rel=canonical связан с действиями самих веб-мастеров.
Нет. Знаю, вы надеялись услышать другой ответ. Как минимум треть вопросов о rel=canonical сводится к следующему: «Я хочу, чтобы все мои страницы ранжировались, и да — они одинаковые, но я не хочу никаких проблем с дублированным контентом!» Я не знаю никаких секретных способов как этого добиться.
Вы не обязаны использовать rel=canonical, но, как показывает опыт, лучше самостоятельно решить все вопросы с дублированным контентом на своём сайте, иначе это сделает Google, а они это сделают, поверьте мне. Раньше это привело бы к тому, что забракованная страница просто выпала из результатов поиска. Теперь, после 25 обновлений Panda, в результате ошибки может пострадать весь сайт. Выберите что-то одно: либо избавьтесь от дублированного контента, либо оформите его правильно, либо переработайте его.
Статья переведена и опубликована с разрешения компании Moz. Компания Moz не является партнером данного сайта. Мнение автора данного материала может не совпадать с мнением компании Moz.
Оригинал: http://moz.com/blog/rel-confused-answers-to-your-rel-canonical-questions
Иллюстрация: http://bit.ly/1zeX3Ql
Проведите конкурс среди участников CMS Magazine
Узнайте цены и сроки уже завтра. Это бесплатно и займет ≈5 минут.
SEO-специалист в Uplab
В нашей компании в требованиях к разработке, а также в чек-листе для приходящих на продвижение сайтов есть требование о необходимости внедрения rel="canonical" на типовые дублирующие страницы (например, пагинации, где в качестве канонической стоит первая страница, или страницы фильтров и сортировки). Это очень удобный и логичный инструмент.
Указание канонической страницы разом решает несколько проблем.
Это исключает ошибки с индексацией контента на неканонических страницах (если сравнивать с вариантом, когда все страницы пагинации закрываются от индексации в robots.txt или через метатег). В этом случае, несмотря на индексацию неканонических страниц, робот без проблем переходит по ссылкам на неканонических страницах.
Правильное распределение относительных весов страниц сайта. Поисковые системы ранжируют только каноническую страницу, а веса неканонических страниц передаются канонической (подобно 301 редиректу).
Статья отличная. Хочется добавить, что rel="canonical" актуален и для Яндекса (правда, не всегда подходит для кроссдоменного использования, но при внутридоменном работает хорошо), что делает его универсальным и обязательным для использования на всех ваших сайтах.