
ЧТО ТАКОЕ CANONICAL – КОГДА И КАК ЕГО ИСПОЛЬЗОВАТЬ?
Дублирующиеся и почти повторяющиеся страницы часто имеют проблемы с индексацией и показывают плохие результаты поиска, но, к счастью, атрибут rel=”canonical” может предотвратить это. Правильное использование каноников — одна из самых основных и простых операций по технической оптимизации сайта. Однако будьте осторожны: неправильное использование этого атрибута не решит ваши проблемы с ранжированием, а может даже усугубить их.
В этой статье наша команда расскажет вам все о каноническом теге: что это такое, когда вам (не) нужно его использовать и почему он может повысить посещаемость вашего сайта.
Что такое rel canonical и для чего он нужен?
Canonical — это атрибут, указывающий на наиболее приоритетную страницу среди дубликатов для поисковых систем. Он используется, когда страницы веб-сайта имеют дублированный или похожий контент и, как следствие, мешают ранжированию друг друга. Тег canonical позволяет указать, какая страница среди дубликатов должна быть проиндексирована для оценки вашего контента и его качества.
Если у вас есть одна страница, доступная по нескольким URL-адресам, или разные страницы с похожим содержанием (например, страница с мобильной и настольной версиями), Google рассматривает их как повторяющиеся версии одной и той же страницы. Google выберет один URL-адрес в качестве канонической версии и просканирует его, а все остальные URL-адреса будут считаться повторяющимися URL-адресами и сканироваться реже.
Документация для разработчиков Google
Обычно Google учитывает канонический URL-адрес, указанный вами в качестве основного, но не всегда. Важно отметить, что для поиска Google тег canonical является не директивой, а лишь подсказкой. Следовательно, когда вам нужно определить наиболее релевантную страницу для более высокого рейтинга, помните, что данные об установленном вами URL учитываются наряду с другими сигналами.

Если вы не укажете, какие URL будут основными среди дубликатов, ждите двух сценариев: 1) поисковая система выберет его сама, опираясь на другие сигналы; 2) поисковая система увидит все похожие страницы как дубликаты. В обоих случаях негативное влияние на ранжирование почти неизбежно, поэтому мы рекомендуем вам не рассчитывать на Google и настроить главную страницу самостоятельно.
Основные правила указания каноничности
Определить потенциальный канонический URL довольно просто. Тем не менее, есть правила, которым вы должны следовать, чтобы заставить его работать правильно:
- Укажите абсолютные URL-адреса, а не относительные.
- Выберите версию HTTPS, если вы перешли на SSL.
- Убедитесь, что регистр букв URL-адреса, указанного в атрибуте, совпадает с регистром абсолютного URL-адреса.
- Не указывайте несколько разных URL-адресов в качестве канонических для одной и той же страницы.
- Убедитесь, что каноническую страницу можно отсканировать и проиндексировать.
- Добавляйте только одну каноническую ссылку в разделе <head> на страницу.
Как указать канонический адрес
Существуют различные способы указать канонический адрес. В справке Google можно найти 5 основных вариантов канонизации:
- тег rel=canonical в атрибуте <link>;
- rel=canonical HTTP-заголовок;
- файл карты сайта;
- 301 редирект;
- AMP-версия сайта.
Тег rel=canonical в атрибуте <link>
Чтобы предотвратить проблемы с дублированием контента, вы можете использовать тег ссылки rel=canonical. Каноническая ссылка — самый простой и известный способ указать канонический адрес страницы. В данном конкретном случае это фрагмент HTML-кода. Вы должны просто добавить тег <link> к <head> копии страницы и указать версию главной страницы, чтобы выделить канонический URL.
Пример кода:
<link rel="canonical" href="https://example.com/" />
Синтаксис прост и ясен:
- link rel=”canonical” указывает, что эта страница имеет каноническую версию.
- href=”https://example.com/” показывает адрес сайта, по которому можно найти каноническую версию сайта.
Плюсы этого метода:
- Вы можете отметить любое количество страниц.
- Легко писать даже с базовыми знаниями HTML.
- Многие популярные оптимизированные для SEO CMS имеют либо специальные поля для канонических страниц, либо специальные плагины, такие как Yoast SEO для WordPress.
Минусы этого метода:
- Увеличивает размер кода страницы.
- Листинг на крупных сайтах может занять некоторое время.
- Подходит только для документов HTML.
HTTP-заголовок rel=canonical
Эта опция постоянно используется для документов, в которых нельзя указать ссылку rel=”canonical”, например, для документов типа PDF, так как в них нет секции <head>. Однако этот метод маркировки канонических страниц подходит и для обычных HTML-документов.
Чтобы установить rel=canonical, нужно открыть файл .htaccess и прописать в шапке команду Link. Здесь вы можете увидеть, как это будет выглядеть:
Link: <https://www.example.com/>; rel="canonical"
Плюсы этого метода:
- Вы можете отметить любое количество страниц.
- Подходит для всех документов, поддерживаемых поиском Google.
- Не увеличивает размер страницы.
- Вы можете создать правило автоматизации для канонических тегов (но только если на сайте есть четкая структура URL-адресов).
Минусы этого метода:
- Может потребоваться доступ к настройкам сервера.
- В настоящее время Google поддерживает его только для веб-поиска.
- Листинг на крупных сайтах может занять некоторое время.
Файл карты сайта
Карта сайта — это файл, в котором вы можете предоставить ценную информацию о содержании вашей страницы для повышения эффективности сканирования веб-сайта. Google считает страницы, включенные в файл sitemap.xml, каноническими, поэтому вам нужно добавить в файл каждую каноническую страницу. Если пропустить этот момент, Google сам поставит каноническую версию, что может плохо закончиться.
Если вам интересна эта тема, мы написали полную статью о правильной настройке файлов — Best Sitemap XML Optimization Practices for SEO and Google.
Плюсы этого метода:
- Простая настройка и обновление.
- Идеально подходит для больших сайтов.
- Размер страницы остается прежним.
Минусы этого метода:
- Нет никакой гарантии, что URL-адреса, указанные в файле Sitemap, во всех случаях будут считаться каноническими.
- Менее важен для робота Googlebot, чем атрибут rel=canonical.
- Роботы Google по-прежнему должны определять дубликат страницы для каждой канонической, которую вы указали в файле Sitemap.
301 редирект
Если вы хотите указать каноническую страницу и удалить дубликаты на какое-то время, этот способ подойдет вам лучше всего. С перенаправлением 301 довольно легко показать боту, что URL-адрес, на который отправляется перенаправление, более важен и актуален.
301 редирект означает, что страница находится по другому адресу (адресу редиректа). Чтобы настроить его, вам нужно зайти на веб-хостинг, выбрать каноническую версию и перенаправить другие версии на эту.
Плюсы этого метода:
- Позволяет избавиться от устаревших и неактуальных копий.
Минусы этого метода:
- Не позволяет сохранять дубликаты страниц для будущей индексации.
- Запрашивает доступ к настройкам сервера.
Практика канонического использования
Несмотря на то, что канонический используется, чтобы избежать похожего или дублированного контента в результатах поиска, есть еще несколько случаев, когда указание канонической страницы важно для вашего сайта. В следующих главах мы расскажем вам об этом подробнее, описав дополнительные бонусы, которые вы можете получить от использования канонических тегов.
Как правило хороших цифровых манер
Сегодня использование канонического атрибута стало частью интернет-этикета. Даже если у вас небольшой сайт с маловероятным дублированием, мы рекомендуем указать каноническую страницу, чтобы предотвратить возможные проблемы.
В этом случае вам необходимо добавить самоссылающиеся канонические версии для всех версий главной страницы. Как только это будет сделано, страницы с дополнительными параметрами будут защищены от индексации и отвлечения трафика от канонического.
Параметры отображения и сортировки
Традиционный способ использования канонического — указать главную страницу с помощью параметров сортировки или отображения, которые приводят к дополнительным параметрам GET и другим изменениям URL. Часто можно встретить на сайтах интернет-магазинов и агрегаторов; например, посмотрите, как это работает на etsy.com.
На странице Мужские рубашки и футболки мы видим множество фильтров и вариантов сортировки: по цене, популярности, отзывам и так далее.

Благодаря этим опциям вы можете добавить GET-идентификатор к URL-адресу.
Например, если мы выберем сортировку по самой низкой цене, мы получим следующий URL-адрес:
https://www.etsy.com/c/clothing/mens-clothing/shirts-and-tees?explicit=1&category_landing_page=1&order=price_asc
Эти URL-адреса могут всплывать до бесконечности, в зависимости от параметров сортировки и фильтрации. Хотя они будут отображать ту же информацию (список товаров), что и на главной странице, поисковая система не увидит между ними разницы.
Если все эти страницы будут проиндексированы и появятся в поиске, мы получим жесткую внутреннюю конкуренцию за ранжирование. Вот почему нам нужен тег canonical. Если такие страницы важны для пользователей, но бесполезны для продвижения, нужно указать главную как каноническую.
Говоря техническими словами, вы должны написать
<link rel="canonical" href="https://www.etsy.com/c/clothing/mens-clothing/shirts-and-tees" />
в <head> страницы сортировки. Это значит, что на странице указана основная версия документа, которая должна быть в поиске без GET-параметров.
Неоптимизированные страницы фильтров
Этот случай похож на предыдущий, но здесь у вас больше простора для маневра. Видите ли, если конкретный запрос соответствует фильтру, страницу можно оптимизировать и продвигать отдельно. Тогда ставить каноническую на основную не надо.
Однако бывают ситуации, когда вы не можете оптимизировать страницу фильтрации ни для одного из кластеров, особенно если эта страница формируется с использованием нескольких фильтров одновременно.
UTM и параметры отслеживания
Для сбора определенной информации, такой как отслеживание источников переходов, вы можете добавить к URL-адресу определенные параметры, например, если вы хотите отслеживать, сколько пользователей посетили ваш сайт из-за новостной рассылки или публикации в Facebook.
Вы можете проверить, есть ли URL-адреса с тегами, которые ведут на ваш сайт в Google Analytics.

Несмотря на то, что UTM и параметры отслеживания используются для сбора определенной информации, эти URL-адреса имеют дублированный контент. Поскольку вы не единственный, кто может создавать такие теги, использование канонической страницы с самоссылкой было бы отличным решением.
Распространенные ошибки канонизации
Канонизация имеет некоторые подводные камни, так что вам лучше не относиться к этому слишком легкомысленно. При небрежном отношении можно все испортить и ухудшить рейтинг сайта.
Давайте рассмотрим самые распространенные ошибки и как их избежать или исправить.
1. Использование тега canonical для страниц с разным содержанием
Некоторые веб-мастера ошибочно связывают канонические страницы с неидентичными, надеясь улучшить свои усилия по SEO. Однако это не работает, так как Google рекомендует использовать канонический, если у вас есть одна страница с разными адресами или несколько страниц с похожим содержанием.
Типичным примером является указание страницы продукта, которой нет в наличии, или страницы категории, проиндексированной как каноническая, и наоборот. Так как содержание таких страниц существенно отличается, поисковые системы могут просто игнорировать этот атрибут и отображать обе страницы в результатах поиска.
2. Блокировка неканонических адресов с помощью robots.txt
Блокировка страницы в файле robots.txt может предотвратить ее сканирование. Следовательно, бот не сможет распознать указанные канонические теги. Если вы хотите узнать больше о robots.txt, обязательно ознакомьтесь с другой нашей статьей, как только вы закончите с этой.
3. Блокировка неканонических URL-адресов с помощью тега noindex
Теги Canonical и noindex противоречат друг другу, поэтому, когда вы объединяете их оба в одном URL-адресе, Google обычно предпочитает rel=canonical. Если вам не нужно индексировать URL-адрес, используйте тег noindex и забудьте о rel=canonical. Но если вам не нужно индексировать страницу и при этом вы хотите указать каноническую, используйте только rel=canonical или 301 редирект.
4. Игнорирование кода ответа сервера 4xx для неканонических документов
Если неканонический документ вернет код 4xx, вы получите тот же результат, что и в предыдущем случае. Боты поисковых систем не распознают канонический тег для таких страниц, потому что код 4xx заблокирует их.
5. Указание первой страницы как канонической для всех последующих страниц пагинации
Поскольку первая страница и страницы пагинации имеют разный контент, не следует указывать только первую страницу как каноническую. Когда вы устанавливаете первую страницу как каноническую для всех страниц, Google может рассматривать их как дубликаты, удаляя весь их контент, включая внутренние ссылки. Вместо этого мы рекомендуем вам использовать самоссылающиеся канонические теги для страниц с нумерацией страниц.
6. Указание нескольких канонических тегов для одного документа
Использование нескольких тегов rel=canonical для одной и той же страницы является ошибкой, так как Google, вероятно, проигнорирует их все. Вы можете столкнуться с этой проблемой, если тег добавляется на страницу несколькими агентами либо путем добавления вручную, либо с помощью плагина, либо с помощью какой-либо настройки CMS. В таких случаях лучше перепроверить и убедиться, что ваш тег rel=canonical работает должным образом.
7. Указание rel=canonical в других разделах HTML (не в <head>)
Важным требованием для правильной работы rel=canonical является его включение в раздел <head> HTML-документа. Если атрибут добавлен в <body> или другой раздел страницы, он будет проигнорирован.
8. Игнорирование кода ответа сервера 4xx или 3xx для канонических документов
Код состояния HTTP 4xx или 3xx означает, что страница, которую вы хотите указать как каноническую, недоступна для поисковых систем и не будет отображаться на странице результатов поиска. Это может произойти, если страница, указанная как основная, работает некорректно и не может быть проиндексирована. В этом случае нужно заменить адрес страницы на правильный.
9. Добавление дубликатов страниц без указания каноничности
Это предупреждение появляется, если есть одна или несколько одинаковых или похожих страниц, но для них не указана каноническая версия. В этом случае Google самостоятельно определит главную страницу, отображая ее в результатах поиска. Естественно, она может отличаться от версии, которую вы хотите индексировать и продвигать.
Чтобы это исправить, следует проанализировать группы дубликатов и указать наиболее подходящую страницу как каноническую.
10. Указание неверного тега canonical для страниц с разными языковыми версиями
Укажите каноническую страницу при использовании тегов с атрибутом hreflang. Каноническая страница должна быть на том же языке, что и альтернативная, или, по крайней мере, на наиболее близком к ней языке.
11. Указание канонического URL, который также канонизируется для другой страницы.
Эта проблема возникает, когда на странице A есть каноническая страница B, а на странице B есть каноническая страница C. В результате возникает проблема «цепочки каноничности».

Из-за канонической цепочки поисковые системы могут неправильно интерпретировать теги или полностью их игнорировать. Поэтому при написании URL-адреса убедитесь, что страница, на которую вы указываете, не имеет канонического, указывающего на другую страницу.
12. Указание URL с другим протоколом
При указании канонической страницы ссылайтесь на протокол в основной версии сайта. Если он использует протокол HTTPS, вы также должны указать HTTPS в атрибуте href.
13. Прикрепление внутренних ссылок к каноническому URL
Внутренние входящие ссылки должны указывать на основную версию документа. Следовательно, вам необходимо свести к минимуму количество внутренних ссылок на канонизированные страницы, чтобы увеличить краулинговый бюджет. Но есть некоторые исключения, например, когда вы ссылаетесь на неканоническую, неосновную версию документа для улучшения UX или когда хотите показать товары сразу с помощью сортировки.
Заключение
Многие до сих пор думают, что канонический — это всего лишь рекомендация для поисковых систем, но он может стать эффективным инструментом управления индексацией сайта, и с ним можно справиться даже самостоятельно. Настройка канонического тега вам не по зубам — вам просто нужно определиться с лучшим вариантом для вашей цели и аккуратно воплотить его в жизнь.
Будьте уверены, что ваши усилия того стоят, так как канонические теги сильно влияют на успех вашего интернет-магазина. Правильное использование инструмента канонизации положительно влияет на ранжирование сайта, способствует продвижению сайта и минимизирует последствия копирования вашего контента сторонними сайтами. Это то, что нужно, чтобы вывести свой бизнес на новый уровень.