Что это
UTM-метки — параметры, которые добавляются к URL для отслеживания источников трафика: ?utm_source=google&utm_medium=cpc&utm_campaign=summer. С точки зрения браузера и аналитики — это разные URL для одной и той же страницы. Если поисковый робот обходит такие адреса и индексирует их, поисковая система видит множество копий одной страницы с разным содержимым URL, но идентичным контентом.
Почему это важно для SEO
Дубли страниц — одна из наиболее распространённых технических проблем. Когда Googlebot или Яндекс.Бот обходят URLs вида /product/?utm_source=vk&utm_medium=post и /product/?utm_source=email&utm_medium=newsletter, они тратят краулинговый бюджет на технически бесполезные страницы. У крупных интернет-магазинов с активными рекламными кампаниями количество таких URL легко превышает 10 000–50 000 штук — это реальные кейсы при работе с e-commerce сегментом.
Второй эффект — размывание ссылочного веса. Если внешние ссылки ведут на страницы с UTM-метками (такое бывает при шаринге в соцсетях или копировании URL из рассылки), ссылочный сигнал распределяется между несколькими вариантами URL вместо концентрации на каноническом адресе. В Google это напрямую влияет на PageRank, в Яндексе — на ИКС и авторитетность документа. Страница с размытым весом ранжируется слабее, чем могла бы.
Как проверить вручную
- Screaming Frog: запустите краулер по сайту, в колонке
Addressотфильтруйте строки, содержащиеutm_. Если такие URL присутствуют в выдаче краулера — робот их видит и потенциально обходит.
- Google Search Console: откройте раздел
Индексирование > Страницы, в строке поиска введитеutm_. Если URL с метками попали в индекс или в очередь на индексирование — проблема подтверждена.
- Яндекс.Вебмастер: раздел
Индексирование > Страницы в поиске. Используйте фильтр по маске*utm_*. Наличие таких адресов означает, что робот уже добавил дубли в поиск.
- site:-оператор: в поиске Яндекса или Google введите
site:yoursite.ru utm_source— быстрый способ проверить, проиндексированы ли страницы с метками прямо сейчас.
Как исправить
Задача — запретить роботам обходить и индексировать URL с UTM-параметрами, не блокируя сами страницы.
Шаг 1. Canonical
На каждой странице прописывайте канонический URL без UTM-параметров:
<link rel="canonical" href="https://yoursite.ru/product/tovар/" />Это базовая защита, но одного canonical недостаточно — роботы могут его игнорировать при массовом дублировании.
Шаг 2. Параметры в Google Search Console
Перейдите в Старый Search Console > Сканирование > Параметры URL. Укажите utm_source, utm_medium, utm_campaign, utm_content, utm_term как параметры, не влияющие на контент. Google будет игнорировать их при краулинге.
Шаг 3. robots.txt
Disallow: /*?utm_source=
Disallow: /*&utm_source=
Disallow: /*?utm_medium=
Disallow: /*?utm_campaign=Для Яндекса этот способ работает надёжно. Для Google canonical + GSC-настройки предпочтительнее.
WordPress
Установите Yoast SEO или Rank Math — canonical генерируется автоматически. Дополнительно добавьте в functions.php:
// Редирект UTM-страниц не нужен — canonical достаточно
// Блокировка через robots.txt настраивается в настройках плагинаTilda
Canonical прописывается в настройках страницы SEO > Canonical URL. Вручную укажите чистый URL без параметров. robots.txt редактируется в разделе Настройки сайта > SEO.
1C-Bitrix
В модуле SEO (Маркетинг > SEO) включите автоматический canonical. В файле /robots.txt добавьте Disallow-правила вручную или через административную панель.
Webflow
Canonical настраивается в Page Settings > SEO. robots.txt редактируется в Project Settings > SEO > robots.txt.
Типичные ошибки
- Блокировать страницу целиком через robots.txt — закрываете доступ к контенту, а не к параметру. Используйте маску с параметром, а не с путём.
- Полагаться только на canonical — Яндекс.Бот игнорирует canonical примерно в 15–20% случаев при явных дублях, особенно если на UTM-URL есть входящие ссылки.
- Забыть про `utm_content` и `utm_term` — при настройке параметров в GSC или robots.txt часто вносят только
utm_sourceиutm_medium, пропуская остальные три параметра. - Не проверять после запуска рекламы — каждая новая кампания потенциально генерирует новые комбинации UTM, которые могут попасть в обход.
- Использовать UTM в внутренних ссылках — разработчики иногда копируют рекламные ссылки во внутреннюю перелинковку. Это мгновенно создаёт массовые дубли, которые Screaming Frog обнаружит как отдельные узлы графа.
Влияние на разные типы сайтов
Для интернет-магазинов с активными рекламными каналами (контекст, email, соцсети) проблема критична. Каталог из 5 000 товаров при 10 UTM-комбинациях теоретически порождает 50 000 дополнительных URL. Краулинговый бюджет расходуется на пустые страницы вместо новых товаров или обновлённых карточек — это прямой удар по скорости индексации.
Контентные сайты и SaaS страдают меньше по объёму, но сильнее по концентрации ссылочного веса. Статья, которую активно шарят в соцсетях с UTM-ссылками, может получать ссылки на десяток вариантов своего URL одновременно. Лендинги, как правило, имеют один-два URL и решают проблему быстро через robots.txt и canonical — здесь риск минимален при своевременной настройке.