#113 · Технические основы

URL с UTM-метками в обходе (создают дубли)

Что это, почему влияет на SEO, как проверить и исправить. Параметр #113из 150 в нашем чек-листе аудита.

4 мин чтенияТехнические основыПараметр #113

Что это

UTM-метки — параметры, которые добавляются к URL для отслеживания источников трафика: ?utm_source=google&utm_medium=cpc&utm_campaign=summer. С точки зрения браузера и аналитики — это разные URL для одной и той же страницы. Если поисковый робот обходит такие адреса и индексирует их, поисковая система видит множество копий одной страницы с разным содержимым URL, но идентичным контентом.

Почему это важно для SEO

Дубли страниц — одна из наиболее распространённых технических проблем. Когда Googlebot или Яндекс.Бот обходят URLs вида /product/?utm_source=vk&utm_medium=post и /product/?utm_source=email&utm_medium=newsletter, они тратят краулинговый бюджет на технически бесполезные страницы. У крупных интернет-магазинов с активными рекламными кампаниями количество таких URL легко превышает 10 000–50 000 штук — это реальные кейсы при работе с e-commerce сегментом.

Второй эффект — размывание ссылочного веса. Если внешние ссылки ведут на страницы с UTM-метками (такое бывает при шаринге в соцсетях или копировании URL из рассылки), ссылочный сигнал распределяется между несколькими вариантами URL вместо концентрации на каноническом адресе. В Google это напрямую влияет на PageRank, в Яндексе — на ИКС и авторитетность документа. Страница с размытым весом ранжируется слабее, чем могла бы.

Как проверить вручную

Screaming Frog: запустите краулер по сайту, в колонке Address отфильтруйте строки, содержащие utm_. Если такие URL присутствуют в выдаче краулера — робот их видит и потенциально обходит.

Google Search Console: откройте раздел Индексирование > Страницы, в строке поиска введите utm_. Если URL с метками попали в индекс или в очередь на индексирование — проблема подтверждена.

Яндекс.Вебмастер: раздел Индексирование > Страницы в поиске. Используйте фильтр по маске *utm_*. Наличие таких адресов означает, что робот уже добавил дубли в поиск.

site:-оператор: в поиске Яндекса или Google введите site:yoursite.ru utm_source — быстрый способ проверить, проиндексированы ли страницы с метками прямо сейчас.

Как исправить

Задача — запретить роботам обходить и индексировать URL с UTM-параметрами, не блокируя сами страницы.

Шаг 1. Canonical

На каждой странице прописывайте канонический URL без UTM-параметров:

<link rel="canonical" href="https://yoursite.ru/product/tovар/" />

Это базовая защита, но одного canonical недостаточно — роботы могут его игнорировать при массовом дублировании.

Шаг 2. Параметры в Google Search Console

Перейдите в Старый Search Console > Сканирование > Параметры URL. Укажите utm_source, utm_medium, utm_campaign, utm_content, utm_term как параметры, не влияющие на контент. Google будет игнорировать их при краулинге.

Шаг 3. robots.txt

Disallow: /*?utm_source=
Disallow: /*&utm_source=
Disallow: /*?utm_medium=
Disallow: /*?utm_campaign=

Для Яндекса этот способ работает надёжно. Для Google canonical + GSC-настройки предпочтительнее.

WordPress

Установите Yoast SEO или Rank Math — canonical генерируется автоматически. Дополнительно добавьте в functions.php:

// Редирект UTM-страниц не нужен — canonical достаточно
// Блокировка через robots.txt настраивается в настройках плагина

Tilda

Canonical прописывается в настройках страницы SEO > Canonical URL. Вручную укажите чистый URL без параметров. robots.txt редактируется в разделе Настройки сайта > SEO.

1C-Bitrix

В модуле SEO (Маркетинг > SEO) включите автоматический canonical. В файле /robots.txt добавьте Disallow-правила вручную или через административную панель.

Webflow

Canonical настраивается в Page Settings > SEO. robots.txt редактируется в Project Settings > SEO > robots.txt.

Типичные ошибки

Блокировать страницу целиком через robots.txt — закрываете доступ к контенту, а не к параметру. Используйте маску с параметром, а не с путём.
Полагаться только на canonical — Яндекс.Бот игнорирует canonical примерно в 15–20% случаев при явных дублях, особенно если на UTM-URL есть входящие ссылки.
Забыть про `utm_content` и `utm_term` — при настройке параметров в GSC или robots.txt часто вносят только utm_source и utm_medium, пропуская остальные три параметра.
Не проверять после запуска рекламы — каждая новая кампания потенциально генерирует новые комбинации UTM, которые могут попасть в обход.
Использовать UTM в внутренних ссылках — разработчики иногда копируют рекламные ссылки во внутреннюю перелинковку. Это мгновенно создаёт массовые дубли, которые Screaming Frog обнаружит как отдельные узлы графа.

Влияние на разные типы сайтов

Для интернет-магазинов с активными рекламными каналами (контекст, email, соцсети) проблема критична. Каталог из 5 000 товаров при 10 UTM-комбинациях теоретически порождает 50 000 дополнительных URL. Краулинговый бюджет расходуется на пустые страницы вместо новых товаров или обновлённых карточек — это прямой удар по скорости индексации.

Контентные сайты и SaaS страдают меньше по объёму, но сильнее по концентрации ссылочного веса. Статья, которую активно шарят в соцсетях с UTM-ссылками, может получать ссылки на десяток вариантов своего URL одновременно. Лендинги, как правило, имеют один-два URL и решают проблему быстро через robots.txt и canonical — здесь риск минимален при своевременной настройке.

Проверить этот параметр на вашем сайте

Бесплатно. Без регистрации. Проверим этот и ещё 49 параметров за 60 секунд.

Получить SEO-аудит →