Чистка и кластеризация семантики

Здравствуйте! Мы переходим к третьему уроку третьей главы, и сегодня наша задача – навести порядок в том объеме запросов, который мы собрали.

🎯 Тема урока

Чистка и кластеризация семантики

Это очень важный этап, потому что именно здесь мы определяем, сколько страниц нам нужно создать и какой контент должен быть на каждой из них.


1. Чистка и удаление мусорных запросов

После сбора семантики (даже если вы использовали качественные инструменты и фильтры) в ядре остается много «мусора» или нерелевантных запросов.

А. Зачем нужна предварительная чистка?

  1. Экономия бюджета.
    Кластеризация большого объема запросов (например, 50 000 строк) стоит денег. Предварительно удалив мусор, вы снижаете стоимость кластеризации.

  2. Повышение качества кластеризации.
    Чем чище исходное ядро, тем точнее будет группировка запросов.

Б. Методы чистки

Мусорный контент — это, например, запросы, которые касаются порно, «черной медицины» (сиалис, виагра, ксанакс) или просто не подходят вашей тематике.

  1. Стоп-слова (Стоп-лист).
    Используйте инструменты для работы с семантикой (например, SEO Excel) для составления списков стоп-слов, которые необходимо удалить.
    Стоп-слова — это паттерны, определяющие непригодность запроса для вашей тематики.

  2. Частотный словарь.
    Используется для составления списка лемм (униграмм) на основе всего столбца запросов.
    Вы выбираете нерелевантные слова и помечаете их, а затем удаляете все запросы, содержащие эти слова.

Совет преподавателя:
Вы не сможете удалить весь мусор вручную — и это нормально.
Оставшийся мусор обычно сам сгруппируется при кластеризации в отдельные кластеры, которые потом можно удалить.

2. Кластеризация семантики

Кластеризация — это группировка поисковых запросов, имеющих одинаковый интент и продвигаемых на одной странице.
Выполняется по методу подбора топов (TOP-based method).

А. Принцип работы (Метод подбора топов)

  1. Берутся два запроса (например, «Рабочая одежда» и «Спецодежда»).
  2. Анализируется поисковая выдача (ТОП-10 или ТОП-20) для каждого.
  3. Если запросы имеют достаточное количество совпадающих страниц (3–5), они считаются синонимами и объединяются в один кластер.

Б. Типы кластеризации

В Бурж-SEO используется в основном Soft Clustering (Софт-кластеризация).

  • Soft Clustering (Софт):
    Запрос может находиться в нескольких кластерах, если пересекается по совпадениям в ТОПе.

    • Порог (Точность): выбирается число совпадений страниц в ТОПе (обычно 3 или 4).
    • Важно:
      • Слишком высокий порог (5) — кластеры распадутся, страниц станет слишком много.
      • Слишком низкий порог (2) — получите огромные кластеры с разными интентами.
  • Hard Clustering (Хард):
    В Бурж-SEO практически не используется, особенно для информационных и обзорных сайтов.

В. Обработка результатов кластеризации (Проверка руками)

Нельзя слепо доверять автоматическим алгоритмам.
Результаты нужно проверять вручную и корректировать типичные ошибки.

Типовые ошибки:

  1. Склейка разных интентов.
    Коммерческие и информационные запросы объединены в один кластер.

    Нельзя продвигать разные интенты на одной странице. Нужно разделять их.

  2. Каннибализация.
    Несколько статей по одной теме без дополнительной ценности.

    Объедините в одну статью и настройте редирект.

    Silo-структура помогает избежать каннибализации.

  3. Распадение одинаковых запросов.
    Синонимы оказались в разных кластерах — их нужно соединить.

  4. Полезные запросы в «мусоре».
    Иногда хорошие ключи попадают в некластеризованные группы — верните их вручную.

3. Распределение по страницам (AIDA)

После кластеризации каждый кластер = одна потенциальная страница.
Далее распределяем их в структуре сайта и контент-плане (по модели AIDA).

  • Attention (Внимание) и Interest (Интерес):
    Статьи типа «что это» или «как сделать».
    Приносят основной трафик.

  • Desire (Желание) и Action (Действие):
    Конверсионные запросы (покупка, регистрация), приносят меньше трафика, но больше прибыли.

4. Определение потенциального трафика

На этом этапе оцениваем, какой трафик принесет каждый кластер, чтобы расставить приоритеты.

  1. Определите максимально возможную позицию в ТОПе для каждого ключа.
  2. Умножьте частотность на предполагаемый CTR для этой позиции.
  3. Суммируйте, чтобы оценить месячный и годовой трафик.
  4. При необходимости сделайте оценку по каждому разделу сайта.

Таким образом, на выходе вы получаете структурированное семантическое ядро, готовое к использованию для создания ТЗ копирайтерам и построения вашей Silo-структуры.


🧭 Что дальше?

В следующем уроке мы начнем практическое применение семантики — создание контент-планов и написание SEO-текстов, основанных на ваших кластерах.