Чистка и кластеризация семантики
Здравствуйте! Мы переходим к третьему уроку третьей главы, и сегодня наша задача – навести порядок в том объеме запросов, который мы собрали.
🎯 Тема урока
Чистка и кластеризация семантики
Это очень важный этап, потому что именно здесь мы определяем, сколько страниц нам нужно создать и какой контент должен быть на каждой из них.
1. Чистка и удаление мусорных запросов
После сбора семантики (даже если вы использовали качественные инструменты и фильтры) в ядре остается много «мусора» или нерелевантных запросов.
А. Зачем нужна предварительная чистка?
- Экономия бюджета. 
 Кластеризация большого объема запросов (например, 50 000 строк) стоит денег. Предварительно удалив мусор, вы снижаете стоимость кластеризации.
- Повышение качества кластеризации. 
 Чем чище исходное ядро, тем точнее будет группировка запросов.
Б. Методы чистки
Мусорный контент — это, например, запросы, которые касаются порно, «черной медицины» (сиалис, виагра, ксанакс) или просто не подходят вашей тематике.
- Стоп-слова (Стоп-лист). 
 Используйте инструменты для работы с семантикой (например, SEO Excel) для составления списков стоп-слов, которые необходимо удалить.
 Стоп-слова — это паттерны, определяющие непригодность запроса для вашей тематики.
- Частотный словарь. 
 Используется для составления списка лемм (униграмм) на основе всего столбца запросов.
 Вы выбираете нерелевантные слова и помечаете их, а затем удаляете все запросы, содержащие эти слова.
Вы не сможете удалить весь мусор вручную — и это нормально.
Оставшийся мусор обычно сам сгруппируется при кластеризации в отдельные кластеры, которые потом можно удалить.
2. Кластеризация семантики
Кластеризация — это группировка поисковых запросов, имеющих одинаковый интент и продвигаемых на одной странице.
Выполняется по методу подбора топов (TOP-based method).
А. Принцип работы (Метод подбора топов)
- Берутся два запроса (например, «Рабочая одежда» и «Спецодежда»).
- Анализируется поисковая выдача (ТОП-10 или ТОП-20) для каждого.
- Если запросы имеют достаточное количество совпадающих страниц (3–5), они считаются синонимами и объединяются в один кластер.
Б. Типы кластеризации
В Бурж-SEO используется в основном Soft Clustering (Софт-кластеризация).
- Soft Clustering (Софт): 
 Запрос может находиться в нескольких кластерах, если пересекается по совпадениям в ТОПе.- Порог (Точность): выбирается число совпадений страниц в ТОПе (обычно 3 или 4).
- Важно:- Слишком высокий порог (5) — кластеры распадутся, страниц станет слишком много.
- Слишком низкий порог (2) — получите огромные кластеры с разными интентами.
 
 
- Hard Clustering (Хард): 
 В Бурж-SEO практически не используется, особенно для информационных и обзорных сайтов.
В. Обработка результатов кластеризации (Проверка руками)
Нельзя слепо доверять автоматическим алгоритмам.
Результаты нужно проверять вручную и корректировать типичные ошибки.
Типовые ошибки:
- Склейка разных интентов. 
 Коммерческие и информационные запросы объединены в один кластер.Нельзя продвигать разные интенты на одной странице. Нужно разделять их.
- Каннибализация. 
 Несколько статей по одной теме без дополнительной ценности.Объедините в одну статью и настройте редирект.
 Silo-структура помогает избежать каннибализации.
- Распадение одинаковых запросов. 
 Синонимы оказались в разных кластерах — их нужно соединить.
- Полезные запросы в «мусоре». 
 Иногда хорошие ключи попадают в некластеризованные группы — верните их вручную.
3. Распределение по страницам (AIDA)
После кластеризации каждый кластер = одна потенциальная страница.
Далее распределяем их в структуре сайта и контент-плане (по модели AIDA).
- Attention (Внимание) и Interest (Интерес): 
 Статьи типа «что это» или «как сделать».
 Приносят основной трафик.
- Desire (Желание) и Action (Действие): 
 Конверсионные запросы (покупка, регистрация), приносят меньше трафика, но больше прибыли.
4. Определение потенциального трафика
На этом этапе оцениваем, какой трафик принесет каждый кластер, чтобы расставить приоритеты.
- Определите максимально возможную позицию в ТОПе для каждого ключа.
- Умножьте частотность на предполагаемый CTR для этой позиции.
- Суммируйте, чтобы оценить месячный и годовой трафик.
- При необходимости сделайте оценку по каждому разделу сайта.
Таким образом, на выходе вы получаете структурированное семантическое ядро, готовое к использованию для создания ТЗ копирайтерам и построения вашей Silo-структуры.
🧭 Что дальше?
В следующем уроке мы начнем практическое применение семантики — создание контент-планов и написание SEO-текстов, основанных на ваших кластерах.