Семантическое ядро для информационного сайта — сбор, сколько нужно ключевых слов, семантика поисковых запросов, SEO для статьи

Семантическое ядро для информационного сайта

Онлайн бизнес на статейниках продолжает жить несмотря на экономические трудности в мире. Сразу же после выбора ниши перед вебмастером стоит вопрос сбора семантики для сайта. Процесс работы с поисковыми запросами долгий и мучительный для новичков, который часто отбивает желание запускать проект. Но стоит отметить, что даже приняв решение о делегировании сбора семантики, вебмастеру все равно нужно понимать, как происходит сам рабочий процесс.

Что такое семантическое ядро

Семантическое ядро — упорядоченный список поисковых запросов (слов и словосочетаний), которые характеризируют интент каждой страницы сайта. Правильное СЯ имеет разветвленную структуру (категории, подкатегории, группы) с учетом пользовательского спроса. С помощью семантики вебмастер еще до запуска проекта может понять сколько страниц должно быть создано на сайте и каким контентом они должны быть наполнены. Кроме самих поисковых запросов СЯ содержит информацию о их частотности, коммерческости, конкурентности в поисковых системах.

Для чего нужен сбор семантики для сайта

Семантическое ядро состоит из ключевых запросов, которые пользователи вводят в Google, Яндекс или любой другой поисковик. С помощью анализа запросов можно получить информацию о потребности пользователей в информации. Чтобы понять, какой контент нужно разместить на сайте нужно ответить себе на 3 базовых вопроса:

  • Что — какую информацию ищут пользователи в связанной теме;
  • Как — какие слова и словосочетания они используют для поиска такой информации;
  • Для чего — какая конечная цель поиска, может ли информационный сайт удовлетворить потребность пользователя по конкретному запросу.

С точки зрения SEO семантика для информационного сайта позволяет решить ряд последующих задач:

  • Разработка структуры (категорий, подкатегорий, тегов, меток) сайта. Определить какая страница в какой рубрике должна находиться. Тем самым все категории наполняются равномерно, а пользователь и поисковый робот будут удовлетворены правильной иерархией проекта;
  • Разработка контент-стратегии. Вебмастер получает информацию о необходимом количестве страниц на сайте, может спланировать количество публикаций на месяц, квартал, год или даже несколько лет;
  • Постраничная SEO-оптимизация. С помощью грамотно составленного семантического ядра можно сформировать правильные метатеги, употребить достаточное количество релевантных ключевых слов в тексте;
  • Распределение ссылочного веса на сайте. Важным элементом SEO-продвижения контентных сайтов остается перелинковка. СЯ дает информацию для правильного формирования карты перелинковки внутри проекта, что оказывает непосредственное влияние на ранжирование по ключевым запросам;
  • Внешнее SEO-продвижение. Семантика позволяет сформировать правильный анкор-лист для закупки внешних ссылок и крауд маркетинга. Ссылочный вес — один из самых важных факторов ранжирования в Google и Яндекс.

СЯ — фундамент, без преувеличения. Мы рекомендуем создавать семантическое ядро еще до покупки домена и заказа хостинга.

Как составить семантическое ядро для информационного сайта

Сбор семантическое ядра для SEO можно условно разделить на 4 основных этапа:

  1. Формирование списка маркерных (вводных) слов и словосочетаний, которые соответствуют тематике проекта;
  2. Парсинг поисковых запросов и сбор частотности в Яндексе и Google;
  3. Чистка семантики от нетематических, мусорных ключей и фраз с нулевой частотностью;
  4. Группировка поисковых запросов. Требует высоких аналитических способностей исполнителя.

На каждом из этапов необходимо быть максимально сосредоточенным на работе. Любая ошибка может обернуться сложными последствиями, которые потребуют дополнительных затрат в дальнейшем или вовсе свернуть проект.

Составление списка базовых ключей

Базовые слова и словосочетания используются в парсерах поисковых систем и позволяют получить полный список поисковых запросов по теме. Маркерные слова должны иметь четкое отношение к тематике проекта, но при этом не сужать охват. Например, для информационного сайта по тематике «Сад и огород» список базовых слов будет примерно таким — огород, посадка, сажать, рассада, выращивание, посадить и т.п.

Мозговой штурм

Начинается с максимального погружения в тематику, вычитку хотя бы нескольких тематических статей. Это позволяет исполнителю начать оперировать терминами, которые относятся только к заданной теме. Забиваем тематическое слово в Яндекс Вордстат и изучаем правую колонку — ищем связанные термины и добавляем в список базовых ключей. На этом этапе должна быть четко определена граница тематики, через которую мы не будем переступать. Например решить, будем ли мы в тематику «Сад и огород» включать направления ландшафтного дизайна, рецепты заготовок и т.п.

Сайты конкурентов, Википедия и профильные издания

Маркерные слова проще всего искать у конкурентов и на профессиональных тематических страницах. Разделим данный этап на 3 пункта:

  • Сайты конкурентов. Формируем список сайтов, которые соответствуют нашей тематике. На каждом сайте поочередно открываем «Карту сайта» (/sitemap.html), обычно можно найти в хедере или футере. Изучаем название рубрик и заголовков на сайтах. В названиях статей обычно находится 70-80% всех тематических слов ниши.
  • Википедия. Ищем в Вики статьи, которые соответствуют нашей тематике. Авторы этих статей обычно профессионалы своего дела и оперируют массой терминов, которые редко встречаются на обычных информационниках.
  • Профильные издания. К этой категории относятся журналы по типу Форбс или любой другой, который соответствует нашей тематике. Тут тоже можно найти редкую терминологию, которая может сыграть важную роль в формировании семантического ядра.

Парсинг поисковых запросов

Парсинг семантического ядра — процесс получения исчерпывающего списка поисковых запросов, которые имеют прямое отношение к тематике. Для парсинга нужно использовать максимальное количество открытых и закрытых источников. В Семантологии ключевые слова для семантического ядра мы берем из следующих источников — Яндекс Вордстат, Google Ads, Поисковые подсказки, данные из Яндекс Метрики и Google Analytics, данные из Вебмастера и GSC, сервисы Букварикс, Словоеб, Serpstat, Keys.so, Rush Analytics и другие в зависимости от задачи.

Yandex Wordstat

Вордстат — открытый инструмент от поисковой системы Яндекс, базовые функции которого доступны любому пользователю. При этом, для полноценного и скоростного парсинга данного источника нужно использовать программу Key Collector. Софт позволяет с завидной скоростью спарсить все поисковые запросы для ядра, связанные с базовыми фразами.

Семантическое ядро для информационного сайта
Семантическое ядро для информационного сайта

Google Ads

Для парсинга поисковых запросов семантических ядер из Гугл используется тот же Кей Коллектор, однако требуются специальные тонкие настройки софта. Иначе программа будет выдавать массу ошибок и ничего спарсить не получится.

Подсказки Я и G

Автоматизированный парсинг поисковых подсказок возможен только при использовании Кей Коллектора. Является одним из самых важных источников ключевых слов, ведь по оценкам маркетологов более 80% пользователей используют подсказки для ускорения поиска информации.

Семантическое ядро для информационного сайта

Букварикс

Обязательный источник, чтобы собрать запросы для семантического ядра контентного проекта. В сервисе есть ограниченный бесплатный функционал и платные функции по подписке. Для составления ядра используются две функции — Поиск по списку ключевых слов и Поиск ключевых слов нескольких доменов.

Словоеб

Полностью бесплатная программа для парсинга поисковых запросов. Одна из самых старых баз ключевых слов для семантических ядер. Софт не закрывает все нужды SEOшника, но сойдет в качестве дополнительного источника запросов. Функционал интуитивно понятен, останавливаться на нем отдельно не будем.

Keys.so

Сервис обладает огромной базой постоянно обновляемых ключевых слов. Для формирования списка фраз нужно сбить всего лишь домен сайта конкурента. Недостатком Кейс.со являются его тарифы, часто покупка сервиса в разы дороже делегирования составления СЯ подрядчикам. Покупать для одного-двух проектов мы бы не стали.

Serpstat

Профессиональный инструмент для интернет-маркетинга. Позволяет парсить и анализировать ключевые запросы Яндекс, Google (доступны широкие настройки регионов), конкурентов по различным параметрам. Качественный источник семантических ядер для информационного сайта, но тоже платный. Инструмент подойдет для постоянно практикующего SEO-специалиста, студии продвижения сайтов и т.п., но не для вебмастера одиночки.

Rush Analytics

Платный инструмент, который позволяет максимально быстро собирать запросы из Google и Yandex. Тарифы на сбор данных приемлимы, интерфейс интуитивно понятен. Если у вас есть Key Collector, то использовать Rush для парсинга ядра не стоит, информация просто будет продублирована и сервис не окажется полезным.

Яндекс Метрика и Google Analytics

Системы аналитики подойдут в качестве источника запросов только если семантика собирается на уже существующий сайт с трафиком. Выгрузить ключевые слова можно в ручном режиме или в автоматизированном с помощью того же Кей Коллектора. В случае разработки семантического ядра для существующего проекта рекомендуется также собирать запросы из Вебмастера и Google Search Console.

Семантическое ядро для информационного сайта

Чистка списка поисковых запросов

После парсинга запросы из всех источников нужно объединить в один файл, лучше всего добавлять все в один проект в Кей Коллектор. Собрать семантическое ядро информационного сайта и не найти в нем мусор невозможно. Далее следует изучить список запросов на наличие нетематических и мусорных словосочетаний. Например, для информационного сайта в 99% случаев не подходят ключи в которых есть слово купить, заказать, с доставкой и другие, которые подразумевают коммерческий интент.

Также на этапе формирования базовых запросов могли быть заданы маркеры, которые связаны с несколькими темами одновременно. Нужно будет вручную отсеять нетематические запросы. Помощником в этой задаче может стать инструмент Анализ групп — По отдельным словам .

Семантическое ядро для информационного сайта

Для быстрой чистки ядра у семантистов обычно сформированы специальные базы минус-слов. В 99% случае информационному сайту не понадобятся запросы с названиями городов, улиц, станций метро, маркетплейсов и т.п.

Внимание! Чистить ядро нужно максимально и в несколько итераций, вы должны удалить минимум 98% неподходящих слов!

Повторная итерация парсинга

Даже при всем разнообразии источников за одну итерацию не получится собрать абсолютно все поисковые запросы. Поэтому, для очищенного от мусора списка ключей собираем базовую частоту Яндекс Вордстат. Сортируем список по убыванию частотности. Выделяем 25-30% самых частотных запросов и ставим их на повторный парсинг Яндекс Вордстат, Google Ads и Поисковые подсказки.

После проведения повторной итерации повторяем чистку, снова максимально подробно, нужно стараться удалить ВСЕ неподходящие запросы!

Снятие частотности

Семантическое ядро для информационного сайта

Далее нужно собрать частотность оставшихся запросов в поисковых системах. Сделать это можно в автоматизированном режиме с помощью Кей Коллектора. Дополнительно можно подключить сервисы по сбору статистики MOAB, Serpstat или Rush Analytics.

Поисковые запросы можно условно разделить на высокочастотные (ВЧ), среднечастотные (СЧ) и низкочастотные (НЧ):

  • Высокочастотные слова в зависимости от тематики могут характеризоваться частотностью от 1 000 запросов в месяц. ВЧ ключи выглядят самыми «вкусными», так и есть, но не важно не сбрасывать со счетов низкочастотники, именно они создают семантическую релевантность документа;
  • Среднечастотные словосочетания обычно состоят из двух-трех слов и характеризуются частотностью в пределах 300-1000 запросов в месяц.
  • Низкочастотники обычно состоят из трех-десяти слов, для них характерна частотность от 1 запроса в месяц. Несмотря на низкие показатели, НЧ запросы являются очень важными для SEO-оптимизации сайта. Для блогов иногда удаляются фразы с частотностью ниже 5 запросов в месяц.

Стоимость подбора семантического ядра в Семантологии начинается всего с 0.2$ за полезный ключ на выходе.

Чистка по частотности и удаление неявных дублей

Что у нас есть: очищенный от мусора список релевантных ключевых слов, собрана частотность в Яндекс и Гугл. Самое время удалить словосочетания, которые имеют нулевую частотность. Для этого создаем такой фильтр в Кей Коллекторе (тут в качестве источника частотности по Google использована статистика из Serpstat):

Семантическое ядро для информационного сайта

Далее нужно удалить неявные дубли. Неявными дублями являются ключи, которые состоят из одних и тех же слов, имеют одинаковую частотность и не несут полезной информации для SEO-специалиста. Для поиска неявных дублей в Кей Коллекторе есть специальная функция:

Семантическое ядро для информационного сайта

Кластеризация семантического ядра

Кластеризация — группировка семантического ядра на отдельные кластеры, каждый из которых будет соответствовать одной странице на сайте. В одну семантическую группу добавляются одинаковые по интенту (смыслу, пользовательскому спросу) поисковые запросы, которые будут продвигаться на одной странице сайта. Существует два основных способа кластеризации семантики для информационных сайтов:

  • Автоматическая группировка по ТОПу с помощью программ и онлайн-сервисов. Во всех автоматизированных кластеризаторах используется один и тот же алгоритм — если у двух запросов есть от 3 пересечений URL в поисковой выдаче, значит они должны продвигаться на одной странице сайта. Сила группировки может быть настроена на любое количество пересечений, от одного до десяти. Автоматическая кластеризация семантики имеет ряд недостатков — большое количество несгруппированных ключей, наличие огромного количества смысловых дублей, объединение необъединяемого.
  • Ручная кластеризация обычного производится в программе Key Collector и подразумевает интеллектуальный труд семантиста с использованием вспомогательных инструментов. Профессиональный семантист способен создать семантическое ядро высокого качества, которое уменьшает расходы на этапе выписки контента и увеличивает прибыль за счет простоты продвижения сайта по такому ядру.

Автоматическая группировка

Кластеризация в автоматизированном режиме осуществляется одним из двух методов — Hard и Soft. Есть принципиальные различия между этими способами. Soft кластеризация предполагает сравнение всего пула ключей только с самым частотным (маркерным) поисковым запросом. Hard в свою очередь подразумевает сравнение пула ключей, как с маркерным словом, так и между собой.

При Soft кластеризации группы получаются большими, но большой риск попадания нерелевантных запросов в группу. Hard кластеризация приводит к чрезмерному дроблению — высокий риск появления множества дублирующих друг друга страниц.

Ручная группировка

Такой метод требует высоких интеллектуальных способностей и узкой профессиональной подготовки исполнителя. Семантист самостоятельно проводит анализ интента каждого ключевого слова по отдельности, погружается в потребности пользователей. Группы получаются максимально качественными, без каннибализации и излишнего дробления. Исходя из многолетнего опыта, ручная кластеризация для информационных сайтов просто необходима, ведь тут каждая копейка на счету. Глубокая проработка кластеров гарантирует экономию на выписке текстов, исключает ошибки автоматической группировки, дает четкую структуру контента уже на страрте.

Стоит отметить и очевидные минусы ручной работы — трудности в поиске опытных специалистов, сложная обучаемость кластеризации, высокие временные затраты. Избежать этих недостатков возможно приняв решение о делегировании сбора семантики для сайта.

Типы ключей

Хороший семантист «на глаз» отличит информационный запрос от коммерческого. Коммерческий запрос в большинстве случаев содержит слова, которые подразумевают покупку чего либо — купить матрас двухспальный, заказать семантическое ядро для информационного сайта, пицца с доставкой, пластиковые окна недорого и так далее. Информационные же запросы подразумевают получение ответа на вопрос — как составить семантику для блога, как написать текст, сколько карт играет в покере, куда вводить промокод для получения бонуса и т.п.

По нашей оценке около 20% всех поисковых фраз не имеют точно заданного интента. В таких случаях нужно покладаться только на поисковую выдачу — если там коммерция, значит продвигаем на коммерческой странице, если блоги — значит на информационной странице.

Группировка по смыслу

Здравый смысл и глубокое понимание интента — главные навыки, которые необходимы при ручной проработке семантики. Если вы знаете, что острый тонзиллит и ангина это одно и то же, но поисковики упорно ранжируют разные страницы под этот запрос, то может все таки стоит сделать две разные страницы. Решение за семантистом, но последующие этапы разработки контента обязательно должны знать о таких нюансах. Технические задания на эти два текста должны создаваться с учетом этого фактора.

Пересечения по ТОПу

Сравнение поисковой выдачи по ключевым словам хороший способ быстро распределить сомнительные ключевые слова, где интент неочевиден. Для анализа просматривается выдача вручную, с помощью внутренних инструментов Кей Коллектора, Арсенкина или аналогичных сервисов. Основная задача — выявить лучшую группу для сомнительного ключа. Собрать семантическое ядро статьи с использованием сравнения выдачи проще чем без такового.

Советы по составлению СЯ от SEO-специалиста

Разработка семантического ядра для блога — кропотливая работа, требующая как узконаправленных, так и коммуникационных навыков. Общение между исполнителем и заказчиком крайне важно — в личной переписке решаются вопросы касающиеся границ тематики, готовность идти в околокоммерческие темы, продвигать категории и многое другое. Честность и открытость к общению со стороны заказчика приветствуется, специалист в свою очередь обязан объяснить все принятые им решения.

Определите цель — трафик или заявки

Большинство информационных проектов призваны получать поток трафика, который монетизируется далее с помощью контекстной рекламы. Противоположностью является позиционный подход, когда трафик нужен по конкретным высокомаржинальным ключам. Определяйте цели в начале пути, тогда в результате вы получите то что хотели.

Не удаляйте НЧ запросы

Низкочастотные запросы могут казаться неинтересными для продвижения, но это не так. Именно благодаря НЧ ключам блог может быстро получить свой первый трафик, который сформирует поведенческие факторы и историю для сайта. Начинать с низкочастотников намного проще, а первые результаты появляются намного быстрее.

Беспощадное удаление нетематических кластеров

Бывает в семантике остаются не соответствующие тематике кластера, но с высокой частотностью. Всегда есть соблазн выписать что то нетематическое и попробовать получить на такую страницу трафик. Не советуем так делать! Во-первых, скорей всего никакого трафика на такую страницу получено не будет. Во-вторых, нетематические статьи размоют семантику поисковых запросов сайта в целом и это навредит SEO-продвижению.

Заключение

Производство семантических ядер — трудный процесс с сотней нюансов. Сбор СЯ без глубокого изучения теории и практических занятий под контролем опытного SEO-специалиста приведет к провалу проекта еще до его запуска. Семантология предлагает делегировать процесс разработки семантических ядер под проекты любой направленности.

Если резюмировать, то составление СЯ состоит из 5 основных шагов:

  1. Погружение в тематику и сбор базовых запросов для парсинга. Расширение за счет синонимов и узкотематических слов;
  2. Парсинг максимального количества доступных источников;
  3. Удаление нерелевантных ключевых слов, обозначение границ тематики;
  4. Вдумчивая и придирчивая кластеризация поисковых запросов с обязательным ручным трудом.

Оставьте комментарий

Ваш адрес email не будет опубликован.