Семантический анализ SEO-текстов: как оценить, нормально ли получилось

Тошнотность, водность, семантическое ядро
Что делать, чтобы нормально оптимизировать статью? Вебмастера проверяют текст на разных сервисах, обсуждают какие-то цифры и спорят между собой. Если вы ничего не понимаете в этом, мы все объясним. Расскажем, как проверить, нормальная ли получилась статья, и что исправить для того, чтобы она попала в топ.

Что дает семантический анализ

Семантический анализ SEO-текстов рассчитывает процент тошнотности и водности, показывает, какие слова входят в семантическое ядро. Он показывает, оптимизирован ли текст — соответствует ли он запросам пользователей. Проверка позволяет понять, как на страницу отреагируют поисковые системы: посчитают ли они ее переоптимизированнй и понизят ли в выдаче; и по каким ключевым запросам будут показывать.

Семантика текста важна, но поисковая система оценивает сотни других факторов вместе с ней. Первое, на что нужно обратить внимание, — польза и смысл текста. Поисковые системы работают над тем, чтобы в топе был только полезный контент: Яндекс выпустил новый алгоритм «Королёв», а Гугл еще с 2015 года использует систему RankBrain. Дмитрий Скалубо провел свое исследование и подтвердил, что важна польза текста, а не его технические характеристики. 

Сначала — польза и смысл, потом — технические характеристики текста и все остальное. Не нужно подгонять показатели в ущерб смысловой составляющей. 

Семантическое ядро текста

Проверка «семантическое ядро» показывает, из каких слов и словосочетаний состоит текст, и как часто они встречаются. Слова, которые встречаются чаще всего, обычно задают тематику материала. Поисковые роботы оценивают эти словосочетания и определяют, соответствует ли содержимое страницы запросам пользователей — фразам, которые они вводят в поисковую систему.

Пример семантического ядра

Семантическое ядро переоптимизированной заметки от Яндекса: понятно, что в ней говорят о SEO-текстах

В семантическом ядре текста — в первых 3–4 строках — должны быть слова, соответствующие тематике контента. Иначе поисковая система посчитает статью нерелевантной и понизит ее в выдаче либо вообще не будет показывать по нужным ключевым запросам.

Плохо

Хорошо

В статье о переустановке Windows 7 самые часто встречающиеся слова — «окно», «нажмите», «мышка».

В статье о переустановке Windows 7 самые часто встречающиеся слова — «переустановка», «Windows 7», «как переустановить Windows 7».

Что делать: если в семантическом ядре нет тематических словосочетаний, увеличьте число вхождений релевантных слов. Добавьте в статью тематические словосочетания, которые характеризуют материал и позволяют пользователю понять, о чем он.

Но не забывайте о правилах русского языка — не нужно вставлять неестественные ключи в прямом вхождении. Прямые вхождения ключей — одна из самых распространенных ошибок в SEO-текстах. 

Тошнота

Тошнота показывает количество повторяющихся слов в тексте и рассчитывает их соотношение к количеству всех слов в тексте. Если определенное слово или словосочетание будет повторяться много раз, поисковые алгоритмы посчитают контент переоптимизированным.

Свой приемлемый процент максимальной тошноты у всех разный. В BEST SEO BLOG выяснили, что академическая тошнота должна находиться в пределах 2–7%. В агентстве 1PS.RU оценили тошноту текстов на сайтах из топа и подсчитали, что тошнота не должна выходить за пределы диапазона 5–9%. А в редполитике агентства IQOnline максимальная допустимая тошнота — 8,5%.

Фрагмент редполитики агентства IQOnline

Редполитика агентства IQOnline

Что делать: если тошнота текста высокая, удалите вхождения самых часто встречающихся слов. Если тошнота низкая, добавьте несколько вхождений ключевых и релевантных теме слов.

Частота слов

Кроме общей тошноты текста, сервисы подсчитывают процент вхождений каждого отдельного слова. Слова с самой высокой частотой образуют семантическое ядро.

Мнения о максимальном допустимом показателе частотности одного слова или словосочетания также не сходятся. Например, на бирже ContentMonster считают, что максимальная частотность ключевых слов не должна превышать 3–5%. В студии DocTxT считают, что максимальная допустимая плотность ключей в тексте составляет 2–5%.

Частота слов в тексте

Частота слов в тексте, который Яндекс привел в пример, как переоптимизированный: контент с показателем больше 8%, скорее всего, попадет под фильтры

Что делать: если частота слова больше 5-6%, удалите несколько вхождений. Если частота релевантных слов низкая, и они находятся в конце семантического ядра, увеличьте число вхождений. 

Водность

Процент водности показывает количество стоп-слов, не имеющих смысловой нагрузки. Чем больше показатель водности — тем больше в тексте лишних предлогов, союзов, предложений, которые не принесут никакую пользу читателю. Большинство сервисов относят к стоп-словам местоимения, предлоги, вводные слова.

Алгоритмы у всех сервисов проверки разные, поэтому оптимальные проценты водности также отличаются:

  • Текст.ру — до 15%
  • Адвего — до 75%
  • Istio — до 60%
  • Miratext — до 10%

Водность можно «почувствовать» самому: если в тексте есть длинное вступление, не относящееся к теме, много бессмысленных оборотов и ненужных слов, контент водянистый. Статья без воды подробно отвечает на вопрос пользователя, но не уводит его в дебри истории и не отходит от заданной темы.

Цветом в тексте отмечена вода

Все выделенные слова можно удалить без потери смысла. В этом тексте они — вода

Плохо

Хорошо

В тексте много ненужных слов, не несущих смысла, например — «как мы все знаем», «в современном мире», «вне всяких сомнений».

Контент полезен для пользователя, подробно раскрывает основную тему статьи.

Что делать: если показатель воды небольшой, но текст читается легко, оставьте все как есть. Если водность низкая и текст читать тяжело, разбавьте его предлогами и местоимениями. Если водность высокая, удалите ненужные вводные слова, предлоги, местоимения, вступления. 

Сервисы для проверки SEO-текста

У каждого сервиса свои алгоритмы расчета тошноты, водности, семантического ядра. Нет единого точного показателя, на который можно было бы ориентироваться при проверке на всех сервисах.

Самые популярные семантические анализаторы:

  • Адвего. Показывает классическую и академическую тошноту, водность, семантическое ядро, часто встречающиеся слова и стоп-слова. По данным самого сервиса, нормальный уровень академической тошноты — 5–15%, уровень воды — 55–75%.

    Текст.ру. Показывает уровень воды и заспамленности — тошноты текста, семантическое ядро, список частотных слов. Подсвечивает стоп-слова в тексте. По данным самого сервиса, нормальный уровень заспамленности — 30–60% нормальный уровень воды — до 15%.

  • Istio. Показывает водность, тошноту, словарь ядра, статистику по словам со стоп-словами и без них. По данным сервиса, нормальный показатель воды — 30-60%. Подсчет тошноты здесь очень похож на подсчет сервиса Адвего, поэтому можно считать оптимальным показателем до 15%.

  • Miratext. Показывает тошноту, водянистость, качество по Ципфа, плотность и число повторений слов и словосочетаний. По данным самого сервиса, оптимальные показатели тошнотности — меньше 3,5%, водянистости — меньше 10%.

Запомнить

  • Сначала — польза и смысл, потом — технические характеристики текста

  • В семантическом ядре текста должны быть слова и словосочетания, соответствующие теме статьи

  • Если показатель тошноты высокий, удалите несколько вхождений тематических слов

  • Если текст водянистый, удалите стоп-слова, не несущие смысла

А проверяете ли вы текст в семантическом анализаторе, и какими показателями руководствуетесь при оценке контента? Расскажите в комментариях, нам очень интересно!