Метрики для определения качества текста

Как поисковые системы отличают хорошие тексты от плохих
Гугл и Яндекс призывают авторов контента писать оригинальные статьи, которые будут полезны в первую очередь пользователям. Поисковые системы лучше ранжируют страницы с интересным контентом. Метрики определения тошноты, уникальности, водности и удобочитаемости помогут найти слабые места в тексте.

Тошнота

Что показывает. Количество повторяющихся слов в тексте. При расчете метрики учитываются любые слова, в том числе и ключевые.

Пример. В Яндексе показали пример текста с высоким показателем тошноты:

В последнее время проблема переоптимизированных текстов особенно актуальна. Переоптимизированные тексты (которые по-английски можно назвать over-optimized texts или over-optimized content), или тексты с запросами, часто используются для оптимизации сайтов. Переоптимизированные тексты помогают поместить на сайт большое количество ключевиков (ключевых слов, целевых запросов), по которым сайт продвигается.

Академическая тошнота по Адвего — 20

Что получится, если уменьшить тошноту:

Тексты с большим употреблением ключевых слов называются переоптимизированными. В интернете такой контент встречается часто. Авторы думают, что чем больше ключей в тексте, тем лучше сайт проиндексируется поисковой системой. 

Академическая тошнота по Адвего — 10

На что влияетИнтернет-маркетолог Юлия Рамьялг отмечает, что высокая тошнота текста не выведет в топ. Переоптимизированный контент может стать причиной попадания сайта под фильтры поисковых систем. Не следует публиковать на сайте тексты с низкой тошнотностью — поисковым роботам сложно понять смысл текста без ключевых слов. На siteask.ru предлагают смотреть показатель тошноты у конкурентов из топа и ориентироваться на их значения.

Что с этим делать. Если тошнота высокая — увеличьте объем текста, уменьшите количество ключевых фраз или удалите часто встречающиеся слова. Если тошнота низкая — добавьте ключевых слов, чтобы поисковая система поняла, о чем ваш текст. В BEST SEO BLOG выяснили, что академическая тошнота должна быть 2–7%, классическая тошнота — 3–5%. В digital-агентстве1ps.ru предлагают другие показатели: минимальная тошнота — 4%. Максимальная тошнота — 8–9%.

Сервисы для проверки:

Водность

Что показывает. Процентное соотношение стоп-слов к общему количеству слов в тексте. Стоп-слова не несут полезную информацию читателю. К ним относят: местоимения, союзы, междометия, предлоги, частицы, сокращения, обращения, вводные слова, прилагательные, наречия.

Пример. Максим Ильяхов, основатель сервиса Главред, предложил пример текста с водой:

Наша компания является ведущим провайдером услуг по ИТ-интеграции в регионе. Мы работаем на рынке интеграционных и телекоммуникационных услуг с 2010 года. За долгие годы работы мы успешно выполнили проекты и завоевали безоговорочное доверие таких крупных клиентов, как Сбербанк и завод «Северсталь».

Водность по Главреду — 5,5 баллов из 10

После удаления стоп-слов:

Строим компьютерные сети, подключаем интернет, запускаем серверные стойки и налаживаем видеосвязь в офисах: создаем проекты, закупаем оборудование, устанавливаем, настраиваем и обучаем персонал. Обслуживаем каждый третий офис в Московской области, каждый пятый офис в Москве. В 2011 году построили ЦОД и федеральную видеосеть для Сбербанка. В 2012 году создали первую автономную систему распределенного мониторинга на заводе «Северсталь». Строим сети по стандартам ИСО, с системой контроля качества. Работаем с 2010 года.

Водность по Главреду — 9,5 баллов из 10

На что влияет. Копирайтер Петр Панда считает, что текст с высоким показателем водности не несет полезную информацию читателю и не раскрывает суть материала. Поисковые системы плохо ранжируют тексты с водой.

Что с этим делать. В книге «Пиши, сокращай» Максим Ильяхов предлагает не просто удалять стоп-слова, а наполнять тексты полезной информацией и фактами. Не нужно удалять все стоп-слова, текст должен быть естественным. SEO-специалист Александр Зинченко придерживается показателей водности 20–40%. В студии контента RunStory считают, что для каждого сервиса допустимый процент воды разный: для Адвего — до 60%, для Text.ru — до15%, для Istio.com — от 30 до 60%.

Сервисы для проверки:

Техническая уникальность

Что показывает. Совпадение фраз и предложений в других публикациях в интернете. Если текст опубликован — он уже неуникальный: проверка на сервисах покажет 0% технической уникальности.

На что влияетВ Яндексе действуют ограничения за использование неуникального контента. Фильтры АГС-17 и АГС-30 находят и исключают из поиска сайты, которые публикуют автоматически сгенерированный или скопированный контент. Понижает позиции сайта с неинтересным и неуникальным контентом фильтр Яндекса «Ты последний» и фильтр Гугла «Панда»

Что с этим делать. Размещайте на сайте уникальные тексты. Если вы пишете не оригинальные статьи, а берете тексты из интернета — повышайте их техническую уникальность: меняйте заголовки, структуру, переписывайте предложения другими словами. Практикующий SEO-специалист Сергей Коваленко считает, что минимальная техническая уникальность у текста должна быть 85%. В SEO-компании Demis Group придерживаются показателя в 95%.

Сервисы для проверки:

Удобочитаемость

Что показывает. Степень легкости восприятия текста читателем. Метрика ориентирована на поиск длинных фраз и предложений.

Пример. В mastersloga.ru разобрали два примера:

Эндрю был индифферентен к отношению представителей собственной династии и всегда идентифицировал себя с репрезентантами мафиозных структур мегаполиса. Властитель канализационных подземелий — таким прозвищем именовали его жители близлежащих кварталов. Всегда, когда между группировками нарастало напряжение, юноша будто являлся горящей спичкой, опущенной в легковоспламеняющуюся сухую траву.

Удобочитаемость на сервисе Audit.te-st.ru: 0 из 100 — текст читается сложно, доступен для понимания людям с высшим образованием

Эндрю не обращал внимания на недовольство членов семьи. Он был одним из заводил банды своего города. Хозяин сточных труб — так называли его знакомые. Всякий раз, когда росло противостояние между шайками, юноша был той искрой, что зажигает пламя кровопролитной войны.

Удобочитаемость на сервисе Audit.te-st.ru: 64 из 100 — текст средней степени сложности, доступен для широкой аудитории

На что влияет. Читаемость влияет на ранжирование сайта. В статье «24 совета по улучшению читабельности текста» Денис Каплунов отмечает: чем легче читать материал, тем больше прочитает пользователь. В международной компании по поисковому продвижению SeoProfy продолжают мысль: чем больше читают, тем дольше находятся на сайте — это положительно влияет на поведенческие факторы.

Что с этим делать. Научный сотрудник и менеджер проекта для оптимизации сайтов yoast.com Марике ван де Рат советует читать тексты вслух, чтобы найти сложные слова и фразы. Следует обратить внимание на длину предложений и пользу информации для читателя в каждом абзаце. Марике рекомендует составить структуру текста, продумать порядок, факты, примеры. При написании текста использовать короткие предложения и ограничить употребление сложных для восприятия слов.

Сервисы для проверки:

Удобочитаемость можно проверить в текстовом редакторе Microsoft Word:

  1. Открыть вкладку «Файл» → «Параметры»

  2. Выбрать пункт «Правописание»

  3. Установить флажок «Статистика удобочитаемости»

  4. Кликнуть «Рецензирование» → «Правописание»: программа покажет все орфографические, грамматические ошибки и статистику удобочитаемости:

Статистика показывает количество символов, слов, предложений и легкость чтения

Статистика удобочитаемости в Microsoft Word

Выводы

  • Тошнота показывает частоту использования слов в тексте. Контент с большим количеством ключевых слов — причина попадания сайта под фильтры поисковых систем. Если ключевых слов недостаточно, поисковая система не поймет, о чем текст. Проверяйте параметр тошноты контента у конкурентов из топа.

  • Водность показывает наличие стоп-слов — бесполезной для читателя информации. Если убрать стоп-слова и добавить больше фактов и пользы, текст лучше воспримут читатели и поисковые системы.

  • Уникальные тексты не имеют копий в интернете. За использование скопированного контента предусмотрены санкции от поисковых систем.

  • Удобочитаемость показывает легкость восприятия текста. Длинные и сложные фразы понизят индекс удобочитаемости. Чем легче читать текст, тем дольше пользователь останется на сайте: удобочитаемость влияет на индексацию.

Какие параметры проверяете вы, когда пишите статьи? Какие сервисы используете и каких показателей придерживаетесь? Напишите в комментариях.