Закон Ципфа: как и зачем производить новомодный анализ текста?
Оглавление
Солнце поднимается, рисуя в небе траекторию, так похожую на закон Ципфа… С Вами Ирина Иваськив. Сегодня поисковой маркетинг набирает внушительные обороты, в результате чего появляется множество сервисов для текстового анализа. Помимо проверки грамматики, уникальности, заспамленности и прочего, тексты начали анализировать и на естественность. Поисковые системы без труда распознают искусственно сформированные тексты, автоматически выводя их из первых страниц результатов поиска. Вот почему для успешного продвижения продукта или услуги важно проверять тексты на естественность. Анализ текста по такому критерию осуществляется по закону Ципфа. Что такое «закон Ципфа»? Как практически производится анализ текста по закону Ципфа? Обо всём этом поговорим в статье.
Значимость слов в тексте
Суть закона можно понять, взяв для примера компьютерную клавиатуру. Буквы на ней располагаются не в алфавитном порядке, а учитывая частоту встречаемости в словах. Это означает, что буквы, которые используются в словах русского языка чаще других, располагаются на русской клавиатуре ближе к центру (так удобнее для глаз и пальцев), а буквы, которые используются реже (например, буквы ё, ъ, э, й), располагаются на клавиатуре дальше от центра. Так же и поисковые системы распределяют сайты по позициям (в топе или подальше от него) в зависимости от значимости слов в тексте, условно разделяя их на 3 группы:
- Важные слова: значимые ключевые тематические слова, несущие в себе основной смысл, в тексте встречаются не часто, в тексте их примерно 20% (но именно они и «вытягивают» тексты на высокие оценки – практическое действие закона Парето)
- Случайные: такие слова к основному смыслу текста прямого отношения не имеют, встречаются не часто (в этом их плюс), влияния на распределение сайтов в поисковых результатах не оказывают
- Вспомогательные: такие слова используются в предложениях, в основном, как связующие, к смыслу текста напрямую не относятся и, как и случайные слова, на результаты поисковой выдачи не влияют
Появление закона Ципфа

Один из ключевых законов, используемых в инфометрии. Назван закон в честь лингвиста из США Джорджа Ципфа. Именно он популяризировал интересные закономерности, выявленные стенографистом из Франции Жаном-Батистом-Эсту в 1908 году. Выявленные закономерности применялись в разных сферах: в классификации городов по их размерам, в распределении экономических ресурсов, в распределении социальных статусов и т.п. Джордж Ципф привлёк внимание к этим закономерностям, и вскоре родилась теория естественности текста. Использоваться применительно к текстам она стала примерно с середины ХХ столетия.
Условная схема «1-2-3»
Согласно закону Ципфа, естественный текст будет выглядеть примерно так. Допустим, самым часто употребляемым словом в тексте является слово «программист». Следующее за ним по частоте употребления – слово «сайт», а после него – слово «продвижение». Если слово «программист» используется в тексте 12 раз, то для естественности слово «сайт» должно быть использовано в тексте 6 раз, а слово «продвижение» – 3 раза. Текст, составленный таким образом, пройдёт проверку на естественность и будет включён в верхние позиции поисковых запросов. Другими словами, суть закона Ципфа можно выразить так:
- второе слово должно использоваться в 2 раза реже, чем первое (12:2=6 раз)
- третье слово должно использоваться в 3 раза реже, чем первое (12:3=4 раза)
- и так далее
Давайте назовём эту закономерность условным названием «1-2-3», где 1 – первое слово, 2 – второе слово, 3 – третье слово. Цифры 2 и 3 напомнят также, что второе слово надо использовать в 2 раза реже, а третье – в 3.
Анализ текста по закону Ципфа
Для точного определения соответствия закону Ципфа используется формула:
FR=C
где F обозначает, как часто используется то или иное слово, R – номер слова по порядку, C – величина постоянная, обозначающая общее количество раз использования наиболее часто встречающегося слова в тексте
Есть более простая и удобная формула:
F=C/R
Кратко резюмируем сказанное:
- основываясь на этом методе, абсолютно любой текст можно проанализировать на предмет естественности
- текст, который соответствует описанной выше схеме не меньше, чем на 30-50%, считается естественным
- текст, получивший оценку от 50% и выше, считается очень хорошим (чем выше процент, тем текст идеальнее)
- а текст, который получил оценку меньше, чем 30% по закону Ципфа, лучше ещё раз тщательно вычитать
Важные предостережения
Сегодня уже доказано, что набор несвязных случайных слов тоже будет подчиняться теории Ципфа. Другими словами, анализ текста по закону Ципфа – это самый обычный математический анализ, статистический феномен, искусственно созданный инструмент. Закон Ципфа не имеет отношения:
- к содержательности текста, ведь если проверить литературные произведения великих классиков, то окажется, что многие из них не соответствуют данному закону
- к профессионализму автора, ведь любую бессмысленную кучку слов можно «заточить» таким образом, что закон Ципфа определит текст как «профессиональный»
- и к оригинальности текста, ведь 100%-ную уникальность могут иметь как тексты с высокими оценками по Ципфу, так и тексты с низкими оценками по Ципфу
- а также к продвижению сайтов, ведь на первой странице выдачи часто оказываются тексты с низкими оценками по Ципфу, а на 99-й – тексты с высокими оценками по Ципфу
Часто смотрю на задания на биржах фриланса, в которых заказчики изощряются в перечислении всех мыслимых и не мыслимых искусственных критериев проверки текста, и улыбаюсь… Те, кто заинтересован в качественных, читабельных, профессиональных текстах, указывают совершенно другие требования: например, раскрыть тему, свести «воду» до минимума, дать людям пользу от чтения и т.д.
Кому необходим закон Ципфа
Но, безусловно, есть и практическая польза от проверки текстов по Ципфу. Анализ текста по закону Ципфа регулярно проводят:
- писатели
- копирайтеры
- SEO-специалисты
- маркетологи
- веб-программисты
Все эти специалисты понимают: какой бы полезной ни была SEO-оптимизация текстов, писать в любом случае надо для людей, а не для поисковых роботов. Текст не должен напоминать свалку ключей в угоду SEO-тенденциям. Людям должно быть интересно читать тексты. Поэтому писателям и копирайтерам важно проверять свои тексты перед сдачей заказа. Объясню это на 3-х примерах:
1. Закон Ципфа и ключевые запросы
Для высоких показателей естественности текста необходимо грамотное вхождение в него ключей. Ключевые слова должны использоваться с большими разрывами между ними. Зачастую заказчики в технических заданиях для копирайтеров указывают точное количество вхождений ключевых слов в текст, запрещая вставлять в ключевых фразах предлоги и другие слова. Если соблюдать эти условия, добиться высокого показателя согласно закону Ципфа маловероятно. А вот текст, основанный на свободном вхождении естественного количества ключевых слов, будет оценён намного выше.
Строго соблюдая ТЗ, всё равно необходимо помнить о том, что основным должно быть ТОЛЬКО ОДНО ключевое слово. Именно оно и должно встречаться в тексте НАИБОЛЬШЕЕ КОЛИЧЕСТВО РАЗ. Остальные слова будут употребляться в меньшем количестве – в соответствии со схемой 1-2-3. Техническое задание можно считать правильным, если заказчик предоставил только ключи, без требований употребить их строго столько-то раз. В этом случае надо будет просто определить главное слово, которое и будет использоваться чаще других, а другие слова надо будет использовать меньшее количество раз в зависимости от их значимости.
Анализ текста по Ципфу как раз покажет, удалось ли главное слово сделать главным (или его обскакали по частоте какие-то не значимые слова). По результатам можно увидеть, где доработать вхождение ключей (какие из них увеличить по частоте употребления, а какие – сократить).
2. Закон Ципфа и стоп-слова
Анализ текста по Ципфу покажет и частоту стоп-слов, и Вы будете видеть, количество каких не значимых слов уменьшить, чтобы не получилось так, что заурядный предлог или союз окажется вдруг по частоте употребления на первом месте. Вычитывая текст, заметить это нереально, а вот анализ текста покажет эту проблему в 2 клика.
3. Анализ Ципфа и продвижение сайтов
Проверка текста по Ципфу необходим всем, кто занимается продвижением сайтов. Потому что анализ показывает и уровень естественности всего сайта в целом. Этот показатель также измеряется в процентах. Чем выше показатель, тем скорее поисковики полюбят ваш сайт. Высокий показатель для них будет означать одно: на вашем сайте нет спама. Хорошими будут оценки от 50% и выше, но стремиться надо к максимуму – к 100%. К примеру, анализ сайта показал, что самыми частыми словами, которые блоггер машинально использует, оказались «дети, детей, детям». Но если его блог не о детях, а о семейной психологии, то лучше было бы, чтобы в верхушке самых частых слов оказались вариации слов «психология» и «семья». То есть ему при написании текстов надо будет помнить об этом и использовать варианты слова «дети» реже, а варианты слов «психология» и «семья» чаще.
Закон Хипса в копирайтинге
Очень похож на закон Ципфа, являясь его следствием. Если не влезать в дебри формул, то закон Хипса показывает количество уникальных слов в тексте в зависимости от его длины. Классический график по закону Хипса строится примерно так: по горизонтали – объём текста, по вертикали – количество уникальных слов в тексте. Чем длиннее текст, тем количество уникальных слов должно быть выше. Если этот показатель не повышается, автор начинает лить воду. По графику будет заметно, с какого момента оригинальность текста остановится в развитии.
Сервисы для анализа по Ципфу
Сегодня множество сервисов и ресурсов способны анализировать тексты по закону Ципфа. Наберите в поисковой строке «Проверить текст по закону Ципфа», и высветится несколько ресурсов, где можно будет произвести такой анализ текста бесплатно.
Заключение
Подводя итог, важно отметить, что в современном мире бизнес не может успешно существовать без интернета. А основной информационный источник всемирной паутины – это текст. Для максимальной вовлечённости и заинтересованности целевой аудитории важны качественно написанные тексты. Следуя закону Ципфа, сделать это будет не сложно. Но воспринимайте анализ текста по закону Ципфа без фанатизма. )))
© Ирина Иваськив
Теперь, когда Вам встретится в техническом задании заказчика умная фраза «закон Ципфа», Вы уже не будете паниковать, входить в ступор или отказываться от задания. ))) Закон Ципфа – не такой уж и страшный. Просто на него изрядно нагнали ненужной таинственности. Если понадобится освежить в голове его суть, просто просмотрите эту статью ещё раз. Изучайте копирайтинг вместе с нашими статьями:
- Программы для писателей: обзор самых популярных приложений для творчества на бегу
- Рерайт – изложение с элементами сочинения. Или наоборот?
- Аллитерация или Какие образы рисуют нам волшебные гномы?
Залишити відповідь