- Индекс удобочитаемости
-
Индекс удобочитаемости — мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.
Индекс удобочитаемости Флеша
Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка. Она оценивает сложность текста по следующей формуле:
FRE = 206.835 − (1.015 × ASL) − (84.6 × ASW)
где:
- ASL — средняя длина предложения в словах (англ. Average Sentence Length).
- ASW — средняя длина слова в слогах (англ. Average Number of Syllables per Word)[1]
Для английского значение 90-100 соответствует легкому тексту для младших школьников, 60-70 — тексту, который могут читать выпускники школы, тексты с индексом 0-30 предназначены для людей с высшим образованием.
В связи с тем, что в русском языке средняя длина предложения меньше (за счет меньшего использования служебных слов, таких как артикли или вспомогательные глаголы), а слова в среднем длиннее, было предпринято несколько попыток улучшить этот индекс, например, сравнением индексов, полученных для оригинальных английских текстов и их переводов[2]
FRE = 206.835 − (1.3 × ASL) − (60.1 × ASW)
Примечания
Категория:- Корпусная лингвистика
Wikimedia Foundation. 2010.