мера1

ss69100


К чему стадам дары свободы...

Восстановление смыслов


Предыдущий пост Поделиться Следующий пост
Частотная статистика русского языка
мера1
ss69100

Некоторые статистические данные об использовании русских слов


  • Средняя длина слова 5,3 символа.

  • Средняя длина предложения 10,4 слова.

  • 1000 наиболее частотных лемм покрывает 64,1% текста.

  • 2000 наиболее частотных лемм покрывают 75,0% текста.

  • 3000 наиболее частотных лемм покрывают 76,5% текста.

  • 5000 наиболее частотных лемм покрывают 82,1% текста.

***


Отсюда.


  • 1
а от солнца до земли 150.000.000 километров
Не кажется идиотизмом приводить абсолютные данные, которые ничего не говорят обычному человеку?
Или недоступно понимаю то, что выражено в затасканной поговорке "Всё познаётся в сравнении"?
О чем эти цифры? Что такое "частотные лексемы"? как и с какой стороны они характеризуют язык? как обстоят дела с этим в других языках?

Или вывалить очередной "обрывок из отрывка" как самоцель застит разум?

Не кажется.

Кроме того, в мире есть много такого, что ничего не говорит обычному человеку. И что? Запретить пытливым умам познавать мир???

  • 1
?

Log in

No account? Create an account