ss69100 (ss69100) wrote,
ss69100
ss69100

Category:

Иллюстрации к статье И. Грека „Когда и как создавали национальные языки?”

Есть такой замечательный сайт: „Национальный корпус русского языка”.

Корпус — это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме. Национальный корпус представляет данный язык на определенном этапе (или этапах) его существования и во всём многообразии жанров, стилей, территориальных и социальных вариантов и т. п.

Один из разделов коллекции - Основной корпус:

„...основной корпус, в который входят прозаические (включая драматургию) письменные тексты XVIII — начала XXI века”.

Т.е. теперь возможно проследить момент появления того или иного слова в книгах и рукописях, начиная как минимум с 18 века. Вот давайте и применим данный метод к новой статье Игоря Грека о языках. Ниже пойдут сканы графиков, выдаваемых описываемым сайтом. Обратите внимание не только на дату первого упоминания, но и на значение частоты употребления, что показывают числа на ординате.

Готовы? Поехали!

1. Первое, что мы сделаем - попробуем оценить надёжность инструмента. Возьмём такое слово, как „мать”. Его мы должны встречать с высокой частотой и на протяжении всего охватываемого сайтом периода.


И действительно, начиная с 18 века число письменных источников увеличивается, и мы наблюдаем непрерывное возрастание употребления этого слова. С очень приличной частотой в районе 300 на миллион словоформ в текстах.

2. Следующим проверочным словом возьмём ныне русское „шваль” от фр. „cheval”, лошадь. Нам же рассказывают учёные, что „шваль” вошло в обиход после Отечественной войны с французами 1812 года, значит до этой даты мы слово „шваль” встречать не должны.

И действительно, рост словоупотребления „швали” приходится на послевоенный период. А упоминания до 1812 года возможно отнести к... неточной датировкой источников! Т.е. скорее всего мы видим пример фальсификации исторических источников. Возможно и непреднамеренной.

3. Ещё три примера как в качестве проверки, так и для удовлетворения любознательности. Это Аляска, Калифорния и Канада.

Первые упоминания об Аляске появляются где-то с 1855 года. А когда её продали супостату, нашу Алясочку-то? Да как раз 30 марта 1867 года! Сегодня юбилей - 148 лет.

4. Калифорния. Что, ожидаем схожий с Аляской результат начала словоупотребления? Да не тут-то было! Смотрите:

Где-то уже с 1765 года Калифорния появляется в письменных русских текстах. Тогда как Аляска будет упоминаться лишь через сто лет. Странно это. Если Аляска была русской, то чьей тогда была Калифорния? Википедия пишет, что в Калифорнии „гражданская власть оставалась в руках иезуитов вплоть до роспуска ордена иезуитов в 1768 году”.

Но почему нерусская Калифорния упоминается на сто лет раньше, чем русская Аляска? Может быть это связано с „Русско-американской компанией”, основанной в самом конце 18 века?

Ниже - карта из Британской Энциклопедии издания 1771 года.
Сибирь
Здесь вообще весь Северо-Запад Америки - белое пятно.

5. Впрочем, мы несколько отвлеклись от обозначенной выше задачи. Только посмотрим на Канаду (кстати, упомянутую на карте выше, но лишь как название одной из земель).

Почему мы выбрали Канаду? В Википедии сказано:

„С 1545 года европейские книги и карты обозначали этот регион и все берега реки Св. Лаврентия словом «Канада». Впоследствии это название перешло и на большинство соседних территорий в Северной Америке, управлявшихся Британской империей”.

А в России это слово входит в оборот лишь с 1830 года.

Теперь - языки.

6. Немецкий язык.

Отметим для себя: особо активный всплеск - правление Екатерины II.

7. Голландский появляется лишь в начале 19 века. Да и то, обратите внимание на частоту: сплошные сотые доли, т.е. упоминается он в сто раз реже, нежели немецкий.

8. Та же картина и со шведским языком. Похоже, что немецкий был языком веикулярным, а голландский, шведский и, возможно, другие - диалектами.


9. От норвежского языка сложно было ожидать иной картины, нежели от шведского. Если с последними мы ещё воевали в старину, то кто такие норвежцы???

Кстати, а когда упоминания о варягах появляются?

10. Варяг.

Это - варяг. Максимум частоты - 5,0, первое упоминание - 1682 год.

Посмотрим теперь на множественное число.

11. Варяги.

Частота в два раза выше, упоминается с 1685 года. И снова наблюдаем максимум в екатерининское время.

12. Английский язык.
Упоминается с 1729 года, во время правления Марты Самуиловны Скавронской, иначе - Екатерины I Алексеевны.

13. Теперь посмотрим на братушек. Польский язык.

Частота на порядок выше, чем у шведского, норвежского или голландского языков, но на порядок и ниже, чем у немецкого. И снова пик упоминаний держится в екатерининское время.

14. Болгарский язык.

Частота, как у норвежского, но упоминаться начинает на сто лет позднее.

15. Сербский язык.

И опять вспоминается Екатерина II.

16. О румынском языке всерьёз заговорили лишь в начале прошлого века. Упоминается с 1818 года, причём с той же низкой частотой в 0,01, что голландский или норвежский.

17. Башкирский язык - послереволюционный новодел. Здесь уже сомнений нет никаких.

18. Литовский язык - другое дело. С петровское по всё то же екатерининское время упоминания с той же частотой, что и польский и лишь ненамного уступает английскому.

19. А вот с турецким языком малопонятно. Русские с турками воевали как минимум 12 раз, начиная с 1568 года. Но первое упоминание о языке врага зафиксировано лишь в 1778 г. Да и частота употребления не особо впечатляет: как у болгарского языка. Точно совпадая, кстати.


20. Греческий язык. Ожидаем много-много упоминаний.

А их оказалось ровно столько же, сколько и о литовском. И появились они в одно и то же время, и пик употребления един: петровско-екатерининская эпохи.

21. Иврит.
Тут без Википедии не обойтись.

Между XIII и VII веком до н. э. иврит становится самостоятельным семитским языком, окончательно отделившись от близкородственных ему западносемитских идиомов.”

Конечно, иврит - самый древний язык. Правда, он настолько древен, что носители его попросту подзабыли. Вот и пришлось начинать новую древность, послереволюционную:

22. То же, кстати, и с идишем.

Получается, что на основании мифов был создан и внедрён разговорный еврейский язык. Фактически, созданы два новых мифа.

23. В той же базе данных о русском языке впервые зафиксированное упоминание датируется 1679 годом. Это если искать в современном написании. Частота упоминаний та же, что и о немецком языке.


24. Венгерский язык. Очень показательная кривая. Её неестественная по сравнению с нормальным ходом вещей (ср. с кривой русского или англ. языков) явно говорит о какой-то натянутости, искусственности.


25. Азербайджанский язык. См. график башкирского Один к одному. То же с хинди и урду.

26. Язык любителей хрустящей булки. Французский.

Приличная частотность, почти как у русского языка.

27. Итальянский язык.

По сравнению с французским - маленькая частота упоминаний, первое появляется на полстолетия позже, зато нет всплеска в екатерининский период, ссылки нарастают естественным образом.

28. Испанский язык.

Почти стагнация по числу упоминаний от первого в 1795 году и в течение последующей сотни лет.

29. По упомянутым в статье И. Грека языкам кхмеров и мосарабском не нашлось ни одной ссылки.
***
Как относиться к предъявленным результатам? Они, безусловно, объективны. В этом их огромная ценность. Однако в плане привязки ко временной шкале, особенно до 18 века, точность, безусловно, оставляет желать лучшего. Тем не менее для качественного хронологического анализа пользоваться графиками можно и нужно.

В качестве дополнения к материалам, подобным упомянутой в начале статье И. Грека полученные графики могут служить интересной иллюстрацией.

Tags: русский, статистика, язык
Subscribe

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 17 comments