Skip to the content.

Е и ё в русской рифме

В поэтическом корпусе НКРЯ во всех словах, написание которых допускает ё, использована буква е. Это связано с тем, что тексты для корпуса были взяты из изданий серии «Библиотека поэта», в которых изначально отсутствовала буква ё. Кроме того, имеет место произношение [е] на месте [о] в заимствованных словах из церковнославянского, что отражает исторические особенности поэтической традиции, например, звезднойбездны. Такое произношение уходит из привычной поэтической речи в инструментарий нарочитой архаизации в первой трети XIX века. Реальный процесс перехода к новому поэтическому языку происходил примерно в 1820‑х годах.

Для автоматического распознавания рифм было важно определиться с точной датой перехода от одного типа рифм к другим, так как для поздних рифм мы использовали автоматическую проверку слов, в которых присутствует гласный е по словарю слов с ё Чумакова (Употребление буквы Ё. Словарь-справочник. — М.: Народное образование, 2009).

Чтобы определить точный год смены парадигмы, мы выгрузили все рифмы с буквой е в позиции ударения в период с 1820‑го по 1840‑й год. Всего таких рифменных пар было 49 840. Далее все такие рифменные пары мы разметили вручную, отмечая:

  1. Использована ли буква е на месте современной ё, то есть образована ли рифма ударным гласным [е] (изображеннымблаженным);
  2. Произносится ли в обоих случаях [о] на месте буквы е, то есть образована ли рифма ударным гласным [о] (найдетлед).

По умолчанию, мы считали, что глагольные формы на -ет, в которых произносится [о] (печет, кладет), не могли произноситься с гласным [е], равно как и местоимения ее, нее и тому подобные.

По результатам разметки мы сформировали таблицу, где для каждого года выписали два значения — процент рифм с ударным гласным [е], процент рифм с ударным гласным [о]. По полученным значениям мы построили график.

Image

На графике точки пересечения линий приходятся на несколько периодов, однако логично предположить, что истинной точкой перехода является 1828‑й год. Остальные выбросы можно считать случайными за счет некоторого несбалансированного фактора (например, из‑за превалирования стихотворений некого автора в определенном году). Случайность выбросов также доказывается сглаженными линиями на графике, построенными по усредненным значениям.

Таким образом, 1828‑й год был выбран точкой изменения в работе программы. После 1828‑го года происходит проверка слов с буквой е под знаком ударения в словаре слов с ё. Для достижения наибольшей точности можно было бы использовать ручную разметку, например, с привлечением краудсорсинга. Однако в настоящем исследовании мы ставили цель достичь наибольшей полноты, а не точности анализа, а кроме того, исходные данные корпуса были переданы нам конфиденциально. По этим причинам мы отказались от ручной разметки и считали, что для наших задач достаточно только автоматической разметки.