Напомним, какова последовательность операций при построении теоретической «языковой» (вероятностной) модели стиха по Б. Томашевскому — А. Колмогорову. Исходными данными служат (1) «ритмический словарь», рассчитанный по художественной прозе данного языка и показывающий, какую часть всего словаря писателя составляют слова односложные, двухсложные с ударением на 1‐м слоге, двухсложные с ударением на 2‐м слоге и т. д., т. е. какова вероятность появления в тексте каждого ритмического типа слов; (2) полный список всех словосочетаний, возможных в данном стихотворном размере: всех его ритмических вариаций (с различным расположением ударений) и для каждой из них — всех словораздельных вариаций (с различным расположением словоразделов). Далее (3), для каждого из этих словосочетаний производится перемножение вероятностей входящих в него ритмических типов слов: это дает вероятность появления в тексте данного словосочетания в целом; потом (4) все полученные произведения складываются: это дает общую вероятность случайного появления в прозаическом тексте «самородной» строки нашего размера. И наконец (5), в процентах от этой общей суммы мы определяем долю каждого слагаемого или группы слагаемых (все словосочетания с ударением на таком-то слоге, со словоразделом после такого-то слога и т. п.). Это и будут теоретические частоты данных стиховых форм нашего размера. С ними сравниваются действительные частоты этих форм в изучаемом стихе: если показатели сходятся, стало быть, данная форма для поэтов безразлична и употребительность ее определяется только особенностями языка; если показатели расходятся, стало быть, данная форма поэтами предпочитается или избегается и перед нами — специфическая тенденция стиха, подлежащая изучению.
Таким образом, начинать исследование стиха приходится с расчета, во-первых, ритмического словаря прозы и, во-вторых, перечня всех словосочетаний, возможных в данном размере.
Результаты подсчетов состава ритмического словаря итальянской и испанской прозы (до 0,01) приведены в таблице 1. Для итальянской прозы подсчет делался по 2000 фонетических слов из 10 прозаиков разных веков (Боккаччо, Саккетти, Банделло, Граццини, Гоцци, Альфьери, Пеллико, Кардуччи, Верга, Д’ Аннунцио), по 200 слов из каждого. Все данные по отдельным выборкам оказались очень близкими. Любопытно, что контрольный подсчет по прозе Данте — первая тысяча слов из «Новой жизни» — дал несколько иные цифры: средняя длина слова y Данте 3,19 слога вместо 3,11, a процент женских окончаний 63 вместо 59. Может быть, Данте в своей прозе избегал столкновения гласных на стыке слов? Но при дальнейших перемножениях частот для построения модели эта разница исходного материала сглаживается, и модель стиха, построенная по «Новой жизни», почти не отличается от модели, построенной по 10 прозаикам (поэтому мы ее здесь не приводим). Для испанской прозы подсчет делался по 1000 слов из «Дон Кихота» (ч. 1, гл. 8). Для русской прозы были взяты данные по 10 000 слов советской прозы, которыми мы пользовались ранее[501]
.Принципы тонирования итальянского текста (и в стихах, и в прозе) еще недостаточно установлены: итальянские исследователи склонны все двойственные слова считать ударными, иноязычные исследователи — безударными[502]
. Мы старались держаться середины. Безударными мы считали односложные и двусложные артикли, предлоги, союзы, личные местоимения перед глаголами, вспомогательные глаголы и притяжательные местоимения единственного числа (последние категории — только при прямом порядке и контактном расположении слов: