Читаем Новая хронология Греции полностью

Типичным примером первой ситуации (отсутствие стабилизации с ростом объема выборки) является эволюция параметра 1 — количества слов в предложении (рис. 2). Отчетливо видно, что даже при объеме выборок в 16000 слов кривые хаотичны, сильно перемешаны и размах колебаний слишком велик.

Типичным примером второй ситуации ("слипание всех писателей") является поведение параметра 2 — количества слогов в слове (рис. 3). Хотя при объеме выборок в 16000 слов кривые начинаются выпрямляться, стабилизироваться, однако все траектории практически сливаются друг с другом, слипаются, что делает невозможным различение авторов.

Аналогичная картина наблюдается и для параметров 4,5,6,7,8,9. Например, кривые параметра 9 не стабилизируются и перемешиваются. Поведение параметра 8 похоже на поведение параметра 2 — хотя при большом объеме выборок кривые выравниваются, однако они становятся очень близкими друг к другу, стремятся к одному и тому же значению, определяемому, следовательно, общими законами русского языка, а не индивидуальными особенностями писателя.

На этом основании нам представляется крайне сомнительным использование параметров 1,2,4,5,6,7,8,9 для различения авторов.

8. ЧАСТОТА УПОТРЕБЛЕНИЯ СЛУЖЕБНЫХ СЛОВ ОКАЗЫВАЕТСЯ АВТОРСКИМ ИНВАРИАНТОМ

Замечательным исключением является параметр 3 — частота употребления всех служебных слов — ПРЕДЛОГОВ, СОЮЗОВ И ЧАСТИЦ. Эволюция этого параметра в зависимости от роста объема выборки показана на рис. 4, 5,6,7.

В список служебных слов мы внесли следующие слова:

ПРЕДЛОГИ — в, на, с, за, к, по, из, у, от, для, во, без, до, о, через, со, при, про, об, ко, над, из-за, из-под, под.

СОЮЗЫ — и, что, но, а, да, хотя, когда, чтобы, если, тоже, или, то есть, зато, будто.

ЧАСТИЦЫ — не, как, же, даже, бы, ли, только, вот, то, ни, лишь, ведь, вон, то-есть, нибудь, уже, либо.

Итого — 55 служебных слов. Хотя список неполон, он оказался вполне достаточным для различения авторов.

ВАЖНЫЙ ЭКСПЕРИМЕНТАЛЬНЫЙ ФАКТ.

1) При величине выборок в 16000 слов процентное содержание служебных слов для каждого автора из нашего списка (за исключением одного писателя, о котором речь пойдет ниже) оказалось приблизительно постоянным вдоль всех его произведений, т. е. частотный график изображается практически горизонтальной прямой. Эта стабилизация происходит для всех 22 писателей (из 23 исследованных). См. рис. 7.

2) Разность между максимальным и минимальным значениями параметра 3 (минимум и максимум взяты по всем исследованным писателям) значительно больше амплитуды его колебаний внутри произведений отдельных авторов. Амплитуда колебаний параметра 3 по разным писателям достаточно велика — от 19 % до 27,5 %. См. рис. 7. Отсюда следует, что параметр 3 хорошо различает многих авторов.

На этом основании назовем параметр 3 — АВТОРСКИМ ИНВАРИАНТОМ.

Он может служить для атрибуции неизвестных произведений и для обнаружения плагиата, хотя и с определенной осторожностью, поскольку мы обнаружили писателей с очень близкими авторскими инвариантами, например, Фонвизин Д.И. и Толстой Л.Н. (см. ниже). Кроме того, для достаточно уверенных выводов нужны тексты большого объема.

Главным выводом здесь является нетривиальное утверждение о существовании авторского инварианта русских литературнрых текстов. Было бы интересно продолжить эксперименты с целью обнаружения других авторских инвариантов.

Подчеркнем, что подобные выводы можно делать только после проведения обширного вычислительного эксперимента. Лишь после того, как будет экспериментально доказано, что тот или иной параметр действительно стабилизируется внутри произведений каждого писателя, можно считать, что мы обнаружили инвариант. Причем обработанный список авторов должен быть достаточно велик по крайней мере несколько десятков. Строить же какие либо теории лишь на основе сравнения текстов одного или двух писателей — по нашему мнению необоснованно.

Интересно, что обнаруженный нами авторский инвариант практически не зависит от временной эпохи: в указанном списке авторов представлены писатели трех веков — от XVIII до XX.

9. ЧИСЛЕННЫЕ ПРИМЕРЫ

Поскольку, как выяснилось, основной интерес представляют графики для выборок в 16000 слов, то ограничимся именно этим случаем.

Для произведений И.С.Тургенева и Л.Н.Толстого приведем таблицу значений следующих параметров:

3 — количество всех служебных слов (в процентах),

1 — количество слов в предложении,

2 — количество слогов в слове,

9 — количество служебных слов в предложении,

7 — количество предлога "в" (в процентах),

8 — количество частицы "не" (в процентах). -параметры:! 3! 1! 2! 9! 7! 8! — ТУРГЕНЕВ 22,01 11,26 2,17 2,44 2,36 2,19

22,36 15,58 2,16 3,49 2.05 1,87

22,38 13,35 2,21 3,04 —-среднее знач. 22,24 13,40 2,17 2,98 2,20 2,04 отклонение 0,016 0,322 0,023 0,35 0,14 0,16 —параметры:! 3! 1! 2! 9! 7! 8! — ТОЛСТОЙ 23,67 13,13 2,11 3,09 2,10 2.05

23,34 20,75 2,15 4,79 2,56 1,72

23,45 14,27 2,28 3,35 2,38 1,67

23,58 18,93 2,16 4,62 2,46 1,87

23,78 14,86 2,15 3,64 2,74 1,88

Перейти на страницу:

Похожие книги

Абсолютное зло: поиски Сыновей Сэма
Абсолютное зло: поиски Сыновей Сэма

Кто приказывал Дэвиду Берковицу убивать? Черный лабрадор или кто-то другой? Он точно действовал один? Сын Сэма или Сыновья Сэма?..10 августа 1977 года полиция Нью-Йорка арестовала Дэвида Берковица – Убийцу с 44-м калибром, более известного как Сын Сэма. Берковиц признался, что стрелял в пятнадцать человек, убив при этом шестерых. На допросе он сделал шокирующее заявление – убивать ему приказывала собака-демон. Дело было официально закрыто.Журналист Мори Терри с подозрением отнесся к признанию Берковица. Вдохновленный противоречивыми показаниями свидетелей и уликами, упущенными из виду в ходе расследования, Терри был убежден, что Сын Сэма действовал не один. Тщательно собирая доказательства в течение десяти лет, он опубликовал свои выводы в первом издании «Абсолютного зла» в 1987 году. Терри предположил, что нападения Сына Сэма были организованы культом в Йонкерсе, который мог быть связан с Церковью Процесса Последнего суда и ответственен за другие ритуальные убийства по всей стране. С Церковью Процесса в свое время также связывали Чарльза Мэнсона и его секту «Семья».В формате PDF A4 сохранен издательский макет книги.

Мори Терри

Публицистика / Документальное
«Рим». Мир сериала
«Рим». Мир сериала

«Рим» – один из самых масштабных и дорогих сериалов в истории. Он объединил в себе беспрецедентное внимание к деталям, быту и культуре изображаемого мира, захватывающие интриги и ярких персонажей. Увлекательный рассказ охватывает наиболее важные эпизоды римской истории: войну Цезаря с Помпеем, правление Цезаря, противостояние Марка Антония и Октавиана. Что же интересного и нового может узнать зритель об истории Римской республики, посмотрев этот сериал? Разбираются известный историк-медиевист Клим Жуков и Дмитрий Goblin Пучков. «Путеводитель по миру сериала "Рим" охватывает античную историю с 52 года до нашей эры и далее. Все, что смогло объять художественное полотно, постарались объять и мы: политическую историю, особенности экономики, военное дело, язык, имена, летосчисление, архитектуру. Диалог оказался ужасно увлекательным. Что может быть лучше, чем следить за "исторической историей", поправляя "историю киношную"?»

Дмитрий Юрьевич Пучков , Клим Александрович Жуков

Публицистика / Кино / Исторические приключения / Прочее / Культура и искусство
Управление будущим
Управление будущим

Георгий Почепцов – доктор филологических наук, профессор, автор пятидесяти книг на тему информационных войн, пропаганды, теории коммуникации, информационных и коммуникативных технологий. Заслуженный журналист Украины, член Национального союза писателей. В издательстве «Фолио» вышли его книги «Пропаганда 2.0» и «Виртуальные войны. Фейки». В мире наступил период, когда меняются не только правила управления, как это было после Первой мировой войны, когда появилась Лига наций, и после Второй, когда появилась ООН. Страна, которая строит будущее, будет жить по своим правилам. Страна, которая не делает этого, будет жить по чужим, поскольку она будет строить будущее для кого-то другого. Будущее интересно в первую очередь военным, мировым нефтяным и газовым компаниям и государствам в сфере энергетики. Все эти сферы больше других зависят от будущего. Но сегодня будущее повлияет на жизнь каждого, поскольку все будут зависимы от роботизации и развития искусственного интеллекта, так как исчезнет множество профессий.

Георгий Георгиевич Почепцов

Публицистика