Всего нами было обработано несколько десятков больших исторических текстов. Во всех случаях, когда тексты описывают события эпохи XVI-XX веков, принцип затухания частот подтвердился. Отсюда вытекает методика хронологически правильного упорядочивания "глав-поколений" в тексте, или в наборе текстов, где этот порядок нарушен или неизвестен. Рассмотрим совокупность "глав-поколений" летописи X и занумеруем их в каком-нибудь порядке. Для каждой "главы" X(Q) подсчитаем число K(Q, T) при заданной нумерации "глав". Все числа K(Q, T), при переменных Q и Т, естественно организуются в квадратную матрицу К{T} размера n*n, где n – общее число "глав". В идеальном теоретическом случае частотная матрица К{T} имеет вид, показанный на рис. 5.13.
На рис. 5.13 ниже главной диагонали стоят нули, на главной диагонали расположен абсолютный максимум в каждой строке. Затем каждый график, в каждой строке, монотонно падает, затухает.
Оказывается, аналогичная картина затухания наблюдается и для столбцов матрицы. Это означает, что частота употребления в "главе" X(Q) имен более раннего происхождения "в среднем" тоже падает по мере удаления поколения Т, породившего эти имена, от фиксированного поколения Q.
Для оценки скорости затухания частот удобно пользоваться усредненным графиком
В этой формуле суммирование выполняется по всем парам (Q, Р), для которых разность Р – Q фиксирована и равна Т. Другими словами, график Ксред (T) получается усреднением матрицы К{Т} по ее диагоналям, параллельным главной. Он изображает "усредненную строку" или "усредненный столбец" частотной матрицы. Здесь Т изменяется от 0 до n – 1.
Конечно, экспериментальные графики могут не совпадать с теоретическим.
Если теперь изменить нумерацию "глав" в летописи, то изменятся и числа K(Q, T), поскольку возникает довольно сложное перераспределение "впервые появившихся имен". Следовательно, меняются частотная матрица К{T} и ее элементы. Будем менять порядок "глав" летописи с помощью различных перестановок s.
Каждый раз вычислим новую частотную матрицу K(sT), где sT – новая нумерация, соответствующая перестановке s. Будем искать такой порядок "глав" летописи, при котором все или почти все графики будут иметь вид, показанный на рис. 5.12. В этом случае экспериментальная частотная матрица K{sT} будет наиболее близка к теоретической матрице на рис. 5.13. Тот порядок "глав" летописи, при котором отклонение экспериментальной матрицы от "идеальной" будет наименьшим, и следует признать хронологически правильным и искомым.
Наш метод также позволяет датировать события. Пусть дан какой-то исторический текст Y, о котором известно только, что он рассказывает о неких событиях из эпохи (А, В), уже описанной в тексте X, разбитом на "главы-поколения", причем порядок этих "глав" в летописи X хронологически правилен. Как узнать, какое именно поколение описано в интересующем нас тексте Y? При этом мы хотим использовать только количественные характеристики текстов, не апеллируя к их смысловому содержанию, которое может быть разным или допускать сильно разнящиеся трактовки.
Ответ таков. Присоединим текст Y к совокупности "глав" хроники X, считая при этом Уновой "главой" и приписав ей какой-то номер Q. Затем установим оптимальный, хронологически правильный порядок всех "глав" получившейся "летописи". При этом мы найдем правильное место и для новой "главы" Y. В простейшем случае, построив для нее график K(Q, T), можно добиться, меняя ее положение относительно других "глав", чтобы этот график был как можно ближе к идеальному. То положение, которое Y займет среди других "глав", и следует признать за искомое. Тем самым мы датируем события, описанные в Y.
Методика применима и тогда, когда рассматриваются не все имена, а только одно или несколько имен, например, какие-либо "знаменитые имена". Но в этом случае требуется дополнительный анализ, поскольку уменьшение числа используемых имен делает результаты неустойчивыми.
Метод был проверен на больших текстах с большим числом имен и с заранее известной достоверной датировкой. Во всех этих случаях эффективность метода подтвердилась.
4. Принцип дублирования частот. Метод обнаружения дубликатов
Настоящий метод является в некотором смысле частным случаем предыдущего, но ввиду важности для датировки мы выделили прием обнаружения дубликатов в отдельный раздел. Этот метод был предложен А. Т. Фоменко. Затем он был существенно развит в серии работ совместно с Г. В. Носовским.