Общее количество в 28 миллионов записей характеризует всё наличие учтённых сведений в обработанных документах основных массивов данных, включая повторы записей по отдельно взятым лицам. Одни и те же лица могут быть указаны в нескольких источниках сведений.
Сколько может быть повторов записей в ОБД в сведениях ЦАМО РФ и ЦВМА (23 038 600 записей)? Если оценивать массивы данных о потерях из войсковых частей РККА (9 078 395 + 1 203 654 записи) и документы, уточняющие потери (8 109 860 записей), то их пересекаемость (повторность), по опыту работы с ними в течение десятков лет, может быть в пределах максимум до 15 %. Уточняющие сведения в подавляющей своей массе являются уникальными и меньше первых всего лишь на 21 %.
Откуда исходит повторность в этих массивах данных? Например, воин погиб, в/ч донесла о нем по инстанции, но не выслала извещение. Семья сделала запрос через райвоенкомат (далее РВК) в Управление по учёту погибшего и пропавшего без вести рядового и сержантского состава (далее Управление), оттуда пришел ответ, что воин числится убитым, после чего РВК выписал извещение семье на основании ответа Управления. Т. е. донесение об утрате есть и от в/ч, и от РВК. Либо в случаях, когда извещения из в/ч по ошибке высылались не в те регионы, откуда были родом воины, и были возвращены облвоенкоматами в Управление. Либо сообщение органов правосудия дополняло сведения из в/ч. Это и есть суть пересекаемости сведений данных массивов, которая с небольшими вариациями описывает явление.
Особо следует коснуться сведений из ЦВМА по погибшим и пропавшим без вести морякам. Оцифрованы три источника документов: донесения в/ч, сводная картотека потерь, флотские картотеки потерь. По опыту работы с ними можно сказать о том, что все они дублируют друг друга, но есть и отличия, дающие дополнения к тем или иным персоналиям. Приращение количества персоналий в зависимости от вида документов мизерное. Поэтому повторность сведений в ВМФ тройная, т. е. при количестве 454 107 записей в ОБД мы на самом деле имеем данные о примерно 150 000 воинов, утраченных на флоте. Это число стыкуется с официальным числом флотских потерь в 153 741 чел. («Великая Отечественная без грифа секретности. Книга потерь», М.: «Вече», 2010, с. 256). Качество учёта личного состава на флоте оказалось существенно выше, чем в армии, ибо там сверить боевой и численный состав (далее БЧС) в/ч с потерями гораздо проще. В армии таким же состоянием учёта потерь и сверки с БЧС похвалиться нельзя. И об этом чуть позже будет сказано.
Очевидно, что другие массивы сведений (пп. 5, 6, 7) по сравнению с упомянутыми являются в большинстве повторными, хотя и не без исключений. Действительно, данные каждого из них могут не менять сути известных сведений четырёх основных массивов, но также могут уточнить судьбу конкретно взятого воина. Они могут быть уникальными, т. е. в документах никакой другой инстанции воин не «засветился». Поэтому столь ценно в ОБД наличие информации из многочисленных источников, которую можно рассматривать в комплексе.
При оценке качества имеющейся информации предположим, что количество повторов по массивам данных (пп. 1 и 4) составляет не более 15 %:
а) из записей донесений о безвозвратных потерях воинских частей (9 078 395 записей) вычтем 15 %, получим 7 716 636 уникальных записей;
б) по уточняющим сведениям (8 109 860 записей) отнимем 15 %, получим 6 893 381 уникальную запись.
Заметим, что отсев «на повторы» забирает численность в 2 578 238 чел., а это 52 полновесные общевойсковые армии, исходя из численности в 50 000 чел. Уже на этой стадии можно предположить о том, что планка в 15 % повторов несколько завышена. О том же подсказывает и ежедневная практика работы в ОБД с конкретными персоналиями. Тем не менее ради чистоты анализа для отсева воспользуемся пока именно этой величиной.
Из записей по книгам учёта умерших госпиталей и медсанбатов (1 203 654 записи) вычитаем около 40 % в связи с тем, что учёт в книгах погребения и умерших примерно на эту величину продублирован в донесениях о потерях госпиталей и медсанбатов, поэтому оставляем 722 193 записи для дальнейшего анализа.
По ВМФ мы уже выяснили численность уникальных записей, примем официальную величину их в 153 741.
В сумме получаем 7 716 636 + 6 893 381 + 722 193 + 153 741 = 15 485 951
.Соответственно, остальные записи от их количества в ОБД на январь 2009 г., возможно, являются повторными: 23 038 600–15 485 951 = 7 552 649 записей.
Понятно, что никто из нас и наших воевавших солдат не застрахован от писарских огрехов и деяний творческих машинисток, которые могли Ивана Ивановича Иванова превратить в донесениях в кого угодно, но не в настоящего Иванова. От этого не подстраховаться. Не будет натяжкой считать, что в отсеянном огромном количестве записей их «изыски» учтены и мы вправе продолжить исследование дальше.