В кластеры заключены объекты, по поводу которых некоторые из исходных ранжировок противоречат
друг другу. Для их упорядочения необходимо провести новые исследования. Эти исследования могут быть как формально—математическими (например, вычисление медианы Кемени, упорядочения по средним рангам или по медианам и т. п.), так и требовать привлечения новой информации из соответствующей прикладной области, возможно, проведения дополнительных научных или прикладных работ.Введем необходимые понятия, затем сформулируем алгоритм согласования кластеризованных ранжировок в общем виде и рассмотрим его свойства.
Пусть имеется конечное число объектов, которые мы для простоты изложения будем изображать натуральными числами 1,2,3,…,k и называть «носителем». Под кластеризованной ранжировкой, определенной на заданном носителе, понимаем следующую математическую конструкцию
. Пусть объекты разбиты на группы, которые будем называть кластерами. В кластере может быть и один элемент. Входящие в один кластер объекты будем заключать в фигурные скобки. Например, объекты 1,2,3,…,10 могут быть разбиты на 7 кластеров: {1}, {2,3}, {4}, {5,6,7}, {8}, {9}, {10}. В этом разбиении один кластер {5,6,7} содержит три элемента, другой – {2,3} – два, остальные пять – по одному элементу. Кластеры не имеют общих элементов, а объединение их (как множеств) есть все рассматриваемое множество объектов.Вторая составляющая кластеризованной ранжировки – это строгий линейный порядок между кластерами
. Задано, какой из них первый, какой второй, и т. д. Будем изображать упорядоченность с помощью знака <. При этом кластеры, состоящие из одного элемента, будем для простоты изображать без фигурных скобок. Тогда кластеризованную ранжировку на основе введенных выше кластеров можно изобразить так: А = [1 < {2,3} < 4 < {5,6,7} < 8 < 9 < 10]. Конкретные кластеризованные ранжировки будем заключать в квадратные скобки. Если для простоты речи термин «кластер» применять только к кластеру не менее чем из 2–х элементов, то можно сказать, что в кластеризованную ранжировку А входят два кластера {2,3} и {5,6,7} и 5 отдельных элементов.Введенная описанным образом кластеризованная ранжировка является бинарным отношением на множестве {1,2,3,…,10}. Его структура такова. Задано отношение эквивалентности с 7–ю классами эквивалентности, а именно, {2,3}, {5,6,7}, а остальные состоят из оставшихся 5 отдельных элементов. Затем введен строгий линейный порядок между классами эквивалентности. Введенный математический объект известен в литературе как «ранжировка со связями»
(М. Холлендер, Д.Вулф), «упорядочение» (Дж. Кемени, Дж. Снелл), «квазисерия» (Б.Г.Миркин), «совершенный квазипорядок» (Ю.А. Шрейдер). Учитывая разнобой в терминологии, мы ввели термин «кластеризованная ранжировка», поскольку в нем явным образом названы основные элементы изучаемого математического объекта – кластеры, рассматриваемые на этапе согласования ранжировок как классы эквивалентности, и ранжировка – строгий совершенный порядок между ними.Следующее важное понятие – противоречивость
. Оно определяется для четверки – две кластеризованные ранжировки на одном и том же носителе и два различных объекта – элементы того же носителя. При этом два элемента из одного кластера будем связывать символом равенства =, как эквивалентные.Пусть А и В – две кластеризованные ранжировки. Пару объектов (a,b) назовем «противоречивой» относительно А и В, если эти два элемента по—разному упорядочены в А и В, т. е. a < b в А и a > b в В (первый вариант противоречивости) либо a >b в А и a < b в В (второй вариант противоречивости).
Отметим, что в соответствии с этим определением пара объектов (a,b), эквивалентная хотя бы в одной кластеризованной ранжировке, не может быть противоречивой: a = b не образует «противоречия» ни с a < b , ни с a > b.