Математические модели в естественнонаучном образовании. Том II - страница 18

Шрифт
Интервал




Рисунок 5.16. Дерево с соседями  и .

Таким образом, выбор ближайших таксонов для присоединения ввел заблуждение; нужен более сложный критерий выбора таксонов для присоединения. Чтобы изобрести его, представьте себе дерево, в котором таксоны  и  являются соседями, соединенными в вершине , а

 каким-то образом соединена с оставшимися таксонами
, как показано на рисунке 5.16.

Если данные точно соответствуют этому метрическому дереву, то для каждого

, дерево будет включать поддерево, подобное изображенному на рисунке 5.17.



Рисунок 5.17. Поддерево дерева на рисунке 5.16.

Но на этом рисунке видим, что

, так как в сумму слева входят только длины четырех ребер, отходящих от листьев дерева, а в сумму справа – все они и, кроме того, удвоенная длина центрального ребра. Это неравенство называется 4-точечным условием для соседей. Если  и  являются соседями, то неравенство верно для любых значений
 из диапазона от 3 до
.

Условие 4-точек лежит в основе метода присоединения соседей, но предстоит еще много работы, чтобы перевести его в простую для применения форму. Для фиксированного  существует

 возможных значения  удовлетворяющих условию
 при
. Если просуммировать 4-точечные неравенства по этим , то получим следующее неравенство, содержащее сумму расстояний
.

Чтобы упростить это неравенство, определим общее расстояние от таксона  до всех других таксонов как

, где расстояние
 в сумме интерпретируется как 0, естественным образом. Затем, добавление
 к каждой стороне исходного неравенства позволяет записать его в более простой форме следующим незамысловатым образом
.

Вычитание

 из частей неравенство придает ему ещё более симметричную форму
.

Наконец, если рассмотреть эту последовательность действий для произвольных  и , а не только для

 и
, то можно ввести обозначение
.

Тогда, если

 и
 являются соседями, то имеет место
 для всех
.

Это дает критерий, используемый в методе присоединения соседей: из данных расстояний

, заполоняется новая таблица значений . Затем для соединения выбирается пара таксонов с наименьшим значением
. Приведенный выше вывод формулы для вычисления  показывает, что если
 и
 являются соседями, то соответствующее им значение
 будет наименьшим из значений в
-й строке,
-м столбце таблицы. Более глубокий анализ, который провели Штудер и Кеплер в 1988 году, показывает, что если данные идеально подходят к дереву, то наименьшая запись во всей таблице значений