5.2.6. Предположим, что три терминальных таксона связаны некорневым метрическим деревом.
а. Если три длины ребер равны 0.1, 0.2 и 0.3, объясните, почему гипотеза молекулярных часов должна быть неверной, независимо от того, где находится корень.
б. Если длины трех ребер равны 0.1, 0.1 и 0.2, объясните, почему гипотеза о молекулярных часах может быть верной. В случае, когда гипотеза оказывается верна, где должен находиться корень?
в. Если три длины ребер равны 0.1, 0.2 и 0.2, объясните, почему гипотеза молекулярных часов должна быть неверной, независимо от того, где находится корень.
5.2.7. В то время как данные о расстоянии для 3 терминальных таксонов могут точно соответствовать дереву без корней, при наличии 4 (или более) таксонов это обычно невозможно.
а. Нарисуйте некорневое дерево с терминальными таксонами A, B, C и D. Обозначьте длины пяти ребер .
б. Используя для расстояния между терминальными таксонами обозначения типа
, запишите уравнения для каждого из 6 таких расстояний выраженных через
. Объясните, почему, если даны числовые значения расстояний между терминальными таксонами, эти уравнения вряд ли будут иметь точное решение.
в. Приведите такой конкретный пример значений 6 расстояний между терминальными таксонами, чтобы уравнения в части (б) не могли иметь точного решения. Приведите еще один пример значений, для которых уравнения могут быть решены.
5.2.8. Известен ряд различных мер для оценки степени согласованности между данными о расстояниях и метрическими деревьями. Пусть
обозначает расстояние между таксонами
и , полученное из экспериментальных данных, а обозначает расстояние, полученное при обходе от до вдоль дерева. Во второй половине прошлого века были предложены следующие три меры:
(Фитч и Марголиаш, 1967)
(Фаррис, 1972)
(Татено и др. , 1982)
Во всех этих мерах суммы включают слагаемые для каждой отдельной пары таксонов
и .а. Вычислите эти меры для дерева, построенного в разделе, используя FM- алгоритм, а также дерева, построенного из тех же данных с помощью UPGMA в задаче 5.2.3. Согласно каждому из этих показателей, какое из двух деревьев лучше подходит для данных?
б. Объясните, почему эти формулы разумно использовать для оценки соответствия. Объясните, как различия между формулами делают их более или менее чувствительными к различным типам ошибок.