Хорошо, я знаю, что Mergesort имеет наихудшее время тета (NlogN), но его накладные расходы высоки и проявляются в нижней части дерева рекурсии, где выполняются слияния. Кто-то предложил остановить рекурсию, как только размер достигнет K, и в этот момент переключиться на сортировку вставками. Мне нужно доказать, что время работы этого модифицированного рекуррентного соотношения равно тета (NK + Nlog (N/k))? Я не знаю, как подойти к этой проблеме.
Докажите, что время работы оптимизированной сортировки слиянием равно тета (NK + Nlog (N/K))?
Ответы (1)
Возможно, хорошим началом будет рассмотрение рекуррентного соотношения для этой задачи. Я предполагаю, что для типичной сортировки слиянием это будет выглядеть примерно так:
T(N) = 2 * T(N / 2) + N
то есть вы делите проблему на 2 подзадачи половинного размера, а затем выполняете N работы (слияние). У нас есть базовый случай, который занимает постоянное время.
Моделируя это как дерево, мы имеем:
T(N) = N -> T(N / 2)
-> T(N / 2)
= N -> (N / 2) -> T(N / 4)
-> T(N / 4)
-> (N / 2) -> T(N / 4)
-> T(N / 4)
Это дает расширение
T(N) = N + 2N/2 + 4N/4 + ...
= N + N + N ...
Так что на самом деле нам просто нужно увидеть, насколько глубоко это идет. Мы знаем, что i
уровень оперирует подзадачами N / 2^i
размера. Таким образом, наши конечные узлы (T(1)
) находятся на уровне L
, где N / 2^L = 1
:
N / 2^L = 1
N = 2^L
log N = log(2^L)
log N = L
Итак, наше время выполнения N log N
.
Теперь введем сортировку вставками. Наше дерево будет выглядеть примерно так
T(N) = ... -> I(K)
-> I(K)
...x N/K
Другими словами, нам придется на каком-то уровне L
решить N/K
задач сортировки вставками размера K
. Сортировка вставками имеет наихудшее время выполнения K^2
. Таким образом, на листьях у нас всего много работы:
(N / K) * I(K)
= (N / K) * K * K
= N * K
Но у нас также есть куча слияний, стоимость которых составляет N
за уровень дерева, как объяснялось ранее. Возвращаясь к нашему предыдущему методу, давайте найдем L
(количество уровней, прежде чем мы достигнем подзадач размера K
и, таким образом, переключимся на вставку):
N / 2^L = K
N / K = 2^L
L = log (N/K)
Итак, в сумме имеем
O(N) = N * K + N * log (N/K)
Прошло слишком много времени с тех пор, как я использовал алгоритмы, чтобы дать вам набросок доказательства, но это должно заставить ваши нейроны активироваться.