Алгоритм нахождения корня полинома в замкнутой форме

Я ищу надежный алгоритм (или документ с описанием алгоритма), который может находить корни многочленов (в идеале до 4-го дебри, но подойдет все) с использованием решения в закрытой форме. Меня интересуют только настоящие корни.

Мой первый подход к решению квадратных уравнений включал это (у меня также есть код в аналогичном стиле для кубиков / квартик, но давайте прямо сейчас сосредоточимся на квадратиках):

/**
 *  @brief a simple quadratic equation solver
 *
 *  With double-precision floating-point, this reaches 1e-12 worst-case and 1e-15 average
 *  precision of the roots (the value of the function in the roots). The roots can be however
 *  quite far from the true roots, up to 1e-10 worst-case and 1e-18 average absolute difference
 *  for cases when two roots exist. If only a single root exists, the worst-case precision is
 *  1e-13 and average-case precision is 1e-18.
 *
 *  With single-precision floating-point, this reaches 1e-3 worst-case and 1e-7 average
 *  precision of the roots (the value of the function in the roots). The roots can be however
 *  quite far from the true roots, up to 1e-1 worst-case and 1e-10 average absolute difference
 *  for cases when two roots exist. If only a single root exists, the worst-case precision is
 *  1e+2 (!) and average-case precision is 1e-2. Do not use single-precision floating point,
 *  except if pressed by time.
 *
 *  All the precision measurements are scaled by the maximum absolute coefficient value.
 *
 *  @tparam T is data type of the arguments (default double)
 *  @tparam b_sort_roots is root sorting flag (if set, the roots are
 *      given in ascending (not absolute) value; default true)
 *  @tparam n_2nd_order_coeff_log10_thresh is base 10 logarithm of threshold
 *      on the first coefficient (if below threshold, the equation is a linear one; default -6)
 *  @tparam n_zero_discriminant_log10_thresh is base 10 logarithm of threshold
 *      on the discriminant (if below negative threshold, the equation does not
 *      have a real root, if below threshold, the equation has just a single solution; default -6)
 */
template <class T = double, const bool b_sort_roots = true,
    const int n_2nd_order_coeff_log10_thresh = -6,
    const int n_zero_discriminant_log10_thresh = -6>
class CQuadraticEq {
protected:
    T a; /**< @brief the 2nd order coefficient */
    T b; /**< @brief the 1st order coefficient */
    T c; /**< @brief 0th order coefficient */
    T p_real_root[2]; /**< @brief list of the roots (real parts) */
    //T p_im_root[2]; // imaginary part of the roots
    size_t n_real_root_num; /**< @brief number of real roots */

public:
    /**
     *  @brief default constructor; solves for roots of \f$ax^2 + bx + c = 0\f$
     *
     *  This finds roots of the given equation. It tends to find two identical roots instead of one, rather
     *  than missing one of two different roots - the number of roots found is therefore orientational,
     *  as the roots might have the same value.
     *
     *  @param[in] _a is the 2nd order coefficient
     *  @param[in] _b is the 1st order coefficient
     *  @param[in] _c is 0th order coefficient
     */
    CQuadraticEq(T _a, T _b, T _c) // ax2 + bx + c = 0
        :a(_a), b(_b), c(_c)
    {
        T _aa = fabs(_a);
        if(_aa < f_Power_Static(10, n_2nd_order_coeff_log10_thresh)) { // otherwise division by a yields large numbers, this is then more precise
            p_real_root[0] = -_c / _b;
            //p_im_root[0] = 0;
            n_real_root_num = 1;
            return;
        }
        // a simple linear equation

        if(_aa < 1) { // do not divide always, that makes it worse
            _b /= _a;
            _c /= _a;
            _a = 1;

            // could copy the code here and optimize away division by _a (optimizing compiler might do it for us)
        }
        // improve numerical stability if the coeffs are very small

        const double f_thresh = f_Power_Static(10, n_zero_discriminant_log10_thresh);
        double f_disc = _b * _b - 4 * _a * _c;
        if(f_disc < -f_thresh) // only really negative
            n_real_root_num = 0; // only two complex roots
        else if(/*fabs(f_disc) < f_thresh*/f_disc <= f_thresh) { // otherwise gives problems for double root situations
            p_real_root[0] = T(-_b / (2 * _a));
            n_real_root_num = 1;
        } else {
            f_disc = sqrt(f_disc);
            int i = (b_sort_roots)? ((_a > 0)? 0 : 1) : 0; // produce sorted roots, if required
            p_real_root[i] = T((-_b - f_disc) / (2 * _a));
            p_real_root[1 - i] = T((-_b + f_disc) / (2 * _a));
            //p_im_root[0] = 0;
            //p_im_root[1] = 0;
            n_real_root_num = 2;
        }
    }

    /**
     *  @brief gets number of real roots
     *  @return Returns number of real roots (0 to 2).
     */
    size_t n_RealRoot_Num() const
    {
        _ASSERTE(n_real_root_num >= 0);
        return n_real_root_num;
    }

    /**
     *  @brief gets value of a real root
     *  @param[in] n_index is zero-based index of the root
     *  @return Returns value of the specified root.
     */
    T f_RealRoot(size_t n_index) const
    {
        _ASSERTE(n_index < 2 && n_index < n_real_root_num);
        return p_real_root[n_index];
    }

    /**
     *  @brief evaluates the equation for a given argument
     *  @param[in] f_x is value of the argument \f$x\f$
     *  @return Returns value of \f$ax^2 + bx + c\f$.
     */
    T operator ()(T f_x) const
    {
        T f_x2 = f_x * f_x;
        return f_x2 * a + f_x * b + c;
    }
};

Код ужасен, и я ненавижу все пороги. Но для случайных уравнений с корнями в интервале [-100, 100] это не так уж и плохо:

root response precision 1e-100: 6315 cases
root response precision 1e-19: 2 cases
root response precision 1e-17: 2 cases
root response precision 1e-16: 6 cases
root response precision 1e-15: 6333 cases
root response precision 1e-14: 3765 cases
root response precision 1e-13: 241 cases
root response precision 1e-12: 3 cases
2-root solution precision 1e-100: 5353 cases
2-root solution precision 1e-19: 656 cases
2-root solution precision 1e-18: 4481 cases
2-root solution precision 1e-17: 2312 cases
2-root solution precision 1e-16: 455 cases
2-root solution precision 1e-15: 68 cases
2-root solution precision 1e-14: 7 cases
2-root solution precision 1e-13: 2 cases
1-root solution precision 1e-100: 3022 cases
1-root solution precision 1e-19: 38 cases
1-root solution precision 1e-18: 197 cases
1-root solution precision 1e-17: 68 cases
1-root solution precision 1e-16: 7 cases
1-root solution precision 1e-15: 1 cases

Обратите внимание, что эта точность относится к величине коэффициентов, которая обычно находится в диапазоне 10 ^ 6 (так что, наконец, точность далека от идеальной, но, вероятно, в основном пригодна для использования). Однако без порогов это почти бесполезно.

Я пробовал использовать арифметику с множественной точностью, которая обычно работает хорошо, но имеет тенденцию отклонять многие корни просто потому, что коэффициенты многочлена не имеют множественной точности, а некоторые многочлены не могут быть точно представлены (если есть двойной корень 2-й степени многочлен, он в основном либо разбивает его на два корня (что я бы не возражал), либо говорит, что корня нет вообще). Если я хочу восстановить, возможно, даже слегка неточные корни, мой код становится сложным и полон пороговых значений.

До сих пор я пробовал использовать CCmath, но либо я не могу его правильно использовать, либо точность очень плохая. Кроме того, он использует итеративный (не закрытый) решатель в plrt().

Я пробовал использовать научную библиотеку GNU gsl_poly_solve_quadratic(), но это кажется наивным подходом и не очень стабильным в числовом отношении.

Наивное использование чисел std::complex также оказалось очень плохой идеей, поскольку точность и скорость могут быть плохими (особенно с уравнениями кубической / четвертой степени, где код перегружен трансцендентными функциями).

Является ли восстановление корней в виде комплексных чисел единственным выходом? Тогда никакие корни не будут упущены, и пользователь может выбрать, насколько точными должны быть корни (и, таким образом, игнорировать небольшие воображаемые компоненты в менее точных корнях).


person the swine    schedule 15.01.2015    source источник
comment
в школе мы использовали метод Баирстоу для извлечения корней link Может быть, это то, что вам нужно .. .   -  person iksess    schedule 15.01.2015
comment
Метод @iksess Bairstow, который вы предлагаете, довольно интересен (спасибо), но он использует метод Ньютона, который не является закрытым.   -  person the swine    schedule 15.01.2015
comment
Извиняюсь ! Мой английский недостаточно хорош, чтобы понимать, что такое закрытая форма   -  person iksess    schedule 15.01.2015
comment
@iksess Нет проблем. Замкнутая форма - это выражение, которое можно вычислить за конечное число шагов, чего обычно нельзя сказать о методе Ньютона, поскольку он может вообще не сходиться. С другой стороны, код, который я опубликовал, является закрытым, поскольку он даже не зацикливается и поэтому всегда завершается за фиксированное количество шагов.   -  person the swine    schedule 15.01.2015


Ответы (1)


На самом деле это не ответ на ваш вопрос, но я думаю, что вы можете улучшить то, что у вас есть, поскольку в настоящее время у вас есть проблема «потери значимости», когда b^2 >> ac. В таких случаях вы получаете формулу типа (-b + (b + eps))/(2 * a), где отмена b может привести к потере многих значащих цифр из eps.

Правильный способ справиться с этим - использовать «нормальное» уравнение для корней квадратичного уравнения для одного корня и менее известное «альтернативное» или «перевернутое» уравнение для другого корня. В какую сторону вы их повернете, зависит от знака _b.

Изменение вашего кода в следующих строках должно уменьшить количество возникающих из-за этого ошибок.

if( _b > 0 ) {
    p_real_root[i] = T((-_b - f_disc) / (2 * _a));
    p_real_root[1 - i] = T((2 * _c) / (-_b - f_disc));
}
else{
    p_real_root[i] = T((2 * _c) / (-_b + f_disc));
    p_real_root[1 - i] = T((-_b + f_disc) / (2 * _a));
}
person Ian Cook    schedule 15.01.2015
comment
На самом деле это довольно интересно. Я не слишком уверен, что это будет иметь значение, поскольку вычисление -b - b - eps даст примерно -2b, а eps округляется точно так же. Нужно это проверить. - person the swine; 16.01.2015
comment
На самом деле это работает довольно странно. Это немного уменьшает значения функции в найденных корнях, но увеличивает расстояние между найденными корнями от того места, где я их ожидаю (это, вероятно, объясняется тем, что переход от (x - r0)(x - r1) к ax^2 + bx + c теряет точность, а корни результата немного отличается от ожидаемого). Однозначно интересно. - person the swine; 16.01.2015
comment
Вообще-то, это неплохо! Я только что реализовал набор тестов, описанный в cs.berkeley.edu/~wkahan/Qdrtcs .pdf, и всегда возвращает корни с 54 значащими битами. Мне нужно отказаться от набора тестов, который я использовал. Отличная работа. - person the swine; 16.01.2015