Почему первый алгоритм sqrt быстрее второго?

Я тестировал некоторые алгоритмы квадратного корня, пока не заметил, что первый метод быстрее второго.

    @Benchmark
    @Fork(value = 1)
    @BenchmarkMode(Mode.Throughput)
    public void sqrt1() {
        int number = 25 << 10;
        int result = sqrt1(number);
    }

    @Benchmark
    @Fork(value = 1)
    @BenchmarkMode(Mode.Throughput)
    public void sqrt2() {
        int number = 25 << 10;
        int result = sqrt2(number);
    }

    public static int sqrt1(int number) {
        number >>= 10;
        int c = 0x8000;
        int g = 0x8000;

        if (g * g > number) {
            g ^= c;
        }
        c >>= 1;
        if (c == 0) {
            return g << 10;
        }
        g |= c;
        for (int i = 0; i < 15; i++) {
            if (g * g > number) {
                g ^= c;
            }
            c >>= 1;
            if (c == 0) {
                return g << 10;
            }
            g |= c;
        }
        return g << 10;
    }


    public static int sqrt2(int number) {
        number >>= 10;
        int c = 0x8000;
        int g = 0x8000;

        for (int i = 0; i < 16; i++) {
            if (g * g > number) {
                g ^= c;
            }
            c >>= 1;
            if (c == 0) {
                return g << 10;
            }
            g |= c;
        }
        return g << 10;
    }

Сравнительные результаты

Benchmark          Mode  Cnt          Score         Error  Units
Benchmarks.sqrt1  thrpt   20  104918275,263 ± 1080520,157  ops/s
Benchmarks.sqrt2  thrpt   20   93597198,803 ±  417763,363  ops/s

Почему первый метод быстрее второго?

Тестирование с использованием jhm и java 8

-Windows 10 Домашняя

-Intel Core I7-7700HQ @ 2,80 ГГц

-16 ГБ ОЗУ


person jokosan    schedule 15.04.2019    source источник
comment
между прочим, это почти утерянная часть знаний о том, что вы можете выполнить это вычисление без явное умножение. Со средними современными процессорами это может быть не быстрее. Может быть, это медленнее! Но со старыми или небольшими (возможно, встроенными) процессорами, у которых нет аппаратного множителя, это может иметь большое значение.   -  person Gene    schedule 16.04.2019


Ответы (1)


Первый цикл всего 15 раз. Вторая петля 16 раз. Таким образом, вы делаете на одно приращение меньше и сравниваете в первом. Я полагаю, что если вы просто повторите вычисление 16 раз без использования цикла, оно ускорится еще больше. Но это всего лишь догадка.

person WJS    schedule 16.04.2019