Гипотеза -> Модель -> Тест !! Так наука работала сотни лет, но столкнувшись с массовым притоком данных, такой подход к науке устаревает.

Мы живем в эпоху петабайт. Компании с петабайтным возрастом, такие как Google, просто предположили, что более качественные данные и аналитические инструменты победят, и оказались правы.

Так это была просто дикая догадка?

По словам Питера Норвига, директора по исследованиям Google: «Все модели ошибочны, и вы все чаще можете добиться успеха без них».

Столкнувшись с обилием данных, мы вынуждены сначала рассматривать данные математически, а затем устанавливать их контекст. Я имею в виду, что мы не хотим знать «Почему эта страница лучше других?», Мы можем просто сказать, что «потому что так говорит статистика входящих ссылок».

В качестве примеров можно взять физику и биологию. Мы больше не знаем, как фальсифицировать гипотезу в квантовой механике, энергии слишком высоки, как и стоимость ускорителей. В биологии менделевские модели, которым нас учили, оказались слишком упрощенными. Проще говоря, чем больше мы изучаем дисциплину, например, биологию или квантовую механику, тем больше мы отклоняемся от правильной модели.

Учитывая те вычислительные мощности, которые у нас есть сейчас, мы можем перестать зависеть от моделей и просто забросить обилие данных в суперкомпьютерные кластеры, и они найдут нам закономерности без каких-либо моделей. Это может быть сложно в больших масштабах, но возможность, которую она предоставляет, стоит того!