Большой запрос 🤔

Что, если нам придется анализировать терабайты или петабайты данных? Что, если нам придется обучать модели с терабайтами или петабайтами данных?

Если мы сделаем этот процесс традиционным методом, он займет часы, дни или месяцы. Что, если мы проделаем этот процесс параллельно? как распределенная система; звучит интересно, не так ли?

Ответ на этот вопрос — bigQuery.

Здесь нам не нужно беспокоиться о распределенной системе. Всем управляет гугл.

Что такое bigQuery?

BigQuery — это сервис, предоставляемый Google. Это полностью управляемая бессерверная служба, масштабируемая на петабайты данных, что позволяет нам сосредоточиться на аналитике, а не на управлении инфраструктурой.

★ bigQuery состоит из 3 основных частей, как показано ниже.

  • Хранилище =›Репликация, распределенное хранилище
  • Загрузка => Загрузить данные
  • Запросы => напишите bigQuery, используя синтаксис SQL

Случаи использования bigQuery.

  1. Анализ больших объемов данных
  2. Обучение модели ИИ.

bigQuery используется для анализа больших объемов данных.

Применения bigQuery.

  1. Анализ данных

2. Создание модели машинного обучения

3. Анализ мультиоблачных данных с помощью bigquery omni

4. Интерактивный анализ данных с помощью Power BI

5. Геопространственный анализ с помощью BigQuery GIS

Спасибо за прочтение 😊…