Большой запрос 🤔
Что, если нам придется анализировать терабайты или петабайты данных? Что, если нам придется обучать модели с терабайтами или петабайтами данных?
Если мы сделаем этот процесс традиционным методом, он займет часы, дни или месяцы. Что, если мы проделаем этот процесс параллельно? как распределенная система; звучит интересно, не так ли?
Ответ на этот вопрос — bigQuery.
Здесь нам не нужно беспокоиться о распределенной системе. Всем управляет гугл.
Что такое bigQuery?
BigQuery — это сервис, предоставляемый Google. Это полностью управляемая бессерверная служба, масштабируемая на петабайты данных, что позволяет нам сосредоточиться на аналитике, а не на управлении инфраструктурой.
★ bigQuery состоит из 3 основных частей, как показано ниже.
- Хранилище =›Репликация, распределенное хранилище
- Загрузка => Загрузить данные
- Запросы => напишите bigQuery, используя синтаксис SQL
Случаи использования bigQuery.
- Анализ больших объемов данных
- Обучение модели ИИ.
bigQuery используется для анализа больших объемов данных.
Применения bigQuery.
- Анализ данных
2. Создание модели машинного обучения
3. Анализ мультиоблачных данных с помощью bigquery omni
4. Интерактивный анализ данных с помощью Power BI
5. Геопространственный анализ с помощью BigQuery GIS
Спасибо за прочтение 😊…