Большие данные становятся все больше и полезнее. Некоторые компании разместили данные до того, как смогли их использовать, а теперь пожинают плоды.

Реальность такова, что большие данные будут продолжать расти. Находятся ли ваши данные в электронной таблице, базе данных, хранилище данных, файловых системах с открытым исходным кодом. как Hadoop или во всех других, вам нужна гибкость, чтобы быстро подключаться к данным и консолидировать их. Не обращайте внимания на фактический размер - важны принципы сбора и особенно использования ваших данных.

Эта статья научит вас, с чего начать. Это 7 лучших практик для работы с большими данными и того, как использовать их в полной мере.

Мы также вытащили для вас несколько первых страниц технического документа. Загрузите PDF-файл справа, чтобы прочитать остальную часть.

Когда вы думали, что большие данные не могут стать больше, они стали еще больше. Независимо от фактического размера большие данные показывают свою ценность. Организации повсюду имеют большие данные всех форм и размеров. Они осознают важность, возможность и даже необходимость уделять внимание. Стало ясно, что большие данные переживут тех, кто их игнорирует.

Организации, которые уже приручили большие данные - разностороннюю массу, которую они хранили, прежде чем они осознали ее ценность, - повышают свою операционную эффективность, увеличивают свои доходы и расширяют возможности новых бизнес-моделей.

Как они это делают?
Их методы достижения успеха можно резюмировать в трех советах.

1. Думайте о долгосрочной перспективе, думая о краткосрочной перспективе.

Если вы беспокоитесь о том, чтобы оставаться в курсе технологий больших данных, вы не одиноки. Все развивается так быстро, что невозможно понять, какие инструменты, платформы и методологии будут лучшими в этом году или в следующем.

Эта быстрая эволюция может сработать для вас.

С каждым годом поставщики будут все лучше и лучше использовать большие данные. Реляционные системы и системы онлайн-транзакций (OLTP) станут более эффективными и интеллектуальными независимо от того, работают ли они локально или в облаке. Будут разработаны методы упрощения отношений между Hadoop и хранилищами данных. И все время на рынок будут приходить продукты, которые еще более точно будут соответствовать вашим потребностям.

Так что оставайся свободным. Оставайтесь открытыми для возможностей новых продуктов, пока они несут достаточную ценность, чтобы оправдать их внедрение в вашу существующую среду. Поддерживайте платформу бизнес-аналитики, которая напрямую подключается к широкому спектру форматов. Теперь вы готовы ко всему, что может предложить рынок.

2. Разглядеть ложный выбор.

Что понадобится вашей организации: Hadoop или хранилище данных? Ах, но это вопрос с подвохом. Мало того, что Hadoop и хранилища данных могут хорошо работать вместе друг с другом, организации действительно выигрывают от их коллегиальности.

Хранилище данных лучше всего подходит для обработки важных структурированных данных и хранения их там, где инструменты бизнес-аналитики и панели мониторинга могут легко их найти. Но он слабее и медленнее для аналитической обработки и некоторых типов преобразований.

Пусть это сделает Hadoop. Кроме того, хотя Hadoop слаб в интерактивных запросах и управлении данными, он хорошо справляется с обработкой необработанных, неструктурированных и сложных данных.

Вместе они образуют симбиотические отношения. Представьте, например, данные, которые руководители используют для прогнозирования своих потребностей в запасах на следующий год. Набор данных, вероятно, огромен, и у него слишком мало времени, чтобы смоделировать его, реструктурировать или иным образом подготовить его для хранилища данных. Когда руководители закончат с этим, возможно, всего за неделю, они избавятся от него. Именно тогда Hadoop приступает к хранению и уточнению данных и отправке образца в хранилище данных.

«Большие данные не заменяют хранилища данных», - пишет в своей статье генеральный директор Third Nature Марк Мэдсен.

«Что на самом деле представляют собой большие данные». «И это не остров, который нужно содержать отдельно. Это часть новой ИТ-среды ».
Не поддавайтесь уловкам с Hadoop или хранилищами данных. Вы можете и должны использовать оба.

3. Используйте большие данные на уровне глаз.

Когда вы визуализируете большие данные, они сводятся к уровню ваших глаз. Отчет Aberdeen Group за 2019 год показал, что «в организациях, использующих инструменты визуального обнаружения, 48 процентов пользователей бизнес-аналитики могут найти нужную информацию без помощи ИТ-персонала». Без визуального обнаружения этот показатель упадет до 23 процентов.

Кроме того, согласно исследованию, менеджеры, использующие визуальное обнаружение данных, на 28 процентов чаще, чем коллеги без визуализированных данных, находили своевременную информацию.

Пожалуй, самое важное, что касается больших данных, - это то, что в отчете было обнаружено, что визуализация также способствует взаимодействию с данными. Менеджеры, использующие визуализированные данные, более чем в два раза чаще, чем их коллеги, активно с ними взаимодействуют (33 процента против 15 процентов). Кроме того, они гораздо чаще задают вопросы по прихоти, вопросы, которые часто возникают на основе идей, возникших за мгновение до этого.

Визуальное изучение данных позволяет раскрыть историю данных так ярко, как мозг может уловить в мгновение ока. «Лампочка гаснет», - говорит вице-президент Wells Fargo по стратегическому планированию Дана Зубер, «Этого просто не добиться с электронной таблицей».

Визуальный анализ позволяет вам в любой момент делать две вещи:

Измените данные, которые вы просматриваете, потому что для разных вопросов часто требуются разные данные.
Измените свой взгляд на них, потому что каждое представление может отвечать на разные вопросы.
С помощью этих простых шагов вы вводите то, что называется Цикл визуального анализа: вы получаете данные, просматриваете данные, задаете и отвечаете на вопросы и повторяете. Каждый раз ваш запрос углубляется вместе с вашими открытиями. Вы можете детализировать, детализировать или детализировать. Вы можете ввести новые данные. Вы можете создавать представление за представлением, поскольку ваша визуализация ускоряет и расширяет ваше мышление.

Когда будете готовы, поделитесь. Коллеги задают свои вопросы и отвечают на них, что ускоряет понимание, действия и бизнес-результаты всей команды.

Спасибо, что прочитали статью. Если это поможет, поделитесь своими мыслями.

Другие статьи.

Зачем вам нужна платформа BI и как ее выбрать

10 лучших инструментов для анализа данных, о которых должен знать каждый

Вопросы и ответы по анализу временных рядов

8 книг о Data Science для начинающих

Что лучше: Tensorflow или Pytorch?