Здесь мы снова с большими данными с некоторыми новостями, которые являются как хорошими, так и плохими. Вам не нужно использовать Excel или Access для того же самого, однако вам придется использовать новые платформы, если вы хотите получить максимальную отдачу от больших данных, и платформы должны быть универсальными.

Изменение всей линейки для получения информации — это приключение, но с Hadoop, который представляет собой большую коллекцию проектов, обрабатывающих данные, не содержит какой-либо стандартной конфигурации, вместо этого он состоит из множества подпроектов, каждый из которых довольно сложный. Внутренняя работа Hadoop носит очень технический характер, чтобы упростить ее, но, по сути, это инструмент для разбиения задач больших данных на более мелкие подзадачи. Эти подзадачи, в свою очередь, обрабатываются индивидуально и помещаются в новые наборы данных. Известно, что Facebook использует Hadoop для анализа огромных массивов пользовательских данных.

Если вы не хотите тратить деньги на оборудование для работы с большими данными, техническое обслуживание и т. д., вы можете отдать их на аутсорсинг технической компании, которая поможет выполнить ваши расчеты с большими данными и посмотреть, будут ли они прибыльными. Kaggle — это стартап, который достигает этой цели. Они позволяют вам публиковать большие данные в Интернете, получать информацию и давать вам лучшие предложения, которые будут решены специалистами по данным.

Вот большая загвоздка: хотя вы чувствуете, что готовы приступить к работе с большими данными, вам все равно нужно сделать паузу. Вы должны убедиться, что ваша компания также готова к тому же. Сбор и использование больших данных будет стоить вам денег, хотя некоторые инструменты бесплатны. Hadoop находится в свободном доступе, но вам нужен бюджет на консультации и обучение, чтобы гарантировать, что ваши инвестиции в большие данные окупятся.

Никогда не думайте о больших данных как о новой программе, которая просто дает результаты после ее установки, это то, где подход к технологиям и данным в целом должен быть реструктурирован. Даже если у вас есть отличные инструменты, помните, что они могут помочь вам, только если у вас есть хорошие данные. Лучшие инструменты бесполезны, если вы не собираете полезную информацию.

Поэтому лучше начать задавать конкретные вопросы и намечать краткосрочные и долгосрочные цели. Вы должны понимать, какая информация вам нужна, иначе вы не сможете понять, где ее получить.

Большие данные не без проблем. Если вы думаете, что хранение огромного количества информации о людях имеет некоторые недостатки, вы не ошибаетесь. Большие данные поднимают вопросы конфиденциальности на новый уровень. Если не те люди получат доступ к определенным видам больших данных, это может иметь катастрофические последствия.

Крупные компании, такие как Google, Amazon и Facebook, могут бесконечно использовать пользовательские данные, если захотят. Если вас это беспокоит, вы можете рассмотреть возможность использования альтернативных сервисов, таких как DuckDuckGo — поисковая система, которая не сохраняет никаких пользовательских данных.

Итак, каково будущее больших данных? Некоторые думают, что это повлияет на потребительский рынок. Во-первых, мы увидим медленный переход от активных данных к пассивным. В настоящее время большая часть наших данных активно создается. Это означает, что мы используем Интернет через наши ноутбуки или смартфоны и сами создаем свои данные.

Но все чаще данные будут генерироваться пассивно. У нас будут автомобили, телевизоры и другие устройства, которые будут подключаться к Интернету и отслеживать наше поведение. Эти технологии будут создавать данные сами по себе, что является Интернетом вещей.

Ну, это как вторжение в частную жизнь, конечно. Это также означает, что наша технология будет адаптироваться к нашему конкретному поведению. В будущем технологии смогут более эффективно использовать данные. Скажем, Тони Фаделл, дизайнер iPod, разработал программу для своей новой фирмы Nest.

Одним из устройств Nest является термостат, который собирает пользовательские данные, чтобы «изучить» личные предпочтения людей и соответствующим образом управлять их центральным отоплением. Nest «учится» у вас — использует ваши данные для регулировки температуры. Например, он может знать, что вам нравится, когда в гостиной прохладнее днем, а в спальне теплее ночью. Чем больше вы его используете, тем больше он подстраивается под вас. Эти данные собираются и отправляются онлайн, что означает, что вы можете управлять отоплением со своего смартфона и просматривать записи о своих температурных предпочтениях.

Очевидно, что большие данные окажут огромное влияние на наши технологии, окружающую среду и жизнь. Будешь ли ты частью этого?