Уроки комиксов по аналитике - Brainiac

Конечная игра в сборе неструктурированных данных

Отчет Brainiac 2814.52. Криптонский Кал-Эл и его союзники снова сорвали сбор данных с Земли. Я показал ему Коллекцию. Я открыл свои благие намерения. Он не позволит продолжить сбор.

Уничтожение Кал-Эла и Кары Зор-Эл уничтожит последние образцы криптонианской жизни в этой вселенной, но позволить им жить по-прежнему будет препятствовать завершению моей Коллекции.

Сбор должен продолжаться. Я должен выполнить свою задачу. Я не могу рисковать разрушением Земли, пока не будет безопасно собран образец города Метрополис.

Расчет следующих шагов…

Brainiac

Брэйниак - один из самых умных и одержимых данными персонажей во вселенной DC. Его также по праву можно было бы считать одним из худших аналитиков из ныне живущих.

В комиксах и анимации DC было несколько итераций персонажа Brainiac. Ученый с планеты Колу, намеревающийся собрать все знания во Вселенной. Искусственный интеллект (Brain InterActive Construct), созданный криптонианскими учеными. Буквальные комбинации каждого.

Также есть Брэйниак 5, колуанский потомок Брэйниака. Исторические записи показывают, что он возглавит Легион Супергероев в 31 веке, поэтому мы можем спокойно игнорировать его сейчас.

Криптонский ИИ, вероятно, наиболее известен сегодня благодаря его включению во вселенную DC Animated (Бэтмен, Супермен, Лига справедливости и Безлимитная Лига Справедливости). Это также тот пример, который я использую, потому что он воплощает в себе наиболее заметные функции, присущие всем итерациям Brainiac: Коллекционер.

Коллекция

Каждый Брейниак был одержим сбором информации обо всех живых существах во Вселенной. Это достигается путем выбора одного города, который представляет мир, затем сбора этого города, уменьшая его и храня в контейнере, который позволяет его жителям выжить.

Однако Брейниак хотел, чтобы его информация оставалась точной (не так ли?). Он не мог позволить миру развиваться или иным образом изменяться таким образом, чтобы его коллекция устарела. Решение столь же удивительно простое, как и леденящее кровь бессердечие. Каждый мир уничтожается после сбора.

Это идеальное решение проблемы нестабильности данных: устраните волатильность из источника.

Неструктурированные данные

Коллекция Brainiac представляет собой хранилище неструктурированных данных в чистом виде. Он просто собирает образцы, документирует все соответствующие аспекты их физиологии, интеллектуальных достижений и технологий.

Это также отличный пример «больших данных». Сегодня не так много проектов с большим набором данных, чем любой живой мир во Вселенной.

Это было бы идеальное озеро данных, если бы он продолжил бросать города в таз, но даже Брейниак слишком заботится о своих данных, чтобы рискнуть.

Подумайте, чему можно научиться даже на небольшой выборке из этого набора данных. Эволюционные тенденции в разных мирах. Технологический прогресс в разных мирах по цвету солнца, атмосфере, эпохе цивилизации или религиозным убеждениям.

Brainiac обладает способностями и способностями преуспевать в аналитике. У него также есть набор данных, который, как бы неэтично он ни был собран, вызвал бы зависть у любого существующего аналитика, ученого и любителя заговоров. Он ничего не делает с этим.

Это не входит в его программу. Это не входит в его задачу.

Применимость

В большинстве случаев вы не встретите на рабочем месте кого-то вроде Брейниака. Люди на работе обычно одержимы желанием получить результат с наименьшими усилиями в кратчайшие сроки. Брэйниак восхищается эффективностью и стремится к ней, но это не его основная цель.

Вы встретите такого типа людей чаще в увлечении, чем в архитекторе данных, и почти никогда в аналитике. Подумайте о людях, которых вы знаете, которые могут часами рассказывать факты (вымыслы?) О школе чародейства и волшебства Хогвартса. Те, кто может рассказать вам историю жизни персонажей фильмов Звездных войн, у которых было примерно 10 минут экранного времени. (Боба Фетт, кто-нибудь?)

Или, если на то пошло, люди, которые действительно знают, сколько итераций Брэйниака появилось в комиксах DC и с какой неизвестной планеты они произошли.

Но иногда вы можете увидеть, как аналитики попадают в затруднительное положение. Раньше это называлось Аналитический паралич (возможно, так оно и есть). Мы можем стать одержимыми двумя вещами:

  • Сбор и определение каждого аспекта изучаемой области
  • Гарантия того, что наши источники данных будут оставаться точными с течением времени

Вы можете распознать это как цели, поставленные перед каждым аналитиком. Это правда, и это замечательные цели, к которым нужно стремиться. Просто знайте, что вы никогда этого не добьетесь. Вы не можете достичь идеальной модели данных. Вы никогда не сможете добиться идеального качества данных.

Учимся у Brainiac

Брэйниак страдает манией величия. Он хочет собирать и контролировать всю существующую информацию, и он планирует достичь этого путем архивирования ее текущего состояния и уничтожения источника, чтобы предотвратить возможность изменения.

Надеюсь, вы не знаете никого подобного. Если вы это сделаете, я действительно надеюсь, что вы сможете найти Супермена до того, как мы все окажемся в бутылке или испаримся.

Но из этого следует извлечь некоторые уроки.

Во-первых, сбор точных данных имеет решающее значение для любого аналитического проекта. Или любой проект, связанный со сбором данных. Вы должны стремиться быть точными, но вы никогда не добьетесь идеального результата. Не сводите себя с ума, пытаясь.

Во-вторых, сбор данных ничего не значит, если он вам не нужен. Я никогда никому не скажу позволять конечным целям ограничивать их анализ; Я считаю, что анализ должен быть независимым, чтобы быть точным. Но знайте, зачем вы это делаете, и убедитесь, что не тратите время на ненужные детали.

В-третьих, не превращайтесь в гигантского робота-многоножку. Это никогда не помогает.