Развивайте свои навыки работы с данными независимо от вашей области

Теперь ты везде, как небо.Песня смерти Брендана — Red Hot Chilli Peppers

Два года назад я беспокоился о своем профессиональном будущем. Я только что закончил магистратуру, где впервые столкнулся с наукой о данных и причинно-следственными выводами. Проблема"? Я люблю это!

Можно спросить, как любовь к науке о данных может быть проблемой. Ну, вообще-то я госслужащий и моя работа не связана с наукой о данных. Это означало, что мне предстоит трудный компромисс.

С одной стороны, у меня была безопасная работа, но, к сожалению, не та, которая позволила бы мне развиваться как специалисту по данным. С другой стороны, я мог бы просто бросить свою работу и заняться поиском работы в области науки о данных, не имея никакого предыдущего профессионального опыта в этой области. Как подчеркивает Теренс Шин в этой статье на Medium, найти первую работу в сфере обработки данных может быть особенно сложно.

Оба варианта сопряжены с риском: риском безработицы или риском несчастья из-за того, что я не следовал своей мечте.

К счастью (или нет), я большой любитель саморефлексии и решил не делать свой выбор до тщательного размышления. Однажды я читал книгу Ювала Харари Sapiens¹ и натолкнулся на тревожную мысль, что отныне нам придется привыкать к постоянному обучению и развитию. Будущее приветствует профессиональную нестабильность и непостоянство. В эту новую эпоху мы должны быть готовы постоянно учиться новым навыкам. Вот слова Харари:

К 2025 году произойдут большие изменения, к 2035 году — еще большие, а к 2045 году — еще большая революция. Старые рабочие места исчезнут, появятся новые рабочие места, но и новые рабочие места быстро изменятся и исчезнут. Людям придется переучиваться и заново изобретать себя не один раз, а снова и снова на протяжении всей жизни.

Если время полностью безопасных профессий закончилось и если мне все равно придется постоянно развиваться и учиться, почему я не могу найти науку о данных в своей нынешней работе?

Как и в песне Red Hot Chilli Peppers, которую я цитировал выше, наука о данных теперь повсюду, как небо. Конечно, я бы нашел пробелы в своей области, которые можно было бы заполнить с помощью моих новых аналитических способностей.

Вначале я пессимистично относился к реальным возможностям науки о данных, которые я найду в своей текущей работе. Это потребовало некоторой настойчивости и решимости, но в конце концов я это сделал.

Ниже вы узнаете о трех инициативах, над которыми я работал, чтобы развить свои навыки работы с данными в качестве советника по законодательным вопросам в Конгрессе Бразилии. Для каждого опыта я подготовил несколько рекомендаций, основанных на моем опыте и проблемах, с которыми я столкнулся.

1. Автоматизация отчетов с помощью Python Pandas и Matplotlib

Почти все задания связаны с каким-либо отчетом в Excel! Даже если ваши задачи бюрократичны, автоматизация отчетов — отличная возможность применить науку о данных в повседневной жизни.

Преодолеть сопротивление переменам в вашей команде. Когда я впервые предложил автоматизировать наши отчеты своему менеджеру, он не хотел разрешать мне использовать рабочее время для кодирования приложения. В этой ситуации лучший подход — четко показать, как автоматизация отчетов повысит ценность команды. Для этого вы можете показать им примеры отчетов и информационных панелей, похожих на тот, который вы хотите разработать, подчеркнув, как команда выиграет время и знания по сравнению с текущими отчетами. В моей конкретной ситуации одному члену команды пришлось посетить несколько страниц веб-сайта, чтобы получить информацию о законопроектах, проходящих через Конгресс. Большая часть этой работы может быть выполнена скриптом Python за миллисекунды!

Ищите существующие решения, чтобы облегчить себе задачу. Возможно, вам повезло так же, как мне, и у вашей компании или учреждения есть API, предоставляющий нужные вам данные! В этом случае все, что вам нужно сделать, это закодировать вызовы API и получить данные. Но будь осторожен! Существует множество данных, и ваша обязанность как специалиста по данным состоит в том, чтобы выбирать, обрабатывать и эффективно передавать их своей команде. Это можно сделать с помощью визуализаций и рассказывания историй. Кроме того, рассмотрите применимость индикатора, который вы предоставляете, то есть какие действия ваша команда должна предпринять на основе значений, указанных в этом индикаторе.

Используйте устоявшиеся фреймворки для разработки своего приложения. Streamlit, Flask и Shiny — эффективные инструменты для создания отчетов и представления результатов. Особенно, если у вас нет данных, предоставляемых API, и вы зависите от вашей команды, предоставляющей приложение, очень важно создать понятный и интуитивно понятный интерфейс для вашего пользователя. Вы можете узнать больше о CSS и HTML, которые позволят вам настроить и сделать ваш отчет более удобным для пользователя.

2. Публикация Shiny Dashboard для внешних клиентов

Моей второй инициативой было создание приложения Shiny для обработки и отображения информации об образовательных данных. Цель состояла в том, чтобы предоставить мэрам полезную информацию для улучшения их местных школ в бразильском штате Сержипи. Приложение собирало данные об успеваемости учащихся, инфраструктуре и управлении муниципальными школами. Он также сравнил и ранжировал муниципалитеты, чтобы предложить муниципалитетам с низкими показателями успешные примеры. Результаты можно посмотреть здесь (к сожалению, только на португальском языке).

Прислушивайтесь к потребностям вашего клиента. При разработке информационной панели помните о пользователе. Вы добавляете визуализацию, потому что она повышает ценность для вашего пользователя или потому, что вы считаете ее красивой? Вы должны поговорить со своей целевой группой, чтобы узнать, что действительно им поможет, и выслушать их опасения и пожелания. Когда я разрабатывал это приложение, некоторые мэры беспокоились о рейтинге, потому что боялись, что их будут сравнивать с более крупными и богатыми муниципалитетами, что было бы несправедливо. Основываясь на этих данных, я разработал кластерный рейтинг, в котором муниципалитеты были разделены на группы со схожими характеристиками в отношении инвестиций в образование и население.

На изображении ниже показан графический график с кластерами, вычисленными алгоритмом k-ближайших соседей.

Покажите свою работу. Неважно, насколько эффективно и привлекательно ваше приложение Shiny, оно не будет полезным, если вы не поделитесь им с людьми, которым оно может быть полезно. Поделитесь им в своих социальных сетях и узнайте, как ваша компания или учреждение может помочь в продвижении вашей информационной панели. Наконец, рассмотрите возможность проведения онлайн-мероприятия или мероприятия на месте, чтобы представить свой инструмент основной целевой группе.

3. Семинар на вашу любимую тему науки о данных

Для меня это была самая сложная, но полезная инициатива! Почему? Просто потому, что у меня были серьезные проблемы с публичными выступлениями. Одними из симптомов были потливость и сильная нервозность. Иногда я даже не мог вспомнить, что я представил и имели ли смысл мои рассуждения.

Несмотря на это, я организовал семинар, чтобы представить синтетический метод контроля коллегам на Конгрессе. По сути, это метод причинно-следственной связи, используемый для оценки политики, а также компаниями, желающими оценить влияние своих действий. Uber, например, использует искусственный контроль для обоснования своих решений. Посмотрите это видео, если хотите узнать больше об их деле. Кроме того, ознакомьтесь с этой публикацией, опубликованной с помощью TDS от Matteo Courthoud, объясняющей метод синтетического управления.

Но как насчет моего страха перед публичными выступлениями? Ну, это мой первый совет.

Выйдите из своей зоны комфорта и обратитесь за помощью. За месяц до семинара я решил, что хватит страданий из-за боязни публичных выступлений, и решил записаться на курс ораторского искусства. Должен признаться, что первые встречи дались мне очень тяжело. Однако мне стало легче, когда я представил все больше и больше перед коллегами, столкнувшимися с той же проблемой. Я научилась управлять своими эмоциями, устранять шумы в общении и быть объективной и интересной. К сожалению, к тому моменту, когда я должна была представить свой мастер-класс по синтетическому контролю, курс ораторского искусства был еще в начале пути, но все же он мне очень помог!

Привлекайте свою аудиторию. Искусственный контроль, а также многие темы науки о данных могут быть сложными для объяснения и понимания. Не теряйте аудиторию излишними техническими деталями и ориентируйтесь на интуицию, стоящую за сложными концепциями. Кроме того, сделайте викторины и вопросы, чтобы заинтересовать их. Свой рассказ о причинно-следственных связях я начал с викторины, в которой участники отвечали, пили ли они кофе в этот день и каков был их уровень концентрации в этот момент. С помощью этого простого упражнения я мог проиллюстрировать несколько проблем, связанных с попытками оценить влияние кофе на уровень концентрации.

Этот семинар был очень полезным, потому что я чувствовал, что приношу пользу своим коллегам и побуждаю их больше узнать о науке о данных. Многие из них поздравили меня с инициативой.

Подводя итог, можно сказать, что в 21 веке наука о данных окружает нас повсюду. Посмотрите внимательно, и вы найдете что-то, что вы можете сделать более эффективным, более проницательным и более красивым с помощью науки о данных!

Я надеюсь, что мой опыт может дать вам некоторую перспективу на случай, если вы столкнетесь с той же дилеммой, что и я. Если вам понравился этот пост, подпишитесь на меня, чтобы узнать больше о том, как включить науку о данных в свою текущую деятельность!

Ссылки

[1] Харари, Юваль Ной. 2015. Сапиенс. Нью-Йорк, штат Нью-Йорк: Харпер.