Хейко уже несколько лет работает волонтером в DataKind UK, в том числе в качестве посла данных, руководящего проектом по науке о данных с участником кампании по борьбе с коррупцией Global Witness. Он подробно рассказывает о том, что для него значит быть амбассадором данных, а также о своей текущей работе с машинным обучением.

Расскажите нам немного о себе и своих данных

Я увлечен созданием решений с использованием ИИ и машинного обучения (ML) и делюсь своим опытом в сообщениях в блогах или на публичных встречах и конференциях. Последние 20 лет я всегда работал в ИТ в той или иной должности. Я считаю, что если вы увлечены определенной темой, лучше приобретать навыки по ходу дела, а не ждать, пока вы не подумаете, что вы «достаточно хороши».

Почему вы решили стать амбассадором данных (DA)?

В 2016 году я был директором группы аналитики данных консалтинговой фирмы и начал больше заниматься наукой о данных. Я был очень заинтригован возможностями, которые предлагает машинное обучение, и прошел несколько онлайн-курсов. Моя повседневная работа не давала много возможностей практиковать эти навыки, поэтому я искал возможности в другом месте.

Именно тогда я нашел DataKind UK в Интернете и подумал, что это отличная возможность пожертвовать своим временем и навыками, а также отточить свои навыки работы с данными. И когда я начал общаться с людьми из DataKind, я быстро понял, что это те люди, с которыми я хочу проводить время!

Что вам больше всего понравилось в работе амбассадором данных, а что показалось вам самым сложным?

Что мне больше всего нравится в качестве окружного прокурора, так это то, что я знакомлюсь со многими интересными людьми из совершенно разных слоев общества. Было очень увлекательно, например, работать с Global Witness, организацией, которая расследует и разоблачает нарушения прав человека и окружающей среды в нефтяной, газовой, горнодобывающей и лесной отраслях, а также отслеживает нечестно полученные деньги и влияние через глобальные финансовые и политическая система. Увидеть, как они используют данные и как вместе мы можем использовать машинное обучение и науку о данных, чтобы помочь в выполнении их миссии, было одним из основных моментов моего путешествия в DA.

Какой совет вы бы дали будущим послам данных?

Прежде всего, я бы посоветовал всем, кто заинтересован, подать заявку, независимо от того, где вы думаете, что находитесь в своем путешествии. По моему опыту, DataKind ищет людей, которые увлечены наукой о данных и готовы учиться больше всего на свете. Даже если вы не уверены, что ваши навыки «достаточно хороши», я бы порекомендовал обратиться к команде DataKind.

Что вас больше всего удивило в волонтерстве?

Я был удивлен тем, сколько разного опыта есть у других волонтеров DataKind. Но, в конце концов, это имеет смысл — наука о данных — такая творческая, многогранная дисциплина, и она очень выигрывает от множества различных точек зрения.

Какова ваша ежедневная работа с данными?

Я работаю с клиентами над внедрением AI/ML в их организации. Это может означать, что я пересматриваю их архитектуру и даю рекомендации по передовым методам или создаю демонстрацию, демонстрирующую искусство возможного в AI/ML. Чаще всего варианты использования основаны на облаке, и поэтому я часто использую Amazon SageMaker в качестве предпочтительной платформы машинного обучения для обучения и развертывания моделей.

Что вы хотели бы знать, когда начали вникать в данные?

Не могу сказать, что не знал этого раньше, но думаю, стоит повторить, что время, затрачиваемое на улучшение качества данных, каждый раз превосходит время, затрачиваемое на улучшение моделей машинного обучения. Мы видим это в пространстве больших языковых моделей, таких как GPT-3 — наличие более тщательно отобранного набора данных превосходит размер модели. Я считаю, что эта тенденция станет еще более важной в 2023 году.

Вы всегда думали, что собираетесь углубляться в данные?

Думаю, я всегда знал, что окажусь где-то в IT-сфере. В какой-то момент я подумывал о том, чтобы стать директором по информационным технологиям или директором по технологиям в организации, но понял, что слишком люблю создавать вещи и заниматься практическими делами, чтобы быть стратегическим лидером. Так что теперь я сосредоточен на разработке решений и становлюсь экспертом в области ИИ.

Какой проект данных вас вдохновляет?

Не столько проект данных, сколько проект искусственного интеллекта с открытым исходным кодом Трансформеры от HuggingFace. Это обеспечивает беспрецедентную простоту использования некоторых мощных моделей ИИ. Мои клиенты очарованы тем, насколько легко использовать современную обработку естественного языка с помощью этой библиотеки.

Есть ли ресурс, который вы бы порекомендовали сообществу?

Если вы хотите заняться глубоким обучением, которое является хорошей областью для начала работы с наукой о данных, я настоятельно рекомендую (бесплатный) курс Практическое глубокое обучение от FastAI.

Расскажите нам о себе что-нибудь совершенно не связанное с данными!

Я люблю путешествия, походы и еду — и самое главное, их очень легко совмещать!

Я рекомендую два из лучших походов, которые я совершил в своей жизни, — это Тропа Инков в Перу и Тропа Западного побережья в Канаде.

Если вам интересно стать волонтером DataKind UK, загляните на нашу волонтерскую страницу!