8 побочных проектов по науке о данных на 2022 год

Уникальные идеи для побочных проектов, которые повысят ваши навыки работы с данными в 2022 году

По мере приближения 2022 года, когда вы работаете над своим списком новогодних решений, ознакомьтесь с этим списком побочных проектов по науке о данных и вдохновитесь на создание чего-то значимого в следующем году. Развитие нового навыка, освежение старых или просто получение дополнительного источника дохода. Что бы ни двигало вами, правильный проект действительно может сделать ваш год лучше.

Создать сервис прогнозирования ставок на спорт

«Служба подсказок по ставкам на спорт» — это служба, которая продает советы по ставкам на спорт. Люди готовы платить хорошие деньги, если вы можете регулярно предоставлять им хорошую информацию о следующем футбольном матче.

Хорошо, но какое это имеет отношение к науке о данных? Ну, с правильными данными и правильными навыками вы на самом деле можете рассчитывать вероятности относительно многих вещей, включая исходы спортивных событий. Затем вы можете продать эти оценки людям, которые хотят поставить свои деньги онлайн.

На практике одной из самых сложных частей этого проекта будет сбор надежных данных таким образом, чтобы их можно было автоматизировать. Есть несколько способов сделать это: получить платную подписку на веб-сайте, который продает такого рода данные, веб-скрапинг или, если вам повезет, найти необработанные данные в открытом доступе и периодически обновляться. После того, как вам удалось автоматизировать прием данных, вы знаете все остальное: очистка данных, проектирование функций и т. д., как и в любом другом проекте по науке о данных.

Как только вы будете удовлетворены своими результатами, вы можете настроить простой сервис для их продажи: вы можете продавать либо вероятности, либо фактические прогнозы, но я бы предпочел вероятности.

Еще один совет: попробуйте сосредоточиться на менее популярных видах спорта. Он должен быть достаточно большим, чтобы вы могли найти достаточно данных, чтобы на него можно было сделать ставку, и чтобы люди, по крайней мере, были заинтересованы, но не настолько большим, чтобы уже многие люди делали прогнозы на основе ML.

Создайте свой собственный кластер с помощью Raspberry PI

Хотя этот проект не так ориентирован на данные, как остальная часть списка, он может быть очень интересным и отличным способом поработать над своими навыками информатики.

Получите как минимум два Rasperry Pis (эти крошечные недорогие компьютеры), соедините их вместе и заставьте их работать как кластер компьютеров, который вы можете использовать для параллельных вычислений, размещения веб-сайта, локального сервера… Возможности безграничны.

Но не проще ли просто использовать какого-нибудь облачного провайдера? Да, но создание кластера с нуля научит вас многому об оборудовании, настройке серверов и установке Linux и Kubernetes.

Вот пара уроков, которые помогут вам:





Получите сертификат GCP Professional Machine Learning Engineer

Согласно веб-сайту Google Cloud Platform, «профессиональный инженер по машинному обучению проектирует, создает и производит модели машинного обучения для решения бизнес-задач, используя технологии Google Cloud и знание проверенных моделей и методов машинного обучения».

Это не только ценная сертификация сама по себе, но и процесс ее обучения научит вас многому о машинном обучении в целом: какие метрики больше подходят для каждой ситуации, как работают различные типы нейронных сетей и как их настроить, как сделать перекрестную проверку и т. д.

Я написал учебник о том, как учиться для этого здесь:



Создать МООК

Поначалу создание МООК может показаться непосильной задачей, но если вы разбьете проект на более мелкие цели, вы сможете завершить его всего за несколько месяцев.

Вы начинаете с того, что решаете, чему вы хотите учить и кого. Уже есть много курсов по общему машинному обучению, статистике и т. д. Это не только сложнее, но и маловероятно, что вы добавите что-то новое в ландшафт онлайн-курсов. Вместо этого попробуйте сосредоточиться на чем-то более узком, например, на используемом вами инструменте или конкретном сценарии использования, с которым вы работаете каждый день. Как только вы это сделаете, вы можете записать содержание курса: чему вы собираетесь учить и как вы собираетесь его разбивать.

Затем определитесь с форматом: например, будете ли вы записывать видео со своей речью или только свой экран? Для начала я предлагаю последнее, так как это проще выполнить и менее пугающе, чем иметь свое лицо по всему Интернету.

Наконец, начните запись. Составьте расписание того, какие части вы будете записывать каждую неделю, и придерживайтесь его. Если вы просто записываете свой экран и делаете закадровый голос, все, что вам нужно, это хороший микрофон и компьютер.

Когда придет время публиковать, у вас есть много вариантов, но старайтесь придерживаться известных платформ, удобных для новичков, таких как Hotmart и Udemy. Когда эта часть закончена, пришло время продвигать ваш онлайн-курс. Это целая тема сама по себе, поэтому мы опустим ее, но вы можете найти бесконечное количество контента в Интернете об этом.

Объяснение чего-либо другим людям — один из лучших способов усвоения материала, поэтому этот проект фактически заставит вас освежить в памяти тему, которую вы будете преподавать. Кроме того, это может помочь вам заработать дополнительные деньги, что тоже не так уж плохо.

Создать общедоступную панель инструментов

Этот проект предназначен для тех, кто хочет поработать над своими навыками визуализации данных, и его проще всего реализовать в этом списке: получить некоторые общедоступные данные, подключить их к инструменту визуализации данных, создать информативную информационную панель и опубликовать ее где-нибудь. Это так просто.

Какие данные? Все, что мотивирует вас и может привлечь внимание людей. Многие люди сделали это для данных COVID, но есть много других интересных наборов данных (Kaggle — хороший источник).

Получив данные, выберите любой инструмент визуализации данных. Лично мне нравится Tableau, но для простого случая Google Data Studio делает свою работу бесплатно.

Затем вы можете разместить свою панель инструментов на Github или другом бесплатном инструменте, чтобы поделиться своими блестящими идеями со всем миром.

Написать книгу

Самостоятельно публиковать сейчас гораздо проще, чем раньше: такие платформы, как Amazon, позволяют вам публиковать в цифровом формате и печатать, а также сделать вашу книгу доступной по всему миру. Однако это было связано с проклятием: сейчас стало намного больше некачественных книг, потому что некоторые люди просто хотят опубликовать книгу ради создания личного бренда. Пожалуйста, не будь таким человеком. Пишите книгу только в том случае, если вы действительно уверены, что контент, который вы там публикуете, актуален или в каком-то смысле нов. И убедитесь, что вы знаете, о чем говорите, и тщательно изучите, прежде чем писать.

Тем не менее, как только вы определились с темой и структурой книги, просто начните писать и не бойтесь переписывать несколько раз, пока не получите то, что хотите. Получив первую версию, попробуйте поделиться ею с людьми, которым вы доверяете, получить отзывы и улучшить ее.

Одни только необходимые исследования сделают вас лучшим специалистом по данным, а выражение ваших знаний словами сделает вас лучшим мыслителем.

На это может уйти больше года, но с чего-то надо начинать, верно? Может быть, взять на себя обязательство закончить первый черновик за год, что уже само по себе является большим достижением.

Участие в проекте с открытым исходным кодом

Возьмите, например, понравившуюся библиотеку Python и поищите способы ее улучшения. Если вы никогда не делали этого раньше, начните с малого.

У Scikit-learn есть руководство по внесению вклада со специальной сессией для новых участников, где они перечисляют хорошие первые вопросы, те, которые вы можете решить, чтобы привыкнуть к их процессу вклада. Как только вы освоитесь с ним, вы можете перейти к более сложным вкладам.

Возможно, это не принесет вам денег, но всегда полезно отдать долг сообществу, поскольку мы все извлекаем выгоду из открытого исходного кода. И вы будете развивать свои навыки сотрудничества.

Начать обучение

После того, как COVID стал чаще работать и учиться дома, появилось гораздо больше возможностей для онлайн-обучения, что делает этот побочный проект гораздо более доступным.

Иногда барьеры для входа в преподавание могут быть высокими, поэтому ищите не только университеты, но и онлайн-курсы с живыми занятиями. Кроме того, некоторые курсы могут уже иметь собственное структурированное содержание, что упрощает его следование, а не создание собственного с нуля.

Преподавание может помочь вам во многих отношениях, от улучшения ваших навыков публичных выступлений до принуждения вас к углубленному изучению определенного предмета и действительному пониманию его сути.

Если вам понравилась эта статья, возможно, вам понравятся и эти:





Не стесняйтесь обращаться ко мне в LinkedIn, если вы хотите продолжить обсуждение, это будет приятно (честно).