Добро пожаловать обратно! Наука о данных — потрясающая область с бурным ростом, поэтому, если вы начинающий специалист по данным, возможно, вы пытаетесь найти несколько потрясающих проектов по науке о данных для своего резюме, к счастью для вас, у меня есть некоторые! Давайте поговорим о некоторых проектах по науке о данных, которые вы можете создать, если вы знаете Python или R, вы сможете создать большинство из этих проектов!

Прогнозирование цены криптовалюты

Во-первых, у нас есть довольно надежный проект, прогнозирующий цену криптовалюты с использованием Python и машинного обучения, ознакомьтесь с этим руководством ниже:



Это определенно не полное руководство по машинному обучению, но если у вас есть базовые знания о некоторых концепциях машинного обучения, вы сможете следовать этому руководству. Я разместил его в конце, потому что это может занять больше времени, чем любой из этих других проектов, но я сделал Google Colab специально для этого проекта, который я связал с ним, поэтому, если вы не хотите кодировать все это, вы можно было просто запустить блокнот Google Colab. Этот проект, безусловно, самый сложный, так как я предполагаю, что вы немного знакомы с машинным обучением, но вы также можете многому научиться.

Парсинг веб-сайта с помощью R

Затем у нас есть парсинг веб-страниц с помощью R, этот небольшой проект показывает нам стандартную структуру веб-сайта, а также то, как извлечь определенные элементы с определенной веб-страницы, чтобы просмотреть весь проект, перейдите по ссылке ниже:



Веб-скрапинг — один из моих любимых способов разработки наборов данных. Мне нравится собирать данные с таких сайтов, как Reddit или Tiktok, потому что их данные постоянно обновляются, а использование таких пакетов, как rvest, позволяет нам очень легко очищать данные. Кроме того, изучая парсинг веб-страниц в R, вы даже можете очень легко перейти к изучению парсинга веб-страниц и на любом другом языке!

Машинное обучение с Keras

Далее у нас есть проект машинного обучения с Keras, этот проект использует Python и тензорный поток вместе с пакетом Keras для разработки модели машинного обучения, перейдите по ссылке ниже, чтобы просмотреть этот проект:



Машинное обучение с помощью R + Tidymodels

Далее у нас есть очень простой проект машинного обучения с R и tidymodels, этот проект разбирает основы машинного обучения в R, мы также разрабатываем модель машинного обучения, ознакомьтесь с проектом ниже:



Хотя такие языки, как Python, рассматриваются как язык для машинного обучения, R по-прежнему имеет большую поддержку для своих пакетов машинного обучения. Tidymodels — отличный ресурс для машинного обучения в R, у них есть отличная документация и довольно большое сообщество разработчиков машинного обучения, я настоятельно рекомендую проверить этот проект выше, чтобы получить некоторый сложный опыт машинного обучения в R.

Скрапинг данных из Instagram

Далее у нас есть еще один проект веб-скрейпинга, этот конкретный проект фактически собирает данные из Instagram, перейдите по ссылке ниже, чтобы просмотреть этот проект:



Этот конкретный проект использует Python и Selenium для сбора данных с веб-сайта. Selenium — это очень важный пакет для понимания, он не только позволяет вам собирать данные с веб-сайтов, но также может автоматизировать определенные задачи, это, безусловно, один из моих любимых проектов, который я рекомендую новичкам.

Вот оно! Вот несколько замечательных проектов по науке о данных, которые вы можете реализовать! Планируете ли вы строительство какого-либо из этих проектов? Я хотел бы услышать ваши мысли об этом!

Как всегда

если у вас есть какие-либо предложения, мысли или вы просто хотите связаться, не стесняйтесь связаться со мной или подписаться на меня в Твиттере! Кроме того, ниже приведены ссылки на некоторые из моих любимых ресурсов для изучения программирования, Python, R, Data Science и т. д.



Спасибо за прочтение!