Идеи проекта Data Science

Шум о Data Science в 2020 году подобен акциям Tesla; он продолжает увеличиваться с каждым днем. Эта область настолько актуальна, что все, от инженеров-механиков до врачей, хотят быть специалистами по обработке данных. Однако как бы вы попали в Data Science? Присоединиться к DS Bootcamp? Проведите два или три МООК? Соревнуйтесь в соревнованиях Kaggle? Изложение бесконечное. Я не отвергаю преимущества MOOC или даже конкурсов Kaggle, это невероятные возможности для изучения Data Science.

Однако проблема в том, что все это делают! Как часто мы видели сообщения об их специализации на Coursera или архиве машинного обучения GitHub в наборе данных Titanic? В случае, если вам нужно найти работу специалистом по данным, вы должны выполнить то, чего никто не делает. По сути, вы должны отделиться от остальных конкурентов. Выполнение проектов с полным стеком (формулирование проблем, сбор данных, очистка данных, EDA, машинное обучение, развертывание) проектов по науке о данных даст вам высокий уровень при непосредственной встрече в том случае, если вы новичок пытаетесь проникнуть в науку о данных.

Недавно я наткнулся на блог Сьюзан, где она объясняет, как мы можем найти лучшие вакансии в области Data Science. Она предлагает попробовать найти работу, где работают Инсайты. Итак, из любопытства я просмотрел веб-сайт Insight в первую очередь, чтобы найти компании, в которых они работают. Но когда я узнал больше о проектах их коллег, я был поражен. Конечно, у них есть докторская степень. в количественных областях, но некоторые из их проектов можно было превратить в продукты. Вот скребок, который я использовал.

import requests
from bs4 import BeautifulSoup
result=requests.get("https://www.insightdatascience.com/fellows")
src=result.content
soup=BeautifulSoup(src,'lxml')
div=soup.div
name=[]
for row in soup.find_all('div',attrs={"class" : "tooltip_name"}):name.append(row.text)
project=[]
for row in soup.find_all('div',attrs={"class" : "tooltip_project"}):project.append(row.text)
    
title=[]
for row in soup.find_all('div',attrs={"class" : "toottip_title"}):title.append(row.text)
    
company=[]
for row in soup.find_all('div',attrs={"class" : "tooltip_company"}):company.append(row.text)
    
d={'Name':name,'Project':project,'Company':company,'Title':title }
df=pd.DataFrame(d)

На случай, если вам понадобится выполнить какие-нибудь крутые проекты, не останавливайтесь ни на секунду, чтобы почерпнуть мотивацию или мысли отсюда. Независимо от того, сможете ли вы воспроизвести или расширить проект, если вы сможете понять, что они сделали и почему они это сделали, это окажет колоссальную помощь. Это также будет необычной темой для разговоров во время собеседований и позволит отличить вас от конкурентов.