Чем «KAGGLE GRANDMASTER» ОТЛИЧАЕТСЯ ОТ ДРУГИХ (СЕРИЯ РАЗРАБОТЧИКОВ С НУЛЯ)?!!

Не знаю, с чего начать, просто хочу поблагодарить всех моих «ПОСЛЕДОВАТЕЛЕЙ» в Linkedin за их поддержку и любовь.

Очень скоро у меня будет 10 тысяч подписчиков, и в мой день рождения я хочу поделиться чем-то для «энтузиастов науки о данных», которые с нетерпением хотят учиться, делиться и строить.

Эта статья в основном ориентирована на тех, кто все еще сталкивается с трудностями при сборе данных или участии в «Хакатоне», в то же время находя сложным участие в «KAGGLE», чего на самом деле не было.

Из 80% индивидуальных холдингов, «Тэг Data Scientist» или прошедших «Программу PG For Data SCIENCE», около 50% все еще «БЕЗ РАБОТЫ»?

Да, вы не ослышались, но ПОЧЕМУ?

Просто потому, что многие из них сосредоточились на «ТЕГЕ», а не на обучении, и во время собеседования они получили «ОТКЛОНЕНИЕ». ЗНАНИЯ ПО ПРОГРАММИРОВАНИЮ». А «Знания в области программирования» — это второй этап для всех «УЧЕНЫХ ПО ДАННЫМ».

Самая первая фаза, по моему мнению, для всех «энтузиастов науки о данных» с небольшой маркировкой выглядит следующим образом:

1.) Будьте «ХОРОШИМ РАССКАЗЧИКОМ ДАННЫХ», прежде чем стать «УЧЕНЫМ ДАННЫХ»

2.) Разберитесь в «Постановке задачи, прежде чем переходить к «НАБОРУ ДАННЫХ»».

3.) Поработайте с некоторым «СУЩЕСТВУЮЩИМ РЕШЕНИЕМ ДЛЯ ВАШЕЙ ПОСТАНОВКИ ПРОБЛЕМЫ, ЕСЛИ ДОСТУПНО, ИЛИ ПОСМОТРЕТЬ НЕСКОЛЬКО ИССЛЕДОВАТЕЛЬСКИХ ДОКУМЕНТОВ ДЛЯ ТОГО ЖЕ ЖЕ», КОТОРЫЕ помогут вам работать с другим решением, и, делая некоторые наши собственные гипотезы, вы можете придумать с «Лучшим решением».

4.) Одно из важных «РАЗЛИЧИЙ МЕЖДУ KAGGLE GRANDMASTER И ВАС» заключается в том, что многие люди «БОЛЬШЕ Сфокусированы на ТОЧНОСТИ МАШИННОГО ОБУЧЕНИЯ, а не на «СТАТИСТИЧЕСКОМ ПОДХОДЕ К ТРЕБУЕМОЙ ПОСТАНОВКЕ ЗАДАЧИ», правда ли это?? , ДА….. КАК всегда давайте разберемся, ПОЧЕМУ это происходит в 'ПРОСТРАНСТВЕННЫХ СЛОВАХ'!!!

Все больше сосредоточены на «ТОЧНОСТИ», а не на понимании необходимой проблемы в большей степени «СТАТИСТИЧЕСКОГО ОБУЧЕНИЯ». Предположим, что есть два студента, из которых один набрал 95% в своем выпускном или любой другой программе, а другой провалился или набрал 40%, еще 50% или, может быть, меньше этого??

Итак, что вы можете проанализировать из приведенного выше утверждения, так это то, что тот, кто набрал меньше баллов или потерпел неудачу, не получит никакой работы и не сможет ничего добиться, что совершенно неправильно ??

Поищите в «Google», вы найдете множество людей, которые работают с «БОЛЬШИМИ ГИГАНТАМИ», такими как Google, Facebook и Microsoft, без какой-либо «СТЕПЕНИ» или они закончили «Национальный открытый университет Индиры Ганди (IGNOU)» и ПОМЕЩЕНЫ С такие ТНК.

Из вышеизложенного мы можем заключить, что «ТОЧНОСТЬ» не имеет значения, важно работать со «СТАТИСТИЧЕСКИМ ПОДХОДОМ» для решения любой проблемы в вашей жизни или с требуемым «НАБОРОМ ДАННЫХ». .

ПЕРВАЯ МЫСЛЬ ПЕРЕД НАЧАЛОМ РАБОТЫ С KAGGLE?

Первоначально может показаться, что «Машинное обучение касается алгоритмов», чтобы знать, когда и какой алгоритм следует использовать. Но на самом деле это было совсем не так, гроссмейстеры kaggle использовали те же алгоритмы, что и многие люди.

Следующая мысль наверняка будет заключаться в том, что они будут использовать более совершенные машины, но поверьте мне, это не так, поскольку соревнования выигрываются с использованием MacBook Air, который не является лучшей вычислительной машиной.

ЧЕМ ОНИ ОТЛИЧАЮТСЯ ОТ ВАС?

После участия в хакатоне kaggle & other я понял, что есть две вещи, которые отличают победителя от других в большинстве случаев или почти во всех случаях:

1.) СОЗДАНИЕ ФУНКЦИЙ И

2.) ВЫБОР ФУНКЦИЙ

Параллельно это означает создание некоторых переменных, которые могут фиксировать скрытые бизнес-идеи, а затем сделать правильный выбор, какую переменную выбрать или нет для ваших прогностических моделей. К сожалению, оба эти навыка требуют тонны практики, и есть много способов поработать над созданием новой функции.

Мы еще многое обсудили, чтобы понять, что важно, а что нет?

Хорошие новости: я начинаю серию EDA & Be update for Second Version, где мы обсудим «ВЫБОР ФУНКЦИЙ С НУЛЯ».

ПРИЯТНОГО ОБУЧЕНИЯ И СПАСИБО ЗА ПОДДЕРЖКУ!!!