Чем «KAGGLE GRANDMASTER» ОТЛИЧАЕТСЯ ОТ ДРУГИХ (СЕРИЯ РАЗРАБОТЧИКОВ С НУЛЯ)?!!
Не знаю, с чего начать, просто хочу поблагодарить всех моих «ПОСЛЕДОВАТЕЛЕЙ» в Linkedin за их поддержку и любовь.
Очень скоро у меня будет 10 тысяч подписчиков, и в мой день рождения я хочу поделиться чем-то для «энтузиастов науки о данных», которые с нетерпением хотят учиться, делиться и строить.
Эта статья в основном ориентирована на тех, кто все еще сталкивается с трудностями при сборе данных или участии в «Хакатоне», в то же время находя сложным участие в «KAGGLE», чего на самом деле не было.
Из 80% индивидуальных холдингов, «Тэг Data Scientist» или прошедших «Программу PG For Data SCIENCE», около 50% все еще «БЕЗ РАБОТЫ»?
Да, вы не ослышались, но ПОЧЕМУ?
Просто потому, что многие из них сосредоточились на «ТЕГЕ», а не на обучении, и во время собеседования они получили «ОТКЛОНЕНИЕ». ЗНАНИЯ ПО ПРОГРАММИРОВАНИЮ». А «Знания в области программирования» — это второй этап для всех «УЧЕНЫХ ПО ДАННЫМ».
Самая первая фаза, по моему мнению, для всех «энтузиастов науки о данных» с небольшой маркировкой выглядит следующим образом:
1.) Будьте «ХОРОШИМ РАССКАЗЧИКОМ ДАННЫХ», прежде чем стать «УЧЕНЫМ ДАННЫХ»
2.) Разберитесь в «Постановке задачи, прежде чем переходить к «НАБОРУ ДАННЫХ»».
3.) Поработайте с некоторым «СУЩЕСТВУЮЩИМ РЕШЕНИЕМ ДЛЯ ВАШЕЙ ПОСТАНОВКИ ПРОБЛЕМЫ, ЕСЛИ ДОСТУПНО, ИЛИ ПОСМОТРЕТЬ НЕСКОЛЬКО ИССЛЕДОВАТЕЛЬСКИХ ДОКУМЕНТОВ ДЛЯ ТОГО ЖЕ ЖЕ», КОТОРЫЕ помогут вам работать с другим решением, и, делая некоторые наши собственные гипотезы, вы можете придумать с «Лучшим решением».
4.) Одно из важных «РАЗЛИЧИЙ МЕЖДУ KAGGLE GRANDMASTER И ВАС» заключается в том, что многие люди «БОЛЬШЕ Сфокусированы на ТОЧНОСТИ МАШИННОГО ОБУЧЕНИЯ, а не на «СТАТИСТИЧЕСКОМ ПОДХОДЕ К ТРЕБУЕМОЙ ПОСТАНОВКЕ ЗАДАЧИ», правда ли это?? , ДА….. КАК всегда давайте разберемся, ПОЧЕМУ это происходит в 'ПРОСТРАНСТВЕННЫХ СЛОВАХ'!!!
Все больше сосредоточены на «ТОЧНОСТИ», а не на понимании необходимой проблемы в большей степени «СТАТИСТИЧЕСКОГО ОБУЧЕНИЯ». Предположим, что есть два студента, из которых один набрал 95% в своем выпускном или любой другой программе, а другой провалился или набрал 40%, еще 50% или, может быть, меньше этого??
Итак, что вы можете проанализировать из приведенного выше утверждения, так это то, что тот, кто набрал меньше баллов или потерпел неудачу, не получит никакой работы и не сможет ничего добиться, что совершенно неправильно ??
Поищите в «Google», вы найдете множество людей, которые работают с «БОЛЬШИМИ ГИГАНТАМИ», такими как Google, Facebook и Microsoft, без какой-либо «СТЕПЕНИ» или они закончили «Национальный открытый университет Индиры Ганди (IGNOU)» и ПОМЕЩЕНЫ С такие ТНК.
Из вышеизложенного мы можем заключить, что «ТОЧНОСТЬ» не имеет значения, важно работать со «СТАТИСТИЧЕСКИМ ПОДХОДОМ» для решения любой проблемы в вашей жизни или с требуемым «НАБОРОМ ДАННЫХ». .
ПЕРВАЯ МЫСЛЬ ПЕРЕД НАЧАЛОМ РАБОТЫ С KAGGLE?
Первоначально может показаться, что «Машинное обучение касается алгоритмов», чтобы знать, когда и какой алгоритм следует использовать. Но на самом деле это было совсем не так, гроссмейстеры kaggle использовали те же алгоритмы, что и многие люди.
Следующая мысль наверняка будет заключаться в том, что они будут использовать более совершенные машины, но поверьте мне, это не так, поскольку соревнования выигрываются с использованием MacBook Air, который не является лучшей вычислительной машиной.
ЧЕМ ОНИ ОТЛИЧАЮТСЯ ОТ ВАС?
После участия в хакатоне kaggle & other я понял, что есть две вещи, которые отличают победителя от других в большинстве случаев или почти во всех случаях:
1.) СОЗДАНИЕ ФУНКЦИЙ И
2.) ВЫБОР ФУНКЦИЙ
Параллельно это означает создание некоторых переменных, которые могут фиксировать скрытые бизнес-идеи, а затем сделать правильный выбор, какую переменную выбрать или нет для ваших прогностических моделей. К сожалению, оба эти навыка требуют тонны практики, и есть много способов поработать над созданием новой функции.
Мы еще многое обсудили, чтобы понять, что важно, а что нет?
Хорошие новости: я начинаю серию EDA & Be update for Second Version, где мы обсудим «ВЫБОР ФУНКЦИЙ С НУЛЯ».
ПРИЯТНОГО ОБУЧЕНИЯ И СПАСИБО ЗА ПОДДЕРЖКУ!!!