Перезагрузка «Интервью с героями машинного обучения» и сборник лучших советов

В течение последних нескольких месяцев мне действительно повезло, что я взял интервью у ведущих специалистов, исследователей и практиков. Эти интервью были опубликованы в формате блога, и каждую неделю все герои машинного обучения были достаточно любезны, чтобы поделиться множеством удивительных слов для новичков, рассказать о своем путешествии в этой области.

В этом посте я очень рад сообщить, что Chai Time Data Science:

Chai Time Data Science - это перезагрузка собеседований по машинному обучению, я работал над этим проектом в течение последних 3 месяцев, и я очень рад сообщить, что первый эпизод выйдет в воскресенье, 21 июля, с еженедельными выпусками каждое воскресенье. и четверг.

Я немного расскажу о сериале, но сначала хочу поделиться лучшим советом из предыдущих 25 интервью:

Обратите внимание, что это будет очень сжатый совет, возможно, с небольшим отсутствием контекста. Я бы посоветовал вам также проверить все интервью, чтобы получить более подробные и подробные рекомендации.

Интервью с практикующим DL: Доминик Монн

Не бойтесь как можно раньше заявить о себе и испачкать руки - как в бизнесе, так и в машинном обучении. Отправляйте быстро и проходите стажировку, будьте решительны, а остальное придет само.

Интервью с фрилансером по глубокому обучению Туатини Годар

Не сдавайтесь, наука о данных - это междисциплинарная область, и трудно быть хорошим во всех областях. Сначала выберите специализацию и вложите в нее всю свою энергию. Например, я выбрал глубокое обучение для компьютерного зрения, а не, скажем, временные ряды или НЛП. Не обманывайтесь ажиотажем в отношении ИИ, как я, когда я начинал 2 года назад, нет ИИ (или AGI, называйте это как хотите), если вы выберете путь компьютерного зрения, тогда вы станете экспертом по компьютерному зрению, для НЛП вы становитесь экспертом по НЛП. Глубокое обучение помогает решить только часть общей картины, это не сама большая картина, а лишь инструмент, который можно добавить к вашему набору инструментов. Как фрилансеру или эксперту (называйте это как хотите) вам будет предложено делать больше, чем просто играть с моделями глубокого обучения большую часть времени. Узнайте о подготовке данных, навыках разработки программного обеспечения, некоторых DevOps и т. Д., В основном о всем стеке для создания и отправки проекта глубокого обучения в производство, а не только о самой интересной части. Но самое главное, научитесь учиться и адаптироваться, следите за последними тенденциями и всегда будьте в курсе того, что происходит, поскольку в области науки о данных все движется очень быстро.

Интервью с экспертом по ядрам Kaggle: Аакашем Найном:

В какой-то момент вы также почувствуете себя подавленным, наблюдая за продолжающимся объемом исследований. Ничего страшного, если ты так думаешь. Всегда нужно помнить только о двух вещах:

1) Ваш успех не зависит от других и наоборот.

2) Никогда не стесняйтесь и не бойтесь спрашивать даже самые простые вещи. Если вы не спрашиваете, значит, вы мешаете вашему прогрессу.

Интервью с гроссмейстером Twice Kaggle: доктором Жан-Франсуа Пьюже (CPMP)

Читайте обзоры лучших команд после окончания каждого соревнования. Лучше, если вы участвуете в конкурсе, так как вы получите больше от написания, но чтение всех рецензий полезно ИМХО. Именно тогда вы узнаете больше всего о Kaggle.

Интервью с гроссмейстером Kaggle Competitions: KazAnova (3 место): доктором Мариосом Михайлидисом

Понять проблему и метрику, на которой мы тестируемся, - это ключ.

Создайте надежный процесс перекрестной проверки, который больше всего напоминал бы таблицу лидеров или набор тестов в целом, поскольку это позволит мне изучить множество различных алгоритмов и подходов, зная, какое влияние они могут оказать.

Понять важность различных алгоритмических семейств, чтобы увидеть, когда и где максимизировать интенсивность (это линейный или нелинейный тип проблемы?)

Попробуйте множество различных подходов / техник к данной проблеме и охватите ее со всех возможных сторон с точки зрения «выбора алгоритмов, оптимизации гиперпараметров, разработки функций, обработки пропущенных значений» - я рассматриваю все эти элементы как гиперпараметры окончательного решения.

Интервью с исследователем глубокого обучения и НЛП: Себастьяном Рудером

У меня был лучший опыт написания блога, когда я начал писать его для себя, чтобы лучше понимать конкретную тему. Если вам когда-либо придется приложить немало усилий, чтобы развить интуицию, или провести много исследований, чтобы понять предмет, подумайте о том, чтобы написать об этом пост, чтобы в будущем ускорить обучение всех остальных. В исследовательских статьях обычно не хватает места, чтобы должным образом контекстуализировать работу, выделить мотивацию, интуицию и т. Д. Сообщения в блогах - отличный способ сделать технический контент более доступным и доступным.

Самое замечательное в блоге то, что он не обязательно должен быть идеальным. Вы можете использовать его, чтобы улучшить свои коммуникативные навыки, а также получить отзывы о своих идеях и вещах, которые вы могли пропустить.

Интервью с исследователем глубокого обучения и отцом GAN: доктором Яном Гудфеллоу

Начните с очень хорошего изучения основ: программирования, отладки, линейной алгебры, теории вероятностей. Большинство продвинутых исследовательских проектов требуют от вас гораздо большего мастерства в основах, чем они требуют, чтобы вы знали что-то чрезвычайно продвинутое. Например, сегодня я работаю над отладкой утечки памяти, которая мешает мне запустить один из моих экспериментов, и я работаю над ускорением модульных тестов для библиотеки программного обеспечения, чтобы мы могли быстрее опробовать больше исследовательских идей. Когда я был студентом и аспирантом, я часто просил совета у Эндрю Нга, и он всегда говорил мне работать над тщательным овладением этими основами. Я думал, что это было действительно скучно, и надеялся, что он посоветует мне узнать о гиперреальных числах или что-то в этом роде, но теперь, спустя несколько лет, я думаю, что этот совет определенно был правильным.

Интервью с научным сотрудником OpenAI: Кристин МакЛиви Пейн

Что касается специфики - один из моих любимых советов был от Джереми Ховарда из FastAI. Он сказал мне сосредоточиться на создании одного действительно отличного проекта, который продемонстрирует мои навыки. Он говорит, что у очень многих людей есть много интересных, но незавершенных проектов на github, и что гораздо лучше иметь один действительно отточенный.

Еще я бы добавил, что больше всего я узнал о глубоком обучении, когда научил этому других. Я стал наставником курсов Coursera Эндрю Нг и попытка ответить на вопросы других студентов подтолкнула меня к пониманию материала на гораздо более глубоком уровне. Каждый раз, когда вы изучаете новую тему, попробуйте объяснить ее кому-нибудь (это также будет отличной подготовкой к собеседованию!).

Интервью с самым молодым гроссмейстером Kaggle: Микель Бобер-Иризар (анокас)

Если вы только начинаете, будет полезно взглянуть на соревнования на детской площадке или предыдущие соревнования за последние несколько лет. Ядра Kaggle, вероятно, лучший ресурс для обучения, поскольку люди делятся тоннами анализа и решений для всех соревнований. Самое главное - просто поэкспериментировать на себе и попытаться улучшить результат!

Интервью с исследователем глубокого обучения и руководителем OpenMined: Эндрю Траском

Секрет вхождения в сообщество глубокого обучения - качественное ведение блога. Прочтите 5 разных сообщений в блогах на одну и ту же тему, а затем попробуйте составить собственное мнение. Также не пишите что-нибудь нормально - уделите посту 3 или 4 полных дня и постарайтесь сделать его как можно более коротким и простым (но полным). Перепишите его несколько раз. Когда вы будете писать, переписывать и думать о теме, которую пытаетесь преподать, вы придете к ее пониманию. Более того, другие люди тоже поймут это (и они поймут, что вы это понимаете, что поможет вам получить работу). Большинство людей хотят, чтобы кто-то держал их за руку в процессе, но лучший способ научиться - написать пост в блоге, который будет держать кого-то за руку, шаг за шагом (с примерами игрушечного кода!). Кроме того, когда вы пишете примеры кода, не создавайте большой объектно-ориентированной неразберихи. Чем меньше строк, тем лучше. Сделайте сценарий. Используйте только numpy. Учите, что делает каждая строчка. Промыть и повторить. Когда вы почувствуете себя достаточно комфортно, вы сможете делать это с недавно опубликованными статьями - тогда вы действительно знаете, что делаете успехи!

Интервью с создателем Кераса, исследователем искусственного интеллекта: Франсуа Шоле

Я не думаю, что вам следует связывать свои мечты с внешними показателями статуса, такими как работа в конкретной крупной компании, зарабатывание определенной суммы денег или получение определенной должности. Определите, что вы цените в жизни, и оставайтесь верными своим ценностям. Вам никогда не придется сожалеть о единственном решении.

Интервью с автором PyImageSearch и специалистом по компьютерному зрению: доктором Адрианом Роузброком

Один из худших способов начать писать что-либо, будь то технический или нет, - это открыть новый документ и ожидать, что слова будут выливаться из вас, волшебным образом заполняя страницу - это редко срабатывает так, и обычно это рецепт. за разочарование и неудачу.

Вместо этого я рекомендую сначала обрисовать в общих чертах. Я лично выделяю пункты списка.

Сначала начните с заголовков - что вы собираетесь осветить? И в каком порядке?

Оттуда вы вернетесь и начнете заполнять подзаголовки. Что вам нужно осветить в каждом разделе?

Наконец, я возвращаюсь и включаю детали для каждого раздела. Иногда я даже пишу полными предложениями, но это личный выбор.

Я всегда оставляю себе такие пометки, как «Вставьте сюда изображение» или «Строки X-Y some_script.py идут сюда». Я стараюсь как можно больше сосредоточиться на самом процессе написания. Актуальные изображения и код могут быть вставлены позже во время набора.

Интервью с грандмастером Kaggle, специалистом по данным: доктором Боян Тунгуз

Не бойтесь потерпеть неудачу и старайтесь учиться на своих ошибках. Прочтите обсуждения на форумах, взгляните на лучшие ядра и попытайтесь улучшить их.

Интервью с исследователем глубокого обучения на fast.ai: Сильвен Гуггер

Дело не в том, что теория бесполезна, и это будет критически важный элемент, который поможет новичку сформировать свою интуицию, но имеет смысл начать с обучения реальной модели и ее развертывания, прежде чем объяснять, что за ней стоит.

Интервью с главным научным сотрудником Salesforce: доктором Ричардом Сохером

Различайте необоснованные страхи и реальные угрозы. Предвзятость ИИ - это неизбежный страх, с которым нужно бороться, тогда как сценарии Судного дня - опасное отвлечение. Людям необходимо начать уделять пристальное внимание тому, чтобы наборы данных, на которых обучается ИИ, были разнообразными и свободными от предвзятости, и чтобы команды, создающие эти системы, также представляли разнообразный набор точек зрения.

Интервью со специалистом по анализу данных в kaggle: доктор Рэйчел Татман

Мой универсальный совет - не получать докторскую степень. Я даже недавно написал об этом в блоге. Блог посвящен конкретно лингвистике, но большая часть его относится и к машинному обучению. Я думаю, что имея докторскую степень может быть преимуществом, когда вы ищете работу в области науки о данных, но если вы действительно не хотите 1) заниматься исследованиями или 2) быть профессором, нет никакой пользы в получении докторской степени. что вы не можете быстрее заняться чем-то другим.

Я думаю, что Kaggle или другой практический опыт приведет вас к тому моменту, когда вы сможете гораздо быстрее подать заявку на работу. Однако я бы, вероятно, не рекомендовал только участвовать в соревнованиях Kaggle. Так вы многое узнаете об алгоритмах, но не получите столько практики в таких вещах, как очистка данных или разработка показателей. Это одна из причин, по которой я предлагаю людям работать и над своими собственными проектами. Это демонстрирует вашу способность задавать интересные вопросы, создавать и аннотировать данные, очищать данные и думать о том, чего хотят пользователи.

Интервью с внештатным консультантом по глубокому обучению и разработчиком Blockchain: Мами Андре-Рацимбазафи

Я думаю, что большинство рекрутеров и компаний недостаточно зрелы, чтобы оценивать кандидатов. Многие все еще создают свои команды и не имеют собственных знаний, чтобы искать внешние признаки компетентности для набора персонала. Меня гораздо больше беспокоят требования к опыту. Рост глубокого обучения произошел в 2012 году с AlexNet. Я предполагаю, что, помимо США, многие мастера, специализирующиеся на науке о данных, были созданы примерно в 2014 году в университетах, поэтому большинство новых сотрудников с реальной степенью в области науки о данных будут иметь не более 3 лет опыта. Наиболее опытные люди, вероятно, будут самоучками.

Интервью с гроссмейстером и специалистом по анализу данных Twice Kaggle на H2O.ai: Судалай Раджкумар

Прочтите несколько хороших ядер и постарайтесь понять их подробно. Узнайте, как они создают идеи на основе данных, графики, которые они использовали для изображения данных, и выводы, которые они сделали. Также неплохо взяться за новую концепцию (например, новый алгоритм или новую технику) и обучать людей тому же. Мне лично не нравятся ядра, которые просто смешивают выходные данные двух или трех других ядер и получают высокий балл.

Интервью с радиологом, сотрудником fast.ai и экспертом по Kaggle: доктором Александром Кадрен-Шеневертом

Участие в соревнованиях Kaggle имело первостепенное значение в моем обучении глубокому обучению. Созревание практически любого учебного процесса основано на преобразовании знаний в навыки или концепции в действия. Каждое соревнование - это возможность развиваться в этом направлении. Но, естественно, компромисс - это время, которое вы вкладываете в эти соревнования. Таким образом, моя собственная перспектива заключалась в том, чтобы участвовать в ограниченном количестве соревнований по компьютерному зрению, отобранных для эффективного использования большей части потенциальной выгоды.

Интервью с создателем DeOldify, студентом fast.ai: Джейсоном Антиком

Да, вам определенно нужно знать, когда бросить курить, и это настоящее искусство. На самом деле я говорю «нет» и / или бросаю многое. Почему? Потому что на все, чему вы говорите «да», вы говорите «нет» многим другим вещам. Время (и здравомыслие) дорого. В результате, особенно в последнее время, я сказал «нет» довольно большому количеству возможностей, которым другие считают безумным отказать.

Так что для меня уход в первую очередь определяется тем, совпадает ли мой путь с моими ценностями, интересами и сохранением здравомыслия. Если вы говорите об амбициозном технологическом проекте, вам нужно сделать еще один шаг и оценить, реально ли он осуществим. Часто вы просто не можете сразу ответить на этот вопрос, особенно если вы занимаетесь амбициозным проектом! Вот почему вы экспериментируете. Если вы обнаружите вескую причину (а не просто оправдание отказа от гнева), почему что-то не работает, бросьте, извлеките уроки из этого и двигайтесь дальше! Но будьте осторожны в этом вопросе - многие проблемы можно легко решить, просто немного сместив перспективу. По этой причине я буду придерживаться проблемы немного дольше, чем кажется разумным, потому что часто моя точка зрения просто неверна. Часто решение приходит, когда я ухожу (в основном с мыслями о душе).

Интервью с Kaggle Grandmaster, руководителем отдела компьютерного зрения X5 Retail Group: Артур Кузин

Kaggle позволяет очень быстро развить определенный набор навыков. При правильном подходе эти навыки можно превратить в необходимое качество для работы (https://habr.com/ru/company/ods/blog/439812/). Также соревнования позволяют попробовать множество разных заданий и значительно расширить свои знания. Наконец, безумно весело, если вам удастся найти такое дружелюбное сообщество, как ODS.ai.

Интервью со старшим научным сотрудником Лаборатории военно-морских исследований США: доктором Лесли Смит

Что ж, если я читаю статью, и она приводит к идее, важным фактором является то, сделали ли авторы свой код доступным. Если так, я скачаю его и запущу, чтобы повторить их эксперименты. Затем я могу быстро опробовать свою идею, чтобы увидеть, имеет ли она смысл. Здесь для меня важно быстрое прототипирование. Кроме того, их код обеспечивает основу.

Интервью с Kaggle Grandmaster, старшим инженером по компьютерному зрению Lyft: доктором Владимиром Игловиковым

Я очень надеюсь, что все больше и больше Kagglers будут вкладывать деньги в писательское мастерство. Это могут быть сообщения в блогах, статьи или что-то еще. Чем больше информации будет передаваться между людьми, тем лучше. Написание сообщения в блоге или технического отчета поможет вам структурировать мысли о проблемах, это поможет другим людям с теплотой начать решать аналогичные проблемы и, скорее всего, поможет вам с карьерными возможностями. Это означает, что вы будете работать над более интересными задачами и в то же время получать больше денег.

Интервью с Kaggle Grandmaster, Data Scientist в Point API (стартап NLP): Павел Плесков

Итак, мой совет всем: не тратьте драгоценное время и начинайте практиковаться как можно скорее - вы заполните пробелы в теории позже.

Хорошо, а что такое Chai Time Data Science?

Это перезагрузка предыдущей серии, а также:

  • Подкаст
  • Видео-интервью
  • Интервью в блоге

Теперь, когда я только что закончил учебу и, к сожалению, не смог попасть в программу резидентства Google AI, я решил выделить время, чтобы сделать интервью доступными в виде видео, аудио и сообщений в блогах! Это возможно, поскольку я работаю удаленно, но это обсуждение для шоу (эпизод будет выпущен очень скоро!)

Имя

Во время последнего семестра в колледже у меня была возможность внести гораздо больший вклад в сообщество: я провел много времени с сообществами Data Science Network и TWiMLAI.

Я решил потратить 50 часов в месяц на то, чтобы открыть свой календарь для всех, кто хочет «Беседа Chai Time DS». Поскольку я уже был соавтором и признан замечательными людьми. Мои слоты были забронированы менее чем за 1 день на целый месяц!

Затем я решил открыть опрос, и если я получу более ›25 смайлов (это новый способ голосования, не так ли?)

И это тоже было забронировано менее чем за 1 день!

В итоге я проводил по 3 разговора каждый день, каждую неделю весь май, июнь. Я лично многому научился, помогая сообществу. Обычными темами разговоров были бы Kaggle, fast.ai, идеи проектов. Я настоятельно рекомендую всем, кто это читает, попробовать сделать это!

Следовательно, название Chai Time Show звучало наиболее уместно. Шоу также представляет собой сборник самых часто задаваемых вопросов для меня с единственной надеждой, как всегда, помочь сообществу расти и стать лучшими практиками в области науки о данных.

Надеюсь, вам понравится шоу!

Посетите веб-сайт здесь: и, пожалуйста, каждую неделю следите за обсуждениями Data Science вместе с chai.

Шоу будет выпущено на всех наиболее часто используемых платформах для подкастинга, на YouTube, где будут публиковаться видеозаписи, и, конечно же, через сообщения в блогах.

Если вам это интересно и вы хотите стать частью Моего пути обучения, вы можете найти меня в Twitter здесь.

Если вам интересно читать новости о глубоком обучении и компьютерном зрении, вы можете ознакомиться с моим информационным бюллетенем здесь.