Шаблон для проведения 90-минутной вводной части семинара по машинному обучению

В марте этого года мы с моим другом Джихен Ким решили, что хотим поделиться со студентами кое-чем из того, что мы узнали в области науки о данных и пакета Anaconda. Этот семинар был частью серии семинаров по интерактивным медиа в Нью-Йоркском университете Абу-Даби.

После некоторого исследования (поиска в Google) мы не смогли найти ни одного общего вводного материала семинара по Python + ML, который имел бы необходимую длину, соответствовал всем уровням навыков и был интересен. Те, что были в сети, были либо очень простыми и скучными, либо слишком сложными для одного 90-минутного сеанса.

Учитывая ограниченное время, мы поставили перед собой цель создать семинар, который объясняет базовый стек науки о данных и вдохновляет студентов учиться самостоятельно. Нашей целевой аудиторией был тот, кто разбирается в основах программирования. В ходе семинара мы надеялись, что сможем зажечь разговоры об этических проблемах, связанных с автоматизацией, о том, как доверять алгоритмам черного ящика при принятии решений, и о присущих алгоритмах предвзятости. Наконец, мы также хотим поделиться с вами нашим материалом, чтобы упростить обучение ML.

Все материалы размещены на Github бесплатно для использования или поддержки.

В первой половине мы начали с объяснения того, что такое Anaconda и как ее настроить. Затем мы кратко рассмотрели Python и познакомились с некоторыми функциями Pandas, необходимыми для второй части семинара. Инструкции по установке находятся в README, кодирование начинается в записной книжке part1.

Во второй половине мы работали над вымышленной историей: в стране Арстотцка дела идут неважно, продовольственные запасы в стране истощаются. Если граждане хотят поесть, они должны отправить письмо в Департамент продовольственных товаров. Чиновники оценивают их запросы и либо отклоняют их, либо отправляют кусок пиццы. Вы - инженер отдела программного обеспечения, и ваш начальник сказал вам автоматизировать утверждение запросов с помощью этой новой вещи, называемой машинным обучением… Ссылка на полную записную книжку и на скелетная тетрадь . Наш набор данных - это набор данных Kaggle Random Acts of Pizza, который мы изменили для целей семинаров.

Семинар прошел очень гладко, и было здорово увидеть так много людей, особенно первокурсников, у которых были только абстрактные идеи о машинном обучении. Теперь я понимаю, почему преподавание может быть такой удовлетворительной работой. Мы также узнали много нового, что будем использовать в следующий раз, когда будем проводить семинар.

Наш общий совет мастерской:

  • Сделайте это с партнером! Трудно учить людей и одновременно прыгать по комнате, чтобы помогать людям с их ошибками. Я советую, чтобы один человек преподавал половину занятия, в то время как другой ходит исправляя ошибки, а затем переключитесь на вторую половину. Кроме того, обучение утомительно ...
  • Сделайте код для всех! Хотя кажется бессмысленным, что все копируют ваш код на экране, я считаю, что люди узнают больше и чувствуют себя более уполномоченными писать код самостоятельно.
  • Разошлите календарное приглашение всем участникам накануне, чтобы они не забыли!
  • Постарайтесь уговорить их установить все программы заранее в качестве домашнего задания. В любом случае загрузите все на USB-накопитель, который можно передавать, потому что у многих они все еще не установлены, и, конечно же, Wi-Fi не справится с загрузкой 15 человек.

Мы будем рады услышать, если вы нашли наш шаблон полезным. Не стесняйтесь использовать его любым способом!