Советы, чтобы пройти через это

Введение

Этот пост представляет собой руководство по изучению CS 7641: Машинное обучение, предлагаемого в OMSCS (онлайн-магистратура по информатике штата Джорджия). Он оформлен как набор советов для студентов, планирующих пройти курс в будущем или заинтересованных в его прохождении.

Содержание этого руководства основано на более старом варианте курса, поэтому не стесняйтесь заходить туда, если вы хотите увидеть программу курса и прояснить любую терминологию, которую вы можете увидеть в этом руководстве, которая кажется предметной областью, специфичной для курса.

Если вы хотите прочитать мой обзор этого курса или других курсов, не стесняйтесь читать их здесь.

Если вам нужна дополнительная помощь, выходящая за рамки этого поста, не стесняйтесь отправить мне запрос на репетиторство здесь, и я свяжусь с вами как можно скорее!

Совет №1: используйте меньшие наборы данных

Чем меньше наборов данных вы используете для заданий, тем лучше. Идеально около 250–1000 экземпляров в каждом используемом вами наборе данных. Причина, по которой меньшие наборы данных лучше, чем большие, заключается в том, что это экономит вам огромное количество времени при создании результатов, необходимых для каждого из ваших заданий. Чтобы получить результаты для заданий, требуется значительное количество времени на НИОКР, которого нельзя избежать, поэтому, чтобы помочь себе и сократить это время до минимума, используйте меньшие наборы данных для каждого из заданий.

Совет № 2: используйте предварительно обработанные наборы данных

Подобно использованию меньших наборов данных для назначений, лучше, если вы будете использовать наборы данных, которые уже предварительно обработаны при выполнении каждого из них. Этот курс не сосредотачивается и не уделяет особого внимания какой-либо работе, которую обычно необходимо выполнить, чтобы сделать набор данных жизнеспособным для использования в модели машинного обучения. Сэкономьте время и усилия, необходимые для того, чтобы сделать наборы данных пригодными для использования в моделях машинного обучения, и используйте наборы данных, которые можно использовать немедленно.

Пара хороших мест, где вы можете получить предварительно обработанные наборы данных, которые также небольшие, - это База данных UCI и Kaggle. Есть целый список других мест, но этого должно быть достаточно, чтобы вы начали!

Совет № 3: интересно интересно

Большое слово, которое вы слышите на протяжении всего курса, - это слово «интересный» в том смысле, что ваши задания должны показывать интересным образом выполняемые в задании машинные алгоритмы. Теперь вы можете подумать, что для того, чтобы модель машинного обучения выглядела интересной, вы должны использовать ее с очень большим набором данных или получить точность 99% при использовании ее для задачи классификации, но это определенно не так. В контексте этого курса интересно сравнить и противопоставить, как каждая отработанная модель машинного обучения ведет себя в разном наборе рабочих условий. Например, интересно показать, как изменение глубины дерева решений имеет значение при решении задачи классификации.

Совет 4: используйте LaTeX

Вместо использования Word, Google Docs или какого-либо другого WYSIWYG при написании ваших заданий используйте LaTeX. Возможно, вы думаете, почему вам стоит изучить и использовать LaTeX для написания своих заданий, а не просто использовать Word или Google Docs, и ответ заключается в том, что это экономит вам много времени при работе с рисунками или таблицами в ваших заданиях. LaTeX автоматически перенаправляет содержимое документа вокруг ваших рисунков или таблиц, так что каждый раз, когда вы добавляете или обновляете один из них, вам не нужно вручную исправлять форматирование вашего задания.

Если вы заинтересованы в использовании LaTeX, посмотрите Overleaf. Overleaf предоставляет очень хороший онлайн-редактор для создания и редактирования документов LaTeX без необходимости установки LaTeX на ваш компьютер.

Совет № 5: приходите в рабочее время

Ни для кого не секрет, что в рабочее время специалисты по тестированию, как правило, дают довольно подробные подсказки об экзаменах по курсу и критериях оценивания, которые используются при выставлении оценок за задания. Сделайте ставку на то, чтобы ходить каждую неделю, если это возможно, и как минимум смотреть записи рабочего времени, которые ТП предоставляют студентам после их посещения.

Совет № 6. Экзамены проверяют, чего вы не делали в заданиях.

Экзамены в этом курсе дополняют задания: они проверяют вас на то, чего вы не делали в заданиях. Это означает, что при подготовке к экзаменам, вместо того, чтобы тратить много времени на рассмотрение заданий, настоятельно рекомендуется просматривать лекции и чтения и ожидать, что проблемы на экзаменах возникнут именно от них. При этом вы не хотите полностью отказываться от просмотра каких-либо своих заданий, поскольку они помогают проанализировать концепции, которые появляются на экзаменах, но вы не должны сосредотачиваться на них, а также на лекциях и чтениях.

Я надеюсь, что этот пост помог вам и поможет вам успешно пройти курс. Не стесняйтесь обращаться ко мне в LinkedIn, если хотите задать вопрос или поздороваться!