Следуя совету Джулии Эванс, я собираюсь писать о вещах, которые мне хотелось бы знать год назад.
Исследования машинного обучения иногда кажутся занятием, предназначенным только для интеллектуально превосходящих людей, в то время как нам, простым смертным, нравится их обрезка, когда они публикуют, а сообщество разработчиков открытого исходного кода реализует их.
Вам не нужна докторская степень
Этот миф был полностью развенчан для меня, когда я прошел курс fast.ai Практическое глубокое обучение для кодеров, версия 3. Итак, мой первый совет, сделайте это. Кроме того, этот пост Рэйчел Томас дает отличный совет тем, кто думает о аспирантуре.
Если что-то из приведенного ниже кажется тарабарщиной, fast.ai - хорошее место.
Советы для людей, желающих начать создавать / улучшать модели глубокого обучения.
Найдите интересующий вас набор данных
Вот хороший пост о том, где это найти. Постарайтесь не получить паралич анализа, просто выберите один. Вы не состоите в браке с выбранным вами набором данных, но вы должны его знать.
Здесь есть множество ресурсов, чтобы научиться визуализировать и анализировать набор данных.
Используйте Google Colab
Если вам нужен бесплатный доступ к графическому процессору, пожалуйста.
Если вы хотите знать, почему или настройка графического процессора становится неприятной.
Получите 100% точность на одном экземпляре ваших данных
Вместо того, чтобы тратить время на загрузку всех данных каждый раз, когда вы хотите проверить наличие ошибок, создайте крошечный набор данных только с одним экземпляром вашего набора данных и дополните его очень простой моделью.
Получите 100% точность примерно на 10% ваших данных
Как только вы сможете переобучить свою модель на одном экземпляре, начните использовать больше своих данных и попытайтесь переобучить ее, добавив больше слоев. На данный момент не используйте какую-либо регуляризацию (например, Dropout, L1 / L2 регуляризацию), это еще один совет по сохранению здравомыслия, чтобы вы знали, что ваша модель учится.
Добавьте все данные о тренировках
Если после добавления всех данных обучение занимает слишком много времени, оставьте его как эксперимент и продолжайте работу с 10% данных. Если вы переобучаете, когда добавляете больше слоев и все свои данные, вот пять шагов, чтобы уменьшить переобучение.
И на сегодня все, эти советы - одни из ценных драгоценных камней, о которых я хотел бы узнать раньше.
Если есть отзывы, дайте мне знать.
Спасибо за чтение