Контрольный список вариантов использования машинного обучения

Найдите лучшие варианты использования для вашей команды с помощью этого контрольного списка.

У каждой компании, работающей с данными, есть варианты использования машинного обучения. Не упустите возможность найти лучшее в своей компании с помощью контрольного списка вариантов использования машинного обучения.

1. Где найти идеи

Прежде чем начать, уточните, что имеет значение в данный момент.

Каковы три наиболее важные стратегические цели вашей команды?

Это сфокусирует ваши идеи и повысит вероятность того, что созданное вами решение окажется ценным.

Источник идей A: ручной анализ данных

Перечислите все процессы, которые требуют от вашей команды много времени на анализ данных.

Машинное обучение — это просто машина для поиска закономерностей. Он находит закономерности в наборе данных, а затем использует эти знания для прогнозирования.

Это именно то, что мы, люди, обычно делаем, когда анализируем данные: мы пытаемся понять — определить закономерность.

Поэтому, если кто-то из вашей команды снова и снова анализирует данные определенного типа, машинное обучение может сэкономить ваше время и энергию.

Этот анализ данных часто повторяется?

Модели машинного обучения ограничены — они могут научиться делать только одну конкретную вещь. Это означает, что вы можете автоматизировать только повторяющиеся задачи.

Вам также понадобится много обучающих примеров для алгоритма — не менее 200. Поэтому убедитесь, что у вас достаточно данных.

Нужно ли вам масштабировать этот процесс для достижения одной из ваших стратегических целей?

Машинное обучение делает прогнозы дешево и быстро. Если он не может полностью автоматизировать ваши прогнозы, он окажет значительную поддержку вашей команде и сделает их более эффективными в решении конкретной задачи.

Это особенно ценно, если вы хотите обработать гораздо больший объем прогнозов в будущем.

Все ли важные факты зафиксированы в наборах данных?

Машины могут только читать цифровые данные. Если задача включает в себя информацию, которой нет в каком-либо наборе данных (такие вещи, как разговоры, ручные проверки и т. д.), то машина окажется в невыгодном положении и, вероятно, не сможет выполнить задачу к вашему удовлетворению.

Важно. Вам не нужна идеальная база данных, в которой все хорошо структурировано в одном месте. Специалисту по данным не очень сложно комбинировать наборы данных. Важно то, что у вас уже где-то есть данные.

Источник идеи B: принятие решений по программному обеспечению

Перечислите все используемое вами программное обеспечение, которое постоянно принимает решение или делает прогноз (даже листы Excel) на основе набора правил.

Вопреки распространенному мнению, машинное обучение обычно лучше всего использовать для улучшения существующего программного обеспечения, а не для замены человека.

Как и в случае с ручными процессами, это должен быть процесс с большим объемом, чтобы вы могли предоставить алгоритму достаточное количество примеров для обучения.

В частности, определите места, где программное обеспечение реализует определенные правила — и где вы подозреваете, что эти правила не полностью отражают реальную, лежащую в основе сложность соединений. Машинное обучение может передать вам эту сложность, найдя тысячи правил.

Можете ли вы ответить «да» на эти 2 вопроса?

Может ли эксперт-человек принимать более правильные решения?

Если человек может принять лучшее решение, то это хороший признак того, что текущие правила не отражают истинную сложность решения.

Если это так, то вы можете взять интервью у этого эксперта и выяснить, какие данные вам нужны для подачи алгоритму, чтобы он мог попытаться научиться делать то же самое.

Сохранили ли вы › 500 примеров «правильных» прогнозов для данной ситуации?

Алгоритму требуется много примеров, чтобы изучить эти шаблоны. Вам нужны примеры входных факторов и особенно правильных выходных данных — значений, которые, как вы ожидаете, алгоритм предскажет в данной ситуации.

Если у вас недостаточно правильных прогнозов, вы можете попросить эксперта-человека аннотировать данные с ожидаемым результатом.

2. Как расставить приоритеты для идей

Теперь, когда вы сузили список идей, вы можете сравнить их по следующим факторам:

Ценность. В лучшем случае, насколько ценным будет решение?

Сколько времени и ресурсов вы экономите благодаря автоматизированной поддержке принятия решений? Что еще станет возможным после того, как вы автоматизируете эту задачу и/или резко повысите ее точность?

Доступность данных. Есть ли у вас уже все данные, необходимые для работы алгоритма, прямо сейчас?

Это не данные, которые у вас могут быть в будущем, а история данных, к которой у вас есть доступ сейчас. Сколько там? Насколько это актуально?

Эталонная доступность – другие команды уже создавали подобные системы?

Это исследовательский проект с несколькими сопоставимыми решениями? Или другие команды — может быть, в других отраслях — уже решали подобную задачу?

Хорошая ссылка может значительно снизить риск проекта.

Простота проверки. Вы должны быть в состоянии создать доказательство концепции за 6 недель или меньше.

Если у вас нет четкого представления о том, как проверить свою идею в течение 6 недель, то будьте осторожны. Успешные проекты обычно просты и легко поддаются проверке.

Скачать контрольный список

www.datarevenue.com/en-resources/ml-usecase-checklist

Контрольный список также включает шаблон Google Docs, так что вы можете сразу приступить к его заполнению.