В последнее время в Индии появилось множество стартапов, которые утверждают, что создали и внедрили алгоритмы, которые со временем учатся, становятся умнее и самосовершенствуются. Эти передовые технологии называются «алгоритмами машинного обучения». Чаще всего эти три слова используются, чтобы привлечь инвесторов к инвестированию в стартап/продукт, основной алгоритм которого едва доказан. Он используется как модное словечко в презентациях почти как «инвест-приманка» для инвесторов. К сожалению, большинство инвесторов покупаются на это, потому что они не понимают, что это значит, и западные коллеги сказали им, что это «следующая большая вещь!»

Чтобы привести вам пару примеров применения машинного обучения, они используются в принятии решений, обнаружении спама, управлении фермами данных для управления энергопотреблением, прогнозировании генов, вызывающих аутизм, мошенничестве с кредитными картами. и даже Фильтры Snapchat, чтобы надеть на лицо собачьи уши. Вот список десяти способов разработки алгоритмов машинного обучения и вот еще шесть.

Так что же такое машинное обучение и как оно работает? Этот пост — моя попытка разобрать машинное обучение по аналогии, понятной инвесторам. Вот оно:

Думайте об алгоритме как о финансовой модели стартапа. Финансовая модель построена с использованием определенных допущений с кучей формул, связанных друг с другом, чтобы дать вам прибыль и убыток, баланс и денежные потоки. Эта система называется «Модель». Теперь инвесторы понимают, что прогнозы/прогнозы, сделанные в Финансовой модели, настолько хороши, насколько хороша Модель, разработанная для этой конкретной компании в этой конкретной отрасли. например Финансовая модель для кредитной компании не будет иметь тех же допущений и формул, что и автомобильная компания. Построение почти точной модели имеет решающее значение для прогнозирования ожидаемой прибыли в будущем. Однако, если ваша основа для построения модели неточна, т. е. вы используете неправильные предположения и формулы, вся ваша модель развалится. Вы никогда не сможете предсказать свои вероятные доходы.

Теперь подумайте об алгоритме машинного обучения таким же образом. Если предположения и формулы, используемые для построения модели алгоритма, неверны, весь алгоритм машинного обучения разваливается. Независимо от того, насколько точны данные, которые вы вводите в алгоритм, алгоритм будет корректировать свои предположения и формулы неправильно. Результаты, достигнутые в такой ситуации, будут совершенно неадекватными (как и большинство финансовых моделей, которые мы получаем от большинства инвесторов в наши дни).

Мое предложение для инвесторов, которые оценивают стартапы/продукты с компонентом машинного обучения:

Забейте модель алгоритма. Уточните предположения, сделанные при построении алгоритма. Стресс-тест модели алгоритма. Большинство предпринимателей утверждают, что алгоритм — это секрет продукта, и поэтому они не могут делиться информацией (чушь собачья). Для них это просто способ уйти от показа/рассказа вам, что на самом деле происходит с их алгоритмом. Спросите их, какой уровень точности достигается с помощью их алгоритма. Большинство уровней точности не превышают 50% (что так же хорошо, как подбросить монетку).

Вперед.

Первоначально опубликовано в Osborne Saldanha.