В сегодняшнем контексте, когда у нас есть огромный объем данных, хранящихся в наших системах или на сервере, мы не будем считаться умными, если не будем использовать их.

«Данные — это новая нефть»

Данные вносят значительный вклад в принятие как стратегических, так и тактических решений в фирмах и, следовательно, обеспечивают и укрепляют доверие между различными внутренними и внешними заинтересованными сторонами (такими как клиенты, заказчики, поставщики, потребители и т. д.). В отсутствие этого доверия закупки не имеют своей ценности. В контексте закупок машинное обучение (ML) превращает процесс принятия решений на основе данных в более масштабный и точный. С ML системы учатся из окружения без какого-либо явного программирования. Машинное обучение упрощает процесс проверки данных, позволяя избежать ручной работы и высвобождая больше времени для более глубокого анализа и стратегической работы. Алгоритмы машинного обучения извлекают информацию из доступных областей, богатых данными, — общедоступной, частной и корпоративной информации (например, данные о расходах на закупки, контракты и рыночную информацию) в интересах закупочных организаций.

Сегодня одним из ключевых вариантов использования алгоритмов машинного обучения является классификация данных о расходах, позволяющая лучше отслеживать расходы. Кто-то может быть удивлен, узнав, что современные фирмы имеют сотни или тысячи миллионов долларов неправильно классифицированных или неправильно сгруппированных данных о расходах. Это, безусловно, мешает им эффективно управлять своими расходами. Ручной процесс классификации данных о расходах является трудоемким и иногда приводит к точной классификации около 80 % данных о расходах, что тоже иногда не согласуется. Для крупных организаций проблема еще более сложная. Сотрудники из различных бизнес-подразделений и регионов используют различную номенклатуру для названий поставщиков, общего описания счетов или счетов-фактур и т. д., что приводит к проблемам с большими неправильно классифицированными или неклассифицированными данными о расходах, которые не являются «текстовыми» насыщенными или непротиворечивыми.

Различные организации, такие как SAP Ariba, Zycus, GEP, Coupa и т. д., взялись за решение этой проблемы с помощью различных подходов. Давайте посмотрим на некоторые из них, чем они занимаются:

Потратьте 360 (недавно приобретенные Coupa):

Coupa Spend360 утверждает, что использует другой подход к сложным задачам стандартизации, нормализации и обогащения данных о расходах. Spend360 обеспечивает очень высокий уровень точности при категоризации расходов благодаря искусственному интеллекту и технологиям глубокого обучения, основанным на базе данных из более чем 100 кубов расходов с расходами на сумму более 1250 миллионов долларов. Позже они объединяют это со своей командой узкоспециализированных экспертов по обеспечению качества, которые тщательно проверяют данные для дальнейшего повышения уровня точности.

Отслеживание расходов Ariba:

SAP Ariba параллельно использует три основных механизма классификации для определения кода категории. Вот эти три двигателя:

  • Двигатель поставщика
  • Механизм правил: используйте главную книгу или группу материалов для классификации по соответствующим категориям.
  • Механизм НЛП: читает текстовые описания в свободной форме и исследует их в базе знаний, чтобы предлагать товары для покупки.

Затем выходные данные трех вышеуказанных механизмов оцениваются механизмом логического вывода для определения наиболее вероятного кода или категории классификации и назначения доверительного интервала. Затем их специалисты по инструментам проверяют результаты и при необходимости переназначают новую категорию. Их инструмент классификации рассматривает все предоставленные ему входные данные, прежде чем завершить его категории.

Расходы GEP:

Инструмент на основе правил стандартизирует наборы данных, устанавливая ограничения и правила для классификации. Пакеты специализированных технологий, такие как GEP Spend, интегрируют сторонние онлайн-сервисы или базы данных опыта консультантов для определения критериев. На основе правил, используя методологию ближайшего соответствия, ML присваивает каждому полю ближайшую предлагаемую категорию или подкатегорию.

Однако более или менее все эти фирмы работают по одному и тому же принципу, хотя и должны использовать разные алгоритмы. Одна из основных предпосылок остается прежней: Чем больше данных вы предоставляете своему алгоритму машинного обучения, тем выше точность классификации расходов. Таким образом, фирмы могут улучшить результаты своего алгоритма и улучшить видимость до 95% или более в зависимости от успешного выполнения инструмента классификации Расходы на основе машинного обучения.

Первоначально опубликовано на http://mercuryquant.com 9 мая 2019 г.