Индустриализация аналитики

Измельчение данных – не новая задача на предприятии. Компании всегда стремились преобразовать точные цифры в значимые результаты, хотя традиционно это было трудоемкой и дорогостоящей задачей.

За последние 20 лет технологии приблизили компании к стратегической точке принятия решений на основе фактических данных. Но по мере того, как они осваивали науку о данных и интегрировали элементарные инструменты аналитики, возникла проблема: наборы данных организации быстро перерастали возможности управления ими и извлечения из них ценности. Термин «большие данные» вошел в деловой лексикон, и технологиям снова пришлось играть в догонялки.

Перенесемся в сегодняшний день, и компании — большие и малые, промышленные и потребительские — все еще стремятся получить максимальную информацию из гор информации, имеющейся в их распоряжении. Гонка за предоставление всеобъемлющего решения вызывает ожесточенные споры, и в ней участвуют некоторые из крупнейших мировых игроков в области технологий.

Инновации в этой области были основаны на искусственном интеллекте (ИИ) и машинном обучении, и использование новейших форм этих технологий в настоящее время прочно зарекомендовало себя как катализатор для раскрытия потенциала данных. Филип Харкер, генеральный менеджер по аналитике DXC Technology, говорит, что предприятие приближается к моменту настоящей трансформации.

«В течение многих лет мы разрабатывали решения для машинного обучения и искусственного интеллекта, первоначально для интересных вариантов использования, таких как обнаружение изображений для обнаружения контрафактной продукции или анализ изображений в других примерах», — объясняет Харкер Digital Bulletin.

«Эти инновации помогли нам разработать модели и знания. Настало время индустриализировать эти экземпляры машинного обучения и ИИ и внедрить их в общий бизнес-процесс для достижения результатов. Например, в DXC мы разработали ИИ-решение для автоматизации обработки решений в режиме реального времени при закупке услуг для клиента, предоставляющего финансовые услуги, что позволяет клиенту стать управляемым ИИ».

Финансовые услуги — это один из двух основных секторов, где, по мнению Харкера, «индустриализация» ИИ окажет огромное влияние на оптимизацию данных, второй — здравоохранение. Согласно недавним прогнозам Markets and Markets, мировой рынок аналитики в области здравоохранения, который в настоящее время оценивается в 14 миллиардов долларов, через пять лет вырастет до более чем 50 миллиардов долларов.

Машинное обучение лежит в основе большинства успешных вариантов использования расширенной аналитики. Алгоритмы машинного обучения существуют уже много лет, но только недавно эти сложные математические расчеты стали успешными для понимания огромных объемов данных. По словам Харкера, преодоление этого рубежа в конечном итоге принесет пользу как организациям, так и их клиентам.

«Например, в финансах ИИ используется для обнаружения мошенничества или выявления рисков, а также для поддержки более эффективного управления», — говорит он. «В здравоохранении речь идет об улучшении результатов лечения пациентов за счет использования глубокой аналитики для поиска закономерностей и расширения наборов данных. Все эти виды использования становятся возможными благодаря огромному количеству данных и вычислений, доступных на кране, и обе эти отрасли строго регулируются.

«Все дело в ИИ, но на самом деле, если копнуть глубже, многие случаи связаны с машинным обучением. Одним из ярких примеров этого является роботизированная автоматизация процессов, или RPA, которая невозможна без машинного обучения. Часто RPA встроен в решение в виде бота, но настройка и совершенствование машинного обучения имеет решающее значение для реализации ценности RPA».

Кроме того, новой проблемой является потребность клиентов в мгновенном доступе к ценной аналитике. Провайдеры, такие как DXC, должны найти баланс между приоритизацией доставки клиентов и поддержанием инноваций в пространстве, методология, известная как «DataOps». Достижение упрощенного подхода к аналитике будет иметь ключевое значение, если оптимизация данных в масштабе должна охватывать все предприятие.

«Традиционно многие обсуждения аналитики были посвящены инновациям и вариантам использования», — отмечает Харкер. «Тем не менее, сегодня все больше и больше диалогов ведется с операционализацией результатов аналитики в сочетании со спросом на аналитику самообслуживания, когда пользователи ожидают, что данные, модели и идеи будут у них под рукой для получения собственных выводов, которые, в свою очередь, могут быть использованы. обратно в репозиторий для общего пользования. Так что демократизация данных — это новая норма».

Собственные аналитические услуги DXC, включающие передовые аналитические инструменты, такие как ИИ, с устаревшими методами, такими как бизнес-аналитика, объединены в три основные области.

Сегмент «Промышленные аналитические бизнес-решения» компании охватывает аналитику клиентов — прогнозирование потребностей клиентов на основе понимания их поведения — и отраслевые решения. Он оставил особый след в автомобильном секторе, насчитывая шесть из десяти крупнейших мировых производителей в качестве клиентов.

Линия услуг «Управление информацией» включает в себя управление данными, управление жизненным циклом информации и работу с GDPR, а ее третья область, «Инжиниринг данных и сервисы платформы», представляет собой управляемые услуги DXC, предлагающие обработку данных на ведущих платформах, включая доминирующие общедоступные облачные сервисы, такие как AWS, Azure и Google. Как подчеркивает Харкер, облако, несомненно, изменило ландшафт аналитики данных вместе с переходом предприятий на гибридные среды.

«Доля аналитических рабочих нагрузок, обслуживаемых облачными провайдерами, выросла в геометрической прогрессии, и многие из них имеют архитектуру и инструменты для более эффективного обслуживания распределенных вычислительных сред», — добавляет он.

«AWS, Azure и Google являются стандартами де-факто; мы видим много примеров миграции больших данных из систем аналитики в облако; более того, мы наблюдаем, как многие переходят на гибридный подход, при котором организации используют комбинацию облачных сервисов и локальных систем.

«У нас есть обширные службы миграции для таких рабочих нагрузок, но это не просто вопрос переноса и переноса рабочих нагрузок. Часто данные необходимо очищать в качестве предварительного условия для переноса сервисов за пределы предприятия. Отсюда и наше смежное предложение услуг по управлению информацией, наряду с инжинирингом данных и услугами платформы».

Интернет вещей (IoT) создает для компаний еще больше возможностей использовать данные в своих интересах, но уникальные характеристики решений IoT часто приводят к трениям с установленными инфраструктурами управления данными. Опрос соответствующих компаний, проведенный Gartner, показал, что более трети предпочли бы полностью отдельные возможности управления данными для IoT.

Однако обработка данных в распределенных сетях становится проще благодаря росту числа программных библиотек с открытым исходным кодом, таких как Apache Hadoop. Харкер говорит, что DXC находит способ извлечь выгоду из потенциала Интернета вещей и периферийных вычислений.

«Распределенные вычисления не новы, но контейнеризация вычислительного кода теперь становится нормой, упрощая развертывание таких сред», — комментирует он.

«IoT значительно вырос за последние годы, но теперь речь идет не столько о разработке вариантов использования, сколько о граничных вычислениях и сквозной архитектуре. Сейчас мы находимся на пороге создания индустриальных аналитических бизнес-решений для Интернета вещей. Наш роботизированный привод DXC является хорошим примером. Это позволяет разработчикам систем автономного вождения собирать, управлять и анализировать огромные объемы глобальных данных датчиков со значительной скоростью.

«Он не только охватывает многочисленные проблемы распределенных вычислений в масштабе, но также учитывает различные характеристики данных, генерируемых транспортным средством. Кроме того, архитектура Robotic Drive является эталонной платформой для промышленных приложений IoT, платформой, которая может масштабироваться и основана на модели потребления».

Ясно одно; Задача управления данными резко возросла по мере того, как среды и сети становятся все более сложными. Компании стремятся определить свои дорожные карты данных, но на этом пути обнаруживают препятствия, не более чем поиск подходящей рабочей силы.

Разрыв в навыках распространен во всем технологическом секторе и особенно заметен в специализациях, основанных на данных. IBM считает, что к концу 2020 года на науку о данных будет приходиться 28% всех рабочих мест в сфере технологий, и Европейская комиссия предусматривает создание 100 000 должностей, связанных с данными, в регионе в те же сроки. Но есть ли предложение, чтобы удовлетворить спрос? В самой DXC работает более 8000 профессионалов в области аналитики, и Харкер признает, что подбор персонала находится на переднем крае ее работы в этой области.

«Подбор персонала для нас — это постоянное явление. За последний год мы увеличили количество сотрудников нашей практики на 50%, и мы ожидаем, что это продолжится и в будущем», — объясняет он. «У нас есть глубокие знания в четырех основных областях: наука о данных, инженерия данных, бизнес-консалтинг и DevOps.

«Как это становится все более нормальным, лично я ношу более одной шляпы. Я возглавляю группу Solutions and Advisory for Analytics в Великобритании, Ирландии, Израиле, на Ближнем Востоке и в Африке — команду, которая продает, консультирует и разрабатывает решения для аналитики и данных. Во-вторых, я руковожу основными телекоммуникационными клиентами DXC в области аналитики, где я консультирую и курирую проекты и услуги.

«В обеих ролях быть в теме и оставаться в авангарде отраслевых тенденций имеет решающее значение для постоянного развития».