CodeNotary: AIOps — сокращение расходов на сервер с помощью машинного обучения

Ученики: Джанлука Макауда, Марица Нортон Олесон

По мере того, как наша зависимость от цифровых платформ растет, все больше и больше организаций — от банков до государственных учреждений — обнаруживают, что их операционные расходы раздуты из-за неправильно настроенных настроек сервера. CodeNotary может предоставить экспертные знания для решения этих проблем, но авансовое инвестирование ресурсов трудно расставить по приоритетам, когда нет коммерчески доступного метода оценки ожидаемого воздействия на бизнес. Марица Нортон и Джанлука Макауда разработали инструмент, призванный помочь пользователям VMWare NUMA в принятии решения путем прогнозирования влияния изменений конфигурации на производительность серверных систем.

В этом проекте наши студенты получили доступ к уникальной источник данных предоставлен CodeNotary. Они настраивают инфраструктуру для обработки данных и прогнозируют эффективность сервера на основе настроек конфигурации сервера и исторических моделей использования. Их пилотные регрессионные модели предсказывали влияние известных изменений конфигурации на крайне неэффективные системы в пределах 82–92% от фактических результатов. Это закладывает основу для приложений, которые позволяют организациям с большей точностью количественно оценивать влияние изменений конфигурации.

SPI: импульс социального прогресса

Ученики: Хильда Фернандес-Конча Янсен, Лена Руби, Селин Капелли

Мы склонны связывать успех страны с экономическим ростом, предполагая, что экономический рост и социальный прогресс идут рука об руку. Индекс социального прогресса (SPI) был создан в качестве альтернативы ВВП для измерения социального прогресса страны. SPI — это система, связанная с Целями устойчивого развития Организации Объединенных Наций, состоящая из нескольких показателей, которые можно разделить на три измерения: основные потребности человека, основы благополучия и возможности.

В этом проекте , Джильда, Лена и Селин объединились с фондом Social Progress Imperative, который предоставил набор данных из 52 показателей, используемых для расчета SPI, для более чем 160 стран за последние десять лет (2011–2020). Они применили неконтролируемое машинное обучение, чтобы найти похожие группы стран на основе их социального прогресса. Это позволяет получить список стран, наиболее похожих на данную страну, и эту функцию теперь можно добавить на веб-страницу SPI. меньший набор ключевых признаков, которые позволяют напрямую визуализировать сходства и различия между странами. Для этой цели они создали интерактивные и удобные визуализации, которые могут позволить заинтересованным сторонам общества взаимодействовать с данными, предоставленными императивом социального прогресса.

Sihl: расширенное прогнозирование денежных потоков

Студенты: Фердинанд Лиммер, Рауль Штайгер, Томас Мэсси

Многие компании изо всех сил пытаются предвидеть свои немедленно доступные финансовые средства в ближайшем будущем. Сколько у нас наличных? Сколько мы можем потратить? Возможность делать хорошо обоснованные прогнозы того, что может произойти, позволяет разумно планировать. Однако в целом это важно, особенно во времена высокой неопределенности, например, во время все еще продолжающейся пандемии CoViD-19.

Томас, Фердинанд и Рауль помогали SIHL Group, малому и среднему бизнесу со штаб-квартирой в Остермундигене ( BE, Швейцария), чтобы проанализировать свои бизнес-данные, чтобы, во-первых, восстановить исторические денежные потоки, а во-вторых, спрогнозировать ближний (1–3 месяца) и отдаленный (> 3 месяцев) будущий денежный поток на основе как исторических данных, так и отзывных. денежный поток (то есть ожидаемый денежный поток, связанный, например, с платежами, которые, как известно, должны быть произведены в определенный момент времени).

Команда использовала Prophet, библиотеку, созданную Facebook и которая специально разработан для анализа и прогнозирования временных рядов. Prophet основан на аддитивной модели, в которой нелинейные глобальные тренды сочетаются с сезонностью и праздничными эффектами. Известно, что он лучше всего работает с временными рядами, которые имеют сильные сезонные эффекты (ежедневно, еженедельно, ежегодно). Кроме того, Prophet использует STAN, современную платформу для статистического моделирования и высокопроизводительных статистических вычислений, что делает подгонку очень быстрой.

Nispera: анализ производительности солнечных электростанций

Ученики: Маркус Линдберг, Лина Зигрист, Лиза Кроутер

Выявление потерь от загрязнения на фотогальванических установках и принятие решения о том, когда чистить панели, является важной бизнес-задачей. Затраты на очистку панелей на таких крупномасштабных предприятиях необходимо сопоставлять с потерями производительности из-за загрязнения.

Задача состояла в том, чтобы определить потери производительности, возникающие из-за данные датчика загрязнения, которые будут количественно определять загрязнение. Лиза, Лина и Маркус разработали полуавтоматический конвейер для анализа производительности фотоэлектрических панелей с использованием данных о выходной мощности для обнаружения потерь, связанных с загрязнением всего парка, и для дальнейшего анализа загрязнения отдельных рядов панелей для выявления групп наиболее загрязненных рядов. Это будет полезно для рекомендаций по очистке и техническому обслуживанию, позволяя обнаруживать загрязнения только по данным о выходной мощности, температуре и освещенности.

Cencosud Scotibank: анализ отзывов пользователей

Ученик: Натали Ариас

Цель проекта Натали состояла в том, чтобы получить информацию из отзывов клиентов для улучшения приложения онлайн-банкинга Cencosud Scotiabank. Поиск в Интернете позволил ей собрать отзывы пользователей о конкурирующих приложениях. Она использовала методы обработки естественного языка (NLP) для извлечения ключевых фраз и, таким образом, сравнила обзоры приложений Scotiabank с отзывами их конкурентов. Результаты позволят Scotiabank понять, как их клиенты получают свои услуги и как они могут улучшить свою работу, чтобы не отставать от своих клиентов.

Университетская клиника Лозанны: сходство пациентов в онкологии

Ученик:Жюльен Дюпон

Прецизионное лечение — это будущее медицины, которое подразумевает определение когорт и расстояния от индексного пациента до своего кластера. Жесткая кластеризация, основанная на знании предметной области, по-прежнему является доминирующим подходом, используемым врачами для назначения соответствующего лечения. В онкологии визуализация, лабораторный анализ и жизненно важные параметры помогают классифицировать пациентов по типам и стадиям рака, а также по уровням способности противостоять лечению и его побочным эффектам.

Центр прецизионной онкологии университетской больницы в Лозанне предоставил уникальный набор данных о более чем 80 000 пациентов. Жюльен Дюпон помог настроить конвейеры Data Sciences и положил начало новой исследовательской теме в больнице. Его доказательство концепции демонстрирует актуальность этого подхода, раскрывает потенциал метода и будет способствовать получению финансирования в будущем.

В долгосрочной перспективе этот проект направлен на добавление уровня знаний, основанных на данных, для поддержки принятия решений. Неконтролируемое обучение, основанное на демографических данных и данных о путешествиях пациентов, позволит нам определить общие траектории пациентов и, таким образом, обеспечить персонализированное лечение, ведущее к лучшему уходу и результатам в онкологии.