Использование SAP Analytics Cloud

Инструмент, который меня взволновал

Недавно я был приятно удивлен, когда получил обзор SAP Analytics Cloud, наблюдая за классической гонкой Формулы 1, в которой Мика Хаккинен был просто великолепен. Если вы фанат Формулы-1, смотрящий золотой старинный фильм, вы знаете, что что-то должно быть особенным, чтобы броситься в глаза. На самом деле это мое мнение о SAP Analytics Cloud. Это инструмент, который меня заинтересовал в работе с клиентами и пользователями SAP, которые хотят объединить B.I. с прогнозами на основе машинного обучения, а также с финансовым планированием и моделированием. Если вы знакомы с отраслевыми предложениями, вы знаете, что обычно вам нужно много разных инструментов, чтобы делать такие вещи. SAP SAC предоставляет вам все это в одном месте при поддержке HANA Data Appliance.

Так почему же мне понравился продукт во время классической эмоциональной гонки F1? Читайте дальше, и позвольте мне объяснить! Если вы раньше не читали мою работу, знайте, что я люблю создавать что-то с нуля и поэтому хорошо разбираюсь в базах данных, разработке программного обеспечения и облачном хостинге. Специалисты в области науки о данных, вероятно, не будут использовать SAC, но я подозреваю, что поклонники без кода будут очень взволнованы, если не избалованы множеством доступных продуктов в этой области.

Что такое SAP Analytics Cloud?

Как я упоминал ранее, SAP Analytics Cloud (SAC) - это набор бизнес-инструментов. SAP идеально выразился: Получите все необходимые функции облачной аналитики - бизнес-аналитику (B.I.), расширенную аналитику, предиктивную аналитику и планирование предприятия - в одном решении. Таким образом, SAC - это полноценная среда для аналитики, размещенная в облаке SAP с использованием технологии HANA.

SAC основан на облаке, и вы можете подписаться на бесплатную пробную версию и получить практические навыки. Что я и сделал! Я использовал свой Mac Mini M1 (8 ГБ ОЗУ) с браузером Google Chrome для пробной версии.

Что такое HANA и почему это важно?

HANA - это база данных в памяти, разработанная SAP. SAP определяет HANA как базу данных, которая ускоряет принятие решений на основе данных в реальном времени. Традиционные продукты для баз данных были потрясающими изобретениями, но были кое-какие препятствия; эти продукты включают: -

Как правило, эти продукты представляют собой сервер базы данных с большим количеством физических дисков и программным обеспечением для работы с базой данных, и все они работают изолированно. Эксперты DW работают над этими системами, и они будут оптимизированы либо для обработки транзакций (Online Transaction Processing OLTP), либо для аналитики (Online Analytics Processing OLAP или Data Storage D.W.), но никогда для обоих (смешанные рабочие нагрузки OLTP и D.W.). На пользовательский опыт (отзывчивость) повлияли: -

  • Мощность и производительность «голого» сервера, используемого в качестве хоста, с памятью, скоростью накопителя и портом ввода-вывода, снижают производительность пользователя.
  • Расположение сервера и доступность пропускной способности сети
  • Уровни корпоративной нагрузки и, как правило, неверные запросы пользователей!

Следовательно, производительность и время ответа на запросы пользователей могут различаться и, как правило, вынуждают выполнять пакетную или автономную обработку рабочих нагрузок. Подключение таких продуктов, как Tableau, IBM Cognos, Power Bi, Looker и многих других, через TCP / IP с ODBC или другим протоколом было тогда потенциально ужасным опытом, если бы вещи не были гиперорганизованы. Сервер бизнес-аналитики, подключающийся к серверу данных для каждого запроса, был довольно тяжелым с большими накладными расходами на обработку.

HANA - другое дело. Он был разработан с нуля, чтобы устранить все эти проблемы, и использует комбинацию данных, хранящихся в больших объемах дорогостоящей оперативной памяти, индексации и постоянства на твердотельных накопителях. HANA работает очень быстро и устраняет все узкие места и накладные расходы традиционных баз данных SQL. На рисунке 1 ниже представлена ​​архитектура SAP.

Концепция технологии баз данных In-Memory не нова. Моя предыдущая работа всегда включала базу данных REDIS для кэширования. Я всегда обнаруживал невероятные улучшения производительности в своих веб-приложениях с использованием кэширования в памяти REDIS, поддерживающего долгосрочное сохранение MongoDB или Postgres.

Фактически, мой первый опыт работы с ускорителями в памяти / базе данных был с Netezza. Netezza - это высокопроизводительные« устройства для хранения данных и расширенные приложения аналитики для использования, включая корпоративное хранилище данных , бизнес-аналитику , предиктивную аналитику и планирование непрерывности бизнеса . - Википедия. Netezza была переименована в IBM Pure Data, и, как и HANA, она работает быстро. Подключение Tableau, PowerBI, Looker и других B.I. Tools to Pure Data обеспечивает потрясающую производительность по сравнению с традиционной моделью и представляет собой мощное решение для хранения данных. Естественно, обратной стороной была необходимость в стратегиях E xtract T преобразования L (ETL), что приводило к вся отрасль специалистов DW / ETL.

Облако Аналитики

После обсуждения HANA и того, почему мы заботимся о HANA, Analytics Cloud становится средой хостинга SAP, использующей технологию HANA и аналитическое программное обеспечение SAP в интегрированной среде. Когда мы подписываемся на SAC, мы получаем аренду в предварительно сконфигурированной среде для оптимальной производительности прямо из коробки.

Зарегистрировавшись в аккаунте, я решил пройти тест-драйв. Поскольку я сомневаюсь, что когда-нибудь получу тест-драйв Формулы 1, мне пришлось довольствоваться перспективой невероятно быстрого опыта от SAP.

Тест-драйв

Полагаю, в моем эмоциональном состоянии с классикой Формулы-1 мой разум вернулся к Титанику и к уже известному набору данных ученика. Рисунок 2 - это изображение классической дамы в месте отдыха от NOAA. Семнадцатилетний аристократ влюбляется в доброго, но бедного художника на борту роскошного злополучного R.M.S. Титаник . - от IMDB. А как насчет преследующих текстов заглавной песни? - мое сердце будет продолжать биться…. Что за эмоциональные американские горки?

Набор данных Титаника используется во многих курсах машинного обучения; действительно, я сам часто им пользовался. После входа в SAP SAC я создал новую папку данных, как показано на рисунке 3.

Затем я импортировал обучающий и тестовый файлы, полученные из Kaggle. Показано на рисунке 4.

Щелкнув файл train.csv, мы сможем увидеть, как работает SAC. У нас есть размеры и размеры. «Меры» - это числа, а «измерения» - это категории и другие справочные данные. Я добавил рисунок 5, чтобы продемонстрировать вид. Вы заметите, что все, что выглядит как число, считается мерой. Таким образом, возраст, Parch, SibSp и другие, возможно, придется обновить, чтобы они были измерениями.

Как я уже упоминал, Титаник - это очень хорошо используемый и изученный набор данных. Здесь, в На пути к науке о данных, я нашел предыдущую статью Никласа Донгеса.



Никлас предоставил удобное описание каждого поля, как показано на рисунке 6.

Оказалось, что от импорта файла до создания истории (панели инструментов) есть некоторые ограничения, из-за которых я не мог обновить тип данных. Чтобы управлять типами данных, вам необходимо построить модель. Используя модель, я смог добиться большего прогресса. На рисунке 7 представлена ​​модель.

Для моей цели я немного изменил значения по умолчанию, но в реальной модели вам нужно будет проверить каждый столбец и убедиться, что он имеет правильный тип данных. Создав модель, я смог создать несколько визуальных эффектов.

Визуальные эффекты

На рисунке 8 показана столбчатая диаграмма с накоплением с функцией Trellis. Мы можем видеть диаграмму, показывающую женщин и мужчин, выживаемость (0 = ложь, 1 = истину), распределение по возрастным группам и количество людей. По имеющимся данным, большинство женщин и детей сошли, но немногие пассажиры мужского пола выжили.

На рисунке 9 добавлен класс билета, чтобы увидеть, как социальные классы уступили.

Я полагаю, что сейчас хорошо известно, что пассажиры 1-го и 2-го класса справились лучше. На Рисунке 9 показано, что пассажиры женского пола из 1-го и 2-го класса в основном вышли, а некоторые из пассажиров 3-го класса вышли. Кажется, что взрослых мужчин в 3-м классе сошло больше, чем во 2-м или 1-м классе.

Несмотря на поиск, мне не удалось найти и добавить ярлык для легенды. Название должно быть «Выживание». Вменение пропущенных полей немного неудобно с простой функцией изменения, основанной на формуле. Я думаю, вы могли бы попытаться сделать подлое вменение. Группировка или сортировка категориальных значений, по-видимому, выполняется с помощью «формулы» в модели во время процесса импорта файла. Мне пришлось вручную сгруппировать возрастные измерения на взрослых, подростков, детей, пенсионеров на основе произвольных значений отсечения.

Машинное обучение

SAP SAC имеет ограниченную среду машинного обучения. На рисунках 10 и 11 показаны результаты обучения классификационной модели.

Я смог применить модель и получить новый результат. Было неясно, как развернуть модель машинного обучения в модели данных, чтобы получить непрерывный вывод, но я не тратил много времени на эту функцию. Возможности машинного обучения только сейчас ограничены возможностями финансового анализа, как показано на рисунке 12.

Финансовое планирование

SAP SAC предлагает два типа моделей данных. Это: -

  • Аналитическая модель для традиционного варианта использования бизнес-аналитики
  • Модель планирования для сценариев использования многомерного финансового планирования, обычно использующих такие продукты, как TM1 с надстройкой Excel.

Пробная лицензия не позволила мне добиться прогресса в функциональности модели планирования, но она впечатляет, судя по полученному мной обзору. Если вы хотите окунуться в воду, вдохновляйтесь, как я, я оставил несколько советов и ссылок в разделе «Вдохновение» в конце этого документа.

Тест-драйв окончен

Тест-драйв окончен. Изделие блестящее, новое и очень соблазнительное. Я полагаю, что с большинством крупных покупок 20-минутный тест-драйв не убедит вас сделать большие финансовые вложения.

С любым инструментом аналитики вам нужно будет сесть и спланировать модель данных, реализовать эту модель, а затем провести настоящий тест-драйв на своих объемах данных с пользовательскими вариантами использования. Идите вперед и сделайте доказательство концепции и продемонстрируйте ценность для себя.

Вдохновение

Если вы хотите узнать немного больше о SAP Analytics Cloud, вы можете использовать следующие ресурсы.

Удеми





SAP обучение

Https://training.sap.com/course/sac01h-introduction-to-sap-analytics-cloud-remoteclassroom-023-ie-en/?

Https://training.sap.com/course/sac01-introduction-to-sap-analytics-cloud-classroom-026-ie-en/?

Https://training.sap.com/trainingpath/Analytics-SAP+Analytics+Cloud-SAP+Analytics+Cloud