SkyCube — технический дизайн и варианты использования

SkyCube — это бесплатный визуализированный инструмент машинного обучения на основе браузера для структурированных данных, который вы можете использовать мгновенно.

Под мгновенным мы подразумеваем отсутствие необходимости в настройке инфраструктуры. Установка не требуется. Регистрация не требуется. Даже кодирование не требуется. Требуется только браузер с доступом в Интернет. (Ищете демо? См. Общее руководство и Учебник по классификации)

Как это работает

Традиционно инструменты SaaS ML используют трехуровневую архитектуру, которая включает 1. Внешний интерфейс для взаимодействия пользователей с приложением, 2. Бэкэнд-сервер с механизмом аналитики/МО и 3. Базу данных для хранения данных обучения и других данных.

SkyCube пытается объединить все в браузере пользователей. SkyCube использует React.js для внешнего интерфейса и Pyodide, чтобы перенести научный стек Python, такой как NumPy, Pandas и scikit-learn, в контекст браузера. Кроме того, SkyCube хранит набор данных пользователей и модель машинного обучения в хранилище Indexeddb их браузера. Вместе мы создаем чисто браузерный инструмент, который позволяет пользователям обучать модели машинного обучения без написания кода и без внутреннего сервера.

Обученную модель машинного обучения можно экспортировать в виде файла model.json, который включает в себя модель sklearn дампа (маринованной) и связанные с ней метаданные. Это можно напрямую передать вашим коллегам, и они могут использовать модель на сайте SkyCube в своем браузере. Или это можно использовать в приложении Python и (на стороне браузера) JavaScript.

Варианты использования SkyCube

Возможно, обучение и обслуживание моделей машинного обучения на выделенном сервере считается «лучшей практикой». Однако бывают ситуации, когда SkyCube может удовлетворить ваши потребности.

  • Когда у вас есть один источник данных/файл набора данных, сложная модель ML на самом деле будет излишним
  • Если вы хотите сохранить конфиденциальность данных на своем локальном компьютере, а не отправлять их на сервер
  • Когда у вашей команды ограниченные возможности Data Science, но вы хотели бы мгновенно извлечь некоторую информацию из своих табличных данных
  • Когда вы просто хотите провести небольшой эксперимент с машинным обучением, не настроив и не настроив слишком много

7 шагов машинного обучения и SkyCube

Знаменитое руководство 7 шагов машинного обучения выделяет наиболее важные шаги, которые необходимо выполнить в проекте машинного обучения. В SkyCube мы обрабатываем шаги 1 и 2 в Модуле наборов данных, а остальные шаги — в Модуле машинного обучения. Если вы ищете общее пошаговое руководство, посетите эту ссылку на YouTube. Кроме того, вот демонстрация классификации с набором данных Titanic.

Эпилог

SkyCube все еще находится в ранней стадии разработки. Но оставайтесь с нами и оставляйте свои отзывы по любому удобному для вас каналу: LinkedIn, Slack Community, Email ([email protected]), Чат-бот на сайте SkyCube.

Присоединяйтесь к нам — Patrick Chiu, Brian Mak и Ken Wong также в LinkedIn :)