Если вы разработчик, который когда-либо мечтал о богатой коллекции алгоритмов машинного обучения, реализованных исключительно в NumPy, то вам понравится Numpy-ml - новый проект GitHub, получивший признание всего мирового сообщества машинного обучения.

Для тех, кто не знаком с NumPy (Numerical Python), это одна из самых популярных библиотек для языка программирования Python. NumPy - это фундаментальный пакет для научных вычислений с Python, служащий эффективным многомерным контейнером общих данных. Его набор расширенных функций позволяет пользователям быстро построить весь вычислительный поток модели.

Возглавляет проект Numpy-ml Дэвид Бурджин, инженер-исследователь машинного обучения, получивший докторскую степень в области когнитивных наук в Калифорнийском университете в Беркли. Хотя Бурджин говорит, что Numpy-ml был для меня просто «забавным занятием в свободное время», коллекция, очевидно, удовлетворила потребность. За четыре дня после анонса проекта Бурджина на Reddit его ветка получила 369 голосов. Новость также ретвитнули заинтересованные стороны, такие как ученый DeepMind Research Аида Нематзаде. Numpy-ml GitHub получил более 4600 звезд с момента своего основания в апреле.

Проект предоставляет коды для популярных слоев нейронных сетей, таких как LSTM, модуль двунаправленного LSTM, выпадение регуляризатора и скрытая марковская модель декодирования Витерби. Всего в проекте 62 файла .py, он охватывает около 30 популярных и менее популярных моделей машинного обучения, в среднем более 500 строк кода на модель. Файл layer.py в категории нейронных сетей содержит около 4000 строк кода.

Бурджин объясняет: «Я медленно собирал коллекцию чистых NumPy (и немного SciPy) реализаций различных моделей машинного обучения + строительных блоков для использования в качестве быстрого справочника. Проект ... может быть также полезен для других, заинтересованных в простой реализации конкретных моделей / идей ».

Алгоритмы разделены на 11 категорий:

  • Модель гауссовой смеси
  • Скрытая марковская модель
  • Скрытое распределение Дирихле (тематическая модель)
  • Нейронные сети
  • Древовидные модели
  • Линейные модели
  • n-граммовые модели последовательностей
  • Модели обучения с подкреплением
  • Непараметрические модели
  • Предварительная обработка
  • Утилиты

Бурджин приветствует отзывы о проекте от сообщества машинного обучения. Подробности доступны на его странице GitHub.

Журналист: Фаню Цай | Редактор: Майкл Саразен

Вышел Отчет об адаптивности AI для публичной компании Fortune Global 500 за 2018 год!
Приобретите отчет в формате Kindle на Amazon.
Подайте заявку на участие в Партнерской программе Insight, чтобы получить бесплатный полный отчет в формате PDF.

Подпишитесь на нас в Twitter @Synced_Global, чтобы получать ежедневные новости об ИИ!

Мы знаем, что вы не хотите пропустить ни одной истории. Подпишитесь на наш популярный Synced Global AI Weekly , чтобы получать еженедельные обновления AI.