Публикации по теме 'data'


Уловка с ядром
Уловка с ядром кажется одной из самых запутанных концепций в статистике и машинном обучении; сначала это кажется настоящим математическим колдовством, не говоря уже о проблеме лексической двусмысленности (относится ли ядро ​​к: непараметрическому способу оценки плотности вероятности (статистики), набору векторов v для которое линейное преобразование T отображает в нулевой вектор, то есть T ( v ) = 0 (линейная алгебра), набор элементов в группе G, которые отображаются в единичный..

Индустриализация платформы машинного обучения с помощью Amazon SageMaker Studio
Действия и рекомендации при развертывании Studio на предприятии Часто на крупных предприятиях администраторам платформы машинного обучения необходимо уравновесить требования к управлению и соответствию с необходимостью того, чтобы группы машинного обучения имели быстрый доступ к рабочим средам и строительные леса для реализации своих решений. В терминах SageMaker это означает доступ к безопасным, хорошо управляемым рабочим средам с помощью Studio и предоставление шаблонных проектов..

Учебный план по науке о данных / машинному обучению с открытым исходным кодом
Май 2018 г. Редактировать: по мере того, как я узнал больше, я пересмотрел свою учебную программу. Я все еще надеюсь, что этот список курсов станет хорошим началом для кого-то, кто все еще пытается приручить пожарный шланг на ранней стадии. Изучив эти ресурсы, вы лучше поймете, что вас интересует и над какими аспектами вам нужно поработать больше. Я мог бы сделать обновление через несколько недель, где я добавлю еще несколько ресурсов: а пока я предлагаю создать учетную запись Twitter,..

Уровни измерения данных
Взгляд статистиков на типы переменных, их значение и значение для машинного обучения. Недавно я прочитал популярную книгу по машинному обучению. Когда я дошел до главы, посвященной проектированию функций, автор заметил, что, поскольку для большинства алгоритмов машинного обучения требуются числовые данные в качестве входных данных, категориальные переменные необходимо кодировать как числовые. Например, перефразируя пример, мы могли бы закодировать категориальную переменную..

Три разные вещи: 27 февраля 2019 г.
Данные — не новая нефть, атаки на солдат в социальных сетях, убийцы стартапов Нет, данные — это не новая нефть В конечном счете, крупные компании, такие как Google и Facebook, воздвигнут крепостные стены вокруг своих данных (и пользователей) и откажутся от каких-либо знаний о посредничестве данных, трейдеры «данные как нефть . Это будут данные из первых рук». Если у вас нет собственных данных, держите пари, что вы консолидируете прямо сейчас. Нападение на солдат в..

Как вы организуете более 160 000 стартапов в значимые кластеры?
Как вы объединяете более 160 000 стартапов в значимые кластеры? В базе данных Funderbeam более 160 000 стартапов. Это удивительно, но это также отчасти проблематично, поскольку навигация среди множества стартапов становится очень сложной, если нет последовательной классификации стартапов, помогающей фильтровать их по схожим отраслям. Понимая это, одним из наших приоритетов является максимальное удобство поиска информации о стартапах. Вот как мы этого добиваемся. Мы начали с..

Исследование данных с пандами
Я пройдусь по всем необходимым и важным функциям и методам и покажу на одном примере Я использую JupyterLab для пошагового объяснения примера, очень похожего на Jupyter Notebook. Вы также можете использовать терминал в Linux и шпатлевку в случае операционной системы Windows. Импортируйте библиотеку Pandas и прочитайте данные из доступного формата (excel/csv/tsv/json/etc.) 2. Напечатайте головку набора данных, чтобы увидеть, как он выглядит (имена столбцов/значения/и т. д.)...