Публикации по теме 'machine-learning'


Рекомендации по развертыванию модели машинного обучения
Разработка модели машинного обучения относительно дешевая по сравнению с ее развертыванием и обслуживанием. Большинство специалистов по данным сегодня сосредоточены на построении сложного конвейера и игре со сложными алгоритмами, преследуя точность модели, а не простоту развертывания или интерпретации моделей. Во многих случаях простые алгоритмы работают довольно близко к сложным алгоритмам черного ящика или составным моделям. Повышение на 1 или 2%, которое можно получить при..

DeepMind полагается на этот старый статистический метод для построения справедливых моделей машинного обучения
Причинно-байесовские сети используются для моделирования влияния атрибутов справедливости в наборе данных. Недавно я начал новый информационный бюллетень, посвященный образованию в области искусственного интеллекта. TheSequence - это информационный бюллетень, ориентированный на искусственный интеллект (то есть без рекламы, без новостей и т. Д.), На чтение которого уходит 5 минут. Цель состоит в том, чтобы держать вас в курсе проектов, исследовательских работ и концепций машинного..

Начало работы с НЛП: токенизация, матрица терминов документа, TF-IDF
Применение основных техник НЛП для классификации текста твитов: настоящие или фальшивые? В этом посте мы продолжаем описывать некоторые традиционные методы решения задачи обработки естественного языка, классификации текста. Это простой и быстрый в создании классификатор текста, основанный на традиционном подходе к проблемам НЛП. Следующие шаги: описать процесс токенизации как построить матрицу терминологического документа (используя некоторые методы, такие как подсчет слов и TFIDF) в..

Усиленные вложения с помощью Catboost
В этой статье рассказывается о Catboost, простом и малоизвестном способе использования встраиваний с моделями с градиентным усилением. Вступление При работе с большим объемом данных возникает необходимость сжать пространство с объектами в векторы. Примером могут служить вложения текста, которые являются неотъемлемой частью практически любого процесса создания модели НЛП. К сожалению, далеко не всегда можно использовать нейронные сети для работы с этим типом данных - причина,..

Готов ли ваш бизнес к внедрению искусственного интеллекта? Как узнать наверняка
Проблема с новыми технологиями заключается в том, что их внедрение сопряжено с неопределенностью. Даже если вы перешли на лидирующую позицию из науки о данных, сложно понять, как и когда внедрить внедрение ИИ с точки зрения бизнеса. Вам нужно двигаться вперед, но на карту поставлено гораздо больше, чем когда вы строите модели во время учебы в колледже или стажировки. [Статья по теме: 3 небольших шага к внедрению ИИ] Так как же добиться успеха без слепого риска? Вот три..

Машинное обучение с текстом в scikit-learn
Повестка дня Построение модели в scikit-learn (резюме данных Iris) Изучение данных текстовой аналитики Векторизация нашего набора данных изучить словарь тестовых данных Построить матрицу терминов документа (представление текста в виде числовых данных) Построить модель из словаря данных поезда Оценить тестовые данные Сводка по обучению и оценке модели на данных поезда и тестовых данных Прежде чем мы приступим к машинному обучению с текстом в scikit-learn, просто повторим..

Прогноз доходов взрослых
Набор данных о доходах взрослых из UCI Repository — классификация с использованием различных моделей. Что такое машинное обучение? Машинное обучение — это идея о том, что существуют общие алгоритмы, которые могут рассказать вам что-то интересное о наборе данных без необходимости писать какой-либо специальный код, специфичный для проблемы. Вместо того, чтобы писать код, вы вводите данные в общий алгоритм, и он строит собственную логику на основе этих данных. Например, одним из..