Публикации по теме 'data-science'


Рекомендации по развертыванию модели машинного обучения
Разработка модели машинного обучения относительно дешевая по сравнению с ее развертыванием и обслуживанием. Большинство специалистов по данным сегодня сосредоточены на построении сложного конвейера и игре со сложными алгоритмами, преследуя точность модели, а не простоту развертывания или интерпретации моделей. Во многих случаях простые алгоритмы работают довольно близко к сложным алгоритмам черного ящика или составным моделям. Повышение на 1 или 2%, которое можно получить при..

DeepMind полагается на этот старый статистический метод для построения справедливых моделей машинного обучения
Причинно-байесовские сети используются для моделирования влияния атрибутов справедливости в наборе данных. Недавно я начал новый информационный бюллетень, посвященный образованию в области искусственного интеллекта. TheSequence - это информационный бюллетень, ориентированный на искусственный интеллект (то есть без рекламы, без новостей и т. Д.), На чтение которого уходит 5 минут. Цель состоит в том, чтобы держать вас в курсе проектов, исследовательских работ и концепций машинного..

Начало работы с НЛП: токенизация, матрица терминов документа, TF-IDF
Применение основных техник НЛП для классификации текста твитов: настоящие или фальшивые? В этом посте мы продолжаем описывать некоторые традиционные методы решения задачи обработки естественного языка, классификации текста. Это простой и быстрый в создании классификатор текста, основанный на традиционном подходе к проблемам НЛП. Следующие шаги: описать процесс токенизации как построить матрицу терминологического документа (используя некоторые методы, такие как подсчет слов и TFIDF) в..

Готов ли ваш бизнес к внедрению искусственного интеллекта? Как узнать наверняка
Проблема с новыми технологиями заключается в том, что их внедрение сопряжено с неопределенностью. Даже если вы перешли на лидирующую позицию из науки о данных, сложно понять, как и когда внедрить внедрение ИИ с точки зрения бизнеса. Вам нужно двигаться вперед, но на карту поставлено гораздо больше, чем когда вы строите модели во время учебы в колледже или стажировки. [Статья по теме: 3 небольших шага к внедрению ИИ] Так как же добиться успеха без слепого риска? Вот три..

10 статистических методов, которыми должны овладеть специалисты по данным
10 статистических методов, которыми должны овладеть специалисты по данным Независимо от того, как вы относитесь к сексуальности Data Science, просто невозможно игнорировать непреходящую важность данных и нашу способность анализировать, систематизировать и контекстуализировать их. Опираясь на свои обширные данные о занятости и отзывы сотрудников, Glassdoor поставила Data Scientist №1 в своем списке 25 лучших рабочих мест в Америке . Таким образом, роль остается неизменной, но,..

Прогноз доходов взрослых
Набор данных о доходах взрослых из UCI Repository — классификация с использованием различных моделей. Что такое машинное обучение? Машинное обучение — это идея о том, что существуют общие алгоритмы, которые могут рассказать вам что-то интересное о наборе данных без необходимости писать какой-либо специальный код, специфичный для проблемы. Вместо того, чтобы писать код, вы вводите данные в общий алгоритм, и он строит собственную логику на основе этих данных. Например, одним из..

Избегайте этих 8 ошибок перед обучением модели машинного обучения
Эти 8 советов помогут вам обнаружить ошибки перед обучением модели машинного обучения. Одно из наиболее распространенных заблуждений в машинном обучении заключается в том, что инженеры по машинному обучению получают набор данных CSV и большую часть времени тратят на оптимизацию гиперпараметров модели. Если вы работаете в отрасли, вы знаете, что это далеко не так. Инженеры машинного обучения тратят большую часть времени на планирование того, как построить обучающий набор, который..