Публикации по теме 'data-science'


Простое введение в машинное обучение
Навстречу науке о данных: вводная статья о машинном обучении. Этот пост связан с видео под названием «Введение в машинное обучение», созданным для На пути к науке о данных . Сценарий этого видео был написан с Энн Боннер . Голос, который вы слышите в видео, - это голос Элис Иризарри. Вступление В настоящее время мы живем в «эпоху данных», когда огромное количество данных собирается и хранится каждый день . Перед лицом такого растущего объема данных, методы машинного..

О том, как я признаю предвзятость человека и как с этим справиться
Несколько слов о том, как мы, практикующие данные, должны быть более осведомлены и внимательны к нашим собственным предубеждениям. В мире науки о данных мы определяем предвзятость как явление, при котором система чрезмерно обобщает свои данные и учится неверному. Когда это происходит, обычно в первую очередь мы указываем пальцем на данные или процесс обучения, а затем говорим «эти данные плохие» или «Я должен дополнительно настроить свои гиперпараметры». Конечно, это могло быть..

Быть специалистом по данным в LinkedIn
Data Science Connect - это бесплатный веб-семинар по всем данным. Наша главная цель - помочь как можно большему количеству начинающих специалистов по данным, подключив их к блестящим умам. Есть так много маршрутов, и всегда лучше слышать более одного голоса. Для нашей первой серии мы имели удовольствие взять интервью у специалиста по данным из LinkedIn. Полное интервью вы можете посмотреть ЗДЕСЬ . Авинаш Ахуджа работает над Marketplace Dynamics в LinkedIn и оказал огромное..

Вы неосознанно отслеживаете данные при обучении своих моделей машинного обучения?
Не отслеживаете ли вы данные по незнанию при обучении моделей машинного обучения? Почти каждый специалист по машинному обучению понимает принцип отделения данных обучения от данных проверки и тестирования при построении моделей машинного обучения. Полезность модели определяется тем, насколько хорошо модель работает или обобщает данные, на которых модель не была обучена прогнозировать или классифицировать. Большинство платформ машинного обучения предоставляют некоторые утилиты для..

Алгоритм скрининга для бинарной классификации.
Усовершенствования классических методов, разработка новых или усовершенствование методов предварительной обработки — один из множества разнообразных инструментов, расширяющих доступные инструменты машинного обучения. Благодаря этим достижениям количество доступных вариантов для любой задачи увеличивается с каждым годом. По мере увеличения количества вариантов становится все труднее выбрать подходящий метод для конкретного набора данных. Ниже описывается быстрый и простой метод отбора..

5 основных статей по анализу настроений
От виртуальных помощников до модерации контента анализ настроений имеет широкий спектр вариантов использования. Модели ИИ, способные распознавать эмоции и мнения, находят множество применений во многих отраслях. Поэтому растет интерес к созданию эмоционально интеллектуальных машин. То же самое можно сказать и об исследованиях, проводимых в области обработки естественного языка (НЛП). Чтобы осветить часть работы, проделанной в этой области, ниже приведены пять основных статей по..

Байесовская статистика 101
Байесовская статистика 101 Любите это или ненавидите, вы больше никогда не будете смотреть на статистику одинаково Вступление Байесовская статистика отличается от классической статистики (также известной как частотная статистика) в основном своей интерпретацией вероятности. Первый рассматривает это как « степень уверенности », тогда как второй рассматривает это как « относительную частоту, наблюдаемую во время многих испытаний ». Это различие может показаться слишком абстрактным,..