Публикации по теме data-science

Публикации по теме 'data-science'

Наивный Байес для машинного обучения, часть 1

Отказ от ответственности : – я ожидаю, что вы знаете о пересечении, объединении, диаграмме Вена или теории множеств. Наивный байесовский алгоритм основан на теореме Байеса, а теорема Байеса основана на условной вероятности. Итак, начнем с условной вероятности. Условная вероятность: - это раздел теории вероятностей, который занимается измерением вероятности наступления события при условии, что произошло другое событие. P(A | B) = P(A ∩ B) / P(B) = P(A и B) / P(B) = P(A, B) / P(B) Где..

Классификация со случайными лесами в Python

Модели классификации случайных лесов Алгоритм случайных лесов - это метод машинного обучения, который можно использовать для задач обучения с учителем, таких как классификация и регрессия. Алгоритм работает путем построения набора деревьев решений, обученных на случайных подмножествах признаков. В случае классификации выходом случайной модели леса является режим предсказанных классов по деревьям решений. В этом посте мы обсудим, как создавать случайные модели леса для задач..

Функциональная инженерия

Функциональная инженерия Понимание самого важного шага в рабочем процессе обработки данных Вступление Разработка функций - это набор методов, применяемых в науке о данных, направленных на то, чтобы данные могли использоваться моделями должным образом. Это смесь науки и искусства, и, возможно, это самый важный этап рабочего процесса в области науки о данных в том смысле, что это один из этапов, который приносит наибольшую пользу. Для его освоения требуется много изучения и..

Распространенная ошибка науки о данных: прогноз / рекомендация путем манипулирования входными данными модели

«Мы обучили модель машинного обучения с высокой производительностью. Однако это не сработало и не пригодилось на практике ». Я слышал это предложение несколько раз, и каждый раз мне не терпелось узнать причину. Причины, по которым модель не сработала на практике, могли быть разными. Поскольку эти вопросы обычно не рассматриваются в курсах по науке о данных, в этой статье я обращаюсь к одной из распространенных ошибок при разработке и развертывании модели машинного обучения. В..

Когда каждая работа автоматизирована

Когда каждая работа автоматизирована Утопия или антиутопия? Разработчик приложения. Менеджер социальных сетей. Персональный тренер. Еще несколько десятилетий назад ни один человек на Земле не мог предсказать эти рабочие места. Это всего лишь несколько случайных рабочих мест, которые существуют сегодня, которые заменили рабочие места прошлого. На протяжении всей современной цивилизации рабочие места приходили и уходили. Не так уж много десятилетий назад, около десяти, наверное,..

6 популярных пакетов машинного обучения Python на PyPI

Как самый популярный язык программирования для науки о данных, пакеты Python , фреймворки и библиотеки тянутся миллионами каждый месяц. Пакеты Python от месяца к месяцу отражают растущие тенденции в области науки о данных; поскольку о НЛП говорят все чаще, мы увидим больше пакетов, вытянутых для целей НЛП. Мы изучили статистику PyPI за последний месяц, чтобы увидеть, какие пакеты машинного обучения Python использовались больше всего, и некоторые из результатов ожидаются, а некоторые..

Вопросы для собеседования по Splunk Data Science

90 из Fortune 100 используют Splunk . Splunk превращает машинные данные в ответы. Он может дать вам ответы, необходимые для решения самых сложных задач в области ИТ, безопасности и бизнеса - с возможностью развертывания локально, в облаке или с помощью гибридного подхода. В современном мире, где машинные данные генерируются каждую секунду, очень важен такой инструмент, как Splunk. Существует около 1900+ приложений Splunk, которые помогут вам получать данные с машин и получать от них..