Публикации по теме data-science

Публикации по теме 'data-science'

Metflix: Как рекомендовать фильмы - Часть 1

В этой серии публикаций я попытаюсь создать механизм рекомендаций, чтобы рекомендовать похожие фильмы по выбранному названию или рекомендовать фильмы пользователю, оценивающему пару фильмов. В Части 0 мы загрузили набор данных MovieLens и создали разреженную матрицу пользовательских элементов. В этом посте мы рассмотрим некоторые из популярных методов рекомендаций, в основном: Пользовательская Совместная фильтрация (UBCF) Совместная фильтрация на основе элементов (IBCF)..

Мое путешествие в науку о данных

Добро пожаловать на мой блог! Здесь я опубликую некоторые проекты по науке о данных и машинному обучению, над которыми я работал. Основная мотивация для создания этого блога заключается в том, что я скоро начну курс Fast AI Deep Learning. Ведение блога вместе с лекциями показалось мне отличной возможностью по-настоящему ознакомиться с материалом и познакомиться с другими студентами. Прежде всего позвольте мне кратко рассказать вам о моем путешествии в науку о данных. Около года..

Удобные фрагменты Python для более чистого кода

Динамически вызывать функцию, перечислять функции с определенной частью их имени и т. Д. Эффективный рефакторинг существующего кода - это искусство. Если вы когда-либо унаследовали чужой код или даже через некоторое время оглянулись на свой собственный, вы знаете, насколько сложным может быть этот процесс. Часто функции создаются и ошибки исправляются в сжатые сроки, что может привести к небрежному и неэффективному коду. Это совершенно нормально . Вам разрешено время от времени..

Байесовская статистика необходима каждому специалисту по анализу данных

Байесовская статистика в основе науки о данных Наука о данных имеет глубокие корни в байесовской статистике, и вместо того, чтобы давать исторический фон сэра Томаса Байеса, я дам вам общий взгляд на байесовскую статистику, теорему Байеса и то, как использовать ее в качестве инструмента в вашей работе! Байесовская статистика укоренена во многих аспектах науки о данных и машинного обучения, поэтому прочная основа на этих принципах невероятно важна. Теорема Байеса в ее основе..

Сэкономьте часы работы, выполнив полный EDA с помощью нескольких строк кода

Сэкономьте часы работы, выполнив полный EDA с помощью нескольких строк кода с помощью этой библиотеки Узнайте, как использовать QuickDA для вашего следующего проекта и сэкономить часы работы Независимо от того, являетесь ли вы аналитиком данных или ученым, вы слышали, что профессионалы тратят 80% своего времени на очистку данных и только 20% на моделирование. Это правда, что очистка данных и исследовательский анализ данных требуют выполнения нескольких шагов, и помните, что весь код..

Прогнозирование цен на AirBnB в Нью-Йорке

Целью этого проекта было создание клона AirBnB, ориентированного исключительно на Нью-Йорк. Я работал в команде разработчиков пользовательского интерфейса, внешнего интерфейса, серверной части и специалистов по науке о данных. Моя работа заключалась в создании API, который соединял модель с серверной частью. Пока другой разработчик Data Scientist работал над написанием хорошей модели для прогнозирования цены, я начал писать быструю базовую модель для реализации в API. Я получил свои..

С точки зрения непрофессионала, алгоритмы машинного обучения, часть 2

(т.е. как объяснить кому-либо алгоритмы машинного обучения) ВАЖНОЕ ПРИМЕЧАНИЕ: В первом посте этой серии я совершил ошибку , приравняв нетехнических людей к стереотипу технически безграмотной бабушки. Некоторые члены сообщества специалистов по науке о данных обратили мое внимание на сексизм и эйджизм, стоящие за этим популярным трюком. Они совершенно правы. Как женщина, я никогда не хотела бы никого ущемлять в своем сообществе, особенно людей, идентифицирующих себя с женщинами, и /..