Публикации по теме 'data-science'


Введение в многомерное динамическое программирование
Понять интуицию, лежащую в основе техники, которая решает миниатюрные зависимые задачи, чтобы окончательно объяснить рассматриваемую проблему. Что такое динамическое программирование? Это метод решения особого типа проблем, которые можно разбить на множество зависимых подзадач. Под зависимостью я подразумеваю, что для решения одной подзадачи вам нужен ответ на другие подзадачи. Это отличает динамическое программирование (dp) от других методов, таких как разделяй и властвуй, где мы..

Назад к основам - линейная регрессия в R
Линейная регрессия - одно из самых фундаментальных знаний в статистике, вот как выполнить и интерпретировать ее в R Прошло некоторое время с момента моей последней статьи об этом здесь, и это потому, что я был занят подготовкой к актуарному экзамену, который приближается всего через два месяца. В процессе изучения этих последних двух недель я встретил старого доброго друга еще с моего первого в истории класса статистики, линейной регрессии. Когда я начал изучать более сложные..

Прогнозирование оттока клиентов для Sparkify
Как вы можете предсказать, что потеряете этого бесценного клиента, прежде чем он выйдет за дверь? Обзор проекта Представьте, что вы работаете в компании по потоковой передаче музыки, такой как Spotify или Pandora, под названием Sparkify. Миллионы пользователей ежедневно транслируют свои любимые песни. Каждый пользователь использует либо бесплатный уровень с рекламой между песнями, либо премиальный план подписки. Пользователи могут обновить, понизить или отменить свою услугу в любое..

Машинное обучение с PySpark
Помня о шахматах благодаря ферзевому гамбиту от Netflix, на этой неделе я использовал PySpark для создания классификатора с несколькими метками для прогнозирования результатов шахматных матчей из Chess Game Dataset . Настраивать Процесс настройки вашей локальной среды для использования Apache Spark, возможно, является самой сложной частью этого процесса. Сначала вы должны установить Docker, а затем загрузить образ контейнера для PySpark, специализированного для Jupyter Notebooks...

Как пройти техническое собеседование: проблема уникальных персонажей
Как и в большинстве других вещей, когда дело доходит до кодирования, практика делает его совершенным… и эффективным, читабельным и чистым. Чтобы подготовиться к техническим собеседованиям, которые в нашем неизбежном будущем, моя когорта Data Science Immersion занимается наиболее распространенными проблемами программирования, которые наши инструкторы должны решить. Ниже приведена подборка решений очень распространенной уникальной символьной функции из краудсорсинга. Задача 4: Уникальные..

Построение специфичных для предметной области языковых моделей
LIVEPROJECT Построение специфичных для предметной области языковых моделей Модель N-грамм, RNN, LSTM, AllenNLP Мы только что запустили нашу платформу liveProject , где вы можете подписаться на структурированный проект и получить реальный опыт. В this liveProject вы станете специалистом по обработке естественного языка данных, работающим в Stack Exchange. У Stack Exchange есть сеть сайтов вопросов и ответов по различным темам, от программирования до кулинарии. Ваш босс хочет,..

Изучение Чандигарха, Индия, с использованием Foursquare и Zomato API
Проект Capstone Data Science В рамках курса IBM Applied Data Science Capstone на Coursera.org я работал над проектом Capstone, в котором я использовал Foursquare API и Zomato API для получения информации о местоположении, рейтинге и ценах различных заведений в Чандигархе, Индия. В этой статье я расскажу о своем подходе к объединению данных из обоих API и извлечению значимой информации из них. kb22 / Coursera_Capstone В репозиторий будет включен код..