Публикации по теме 'data-science'


Множественный регрессионный анализ результатов теста чтения NCES с использованием R
В этом исследовании мы проанализируем результаты тестов по чтению как зависимую переменную и различные факторы как независимые факторы и посмотрим, какие из них будут иметь значение при определении результатов по чтению. Есть 3663 строки и 24 столбца, включая столбец readScore, который является нашей зависимой переменной. Все переменные являются числовыми, кроме гонца, который является категориальной переменной, как показано ниже. Гистограмма оценки чтения говорит нам, что..

Векторы слов для людей, не связанных с НЛП, и исследователей
Векторы слов - это просто векторы чисел, которые представляют значение слова. На данный момент это не очень ясно, но мы вернемся к этому чуть позже. Прежде всего полезно рассмотреть, почему векторы слов считаются таким шагом вперед по сравнению с традиционными представлениями слов. Традиционные подходы к НЛП, такие как одноразовое кодирование и модели набора слов (т. Е. Использование фиктивных переменных для представления наличия или отсутствия слова в наблюдении (например, в..

PAPIs ’16 в Proceedings of ML Research (с участием Uber и Dataiku)
В прошлом месяце мы опубликовали материалы продвинутых докладов, представленных на 3-й Международной конференции по прогностическим приложениям и API ( PAPIs ‘16 ), проходившей в Бостоне 11–12 октября 2016 г. На конференции было представлено 27 докладов об интеграции машинного обучения в реальные приложения, процессы и бизнес. Наши докладчики представили методы, инструменты и извлеченные уроки аудитории исследователей и практиков отрасли с широким диапазоном уровней опыта. В первом..

Машинное обучение в Excel с xl8ml! Часть 1: Совместная фильтрация
Введение Почти каждый день мы слышим о какой-то новой удивительной вещи, разработанной Tesla/Apple/Google/Facebook. И очень часто они говорят, что мы использовали машинное обучение или глубокое обучение для разработки этой инновации. И ты думаешь про себя, я хочу сделать то же самое. У меня есть некоторые данные, я могу использовать их для улучшения/оптимизации своего бизнеса, и я думаю, что машинное обучение может мне помочь. Но с чего начать, нужно ли мне изучать язык..

Наносим удар: точность прогнозирования M5
Соревнование M5 Forecasting Accuracy Kaggle ( здесь ) ставит перед участниками задачу предсказать 4 недели будущих продаж набора розничных товаров на основе данных обучения за последние 5 лет . Имея очень небольшой опыт прогнозирования, я решил задокументировать свою попытку прогнозирования с точки зрения новичка. Имея только свой MacBook Pro 2015 года и не затуманенный никакими лучшими практиками , я отправился прогнозировать продажи одного из крупнейших ритейлеров в мире. Я представляю..

Сверхразрешение изображения с использованием GAN
Введение Что такое сверхвысокое разрешение? Сверхразрешение изображения - это метод восстановления изображения с высоким разрешением из наблюдаемого изображения с низким разрешением. Большинство подходов к сверхразрешению изображения до сих пор использовали MSE (среднеквадратичную ошибку) как функцию потерь, проблема с MSE как функцией потерь. состоит в том, что детали изображения с высокой текстурой усредняются для создания плавной реконструкции. GAN решают эту проблему,..

Начало работы с PyTorch
"Начиная" Начало работы с PyTorch Изучите основы на примерах Введение В моем предыдущем посте Начало работы с Tensorflow я упоминал, что и Tensorflow, и PyTorch - отличный выбор, если вы хотите создавать небольшие или крупномасштабные решения для глубокого обучения. Обе платформы широко используются в академических кругах и промышленности, хорошо обслуживаются, имеют открытый исходный код, предоставляют простые API-интерфейсы и высокоуровневую функциональность. Здесь мы..