Публикации по теме 'data-science'


Оценка ролей данных за 20 лет и как она изменила меня как инженера машинного обучения
Я считаю, что будет много людей, работающих с данными поколения Y , которые, как я, плывут в одной лодке и продолжают изучать, что делать дальше в области технологий, могут иметь отношение к этой статье. Пожалуйста, прокричите в комментариях, если вы тоже один из них. Роль данных 1.0 Я начал свой карьерный путь как разработчик баз данных Oracle, программирование на SQL, написание хранимых процедур, проектирование баз данных с дополнительными знаниями администратора баз данных...

Преобразование искаженных данных для машинного обучения
Искаженные данные - обычное дело в науке о данных; перекос - это степень искажения нормального распределения. Например, ниже приведен график цен на жилье из Kaggle's House Price Competition, который искажен вправо, что означает, что существует меньшинство очень больших значений. Почему нас волнует искажение данных? Если переменная ответа искажена, как в конкурсе цен на жилье Kaggle, модель будет обучена на гораздо большем количестве домов по умеренной цене и с меньшей вероятностью..

Пошаговое руководство по установке Tensorflow-CPU / GPU для Windows 7
Итак, я провел все выходные, пытаясь установить TensorFlow на свой шестилетний рабочий стол с Windows 7. И всего около 3 часов назад мне удалось загрузить 20 эпох для распознавания изображений менее чем за минуту. Обратите внимание, что это значительно БЫСТРЕЕ, чем работа с центральным процессором. Хватит болтовни, Я ЗНАЮ, ПАРНИ ХОЧЕТ СОУС. TensorFlow с использованием ЦП Для тех, кто пришел сюда в поисках альтернативы ЦП для запуска TensorFlow, все, что вам нужно сделать,..

Классификация болезней сердца - Часть II
Классификация плюс использование методов ансамбля для достижения общей оценки точности ~ 92% В продолжение моей предыдущей статьи (найденной здесь ) здесь я продемонстрирую шаги, которые я предпринял для построения модели классификации с использованием Набор данных о сердечных заболеваниях UCI, а также с использованием ансамблевых методов для достижения более высокой оценки точности. Создание подходящего алгоритма машинного обучения, который может более точно классифицировать..

Эффективный таргетинг на клиентов: используйте данные для сегментации клиентов.
Исследование сегментации клиентов для Arvato Financial Services Вступление В этом проекте я проанализировал демографические данные клиентов Bertelsmann Arvato Analytics в Германии, сравнил их с демографическими данными для населения в целом и использовал эту информацию и модель, чтобы предсказать, какие люди с наибольшей вероятностью превратятся в клиентов. Сегментация клиентов - это процесс разделения клиентов на группы на основе общих характеристик, чтобы компании могли..

Какие показатели лучше всего подходят для оценки вашей регрессионной модели?
R-квадрат, скорректированный R-квадрат, MSE, RMSE, MAE Оценка модели очень важна в науке о данных. Это поможет вам понять эффективность вашей модели и упростит представление вашей модели другим людям. Существует множество различных метрик оценки, но только некоторые из них подходят для использования в регрессии. В этой статье будут рассмотрены различные метрики регрессионной модели и разница между ними. Надеюсь, после того, как вы прочтете этот пост, вы поймете, какие метрики..

Как визуализировать социальную сеть с помощью теории графов
И узнайте влиятельных лиц в игре престолов Мотивация После прочтения книг из серии Песнь льда и огня Дж. Р. Р. Мартина, как истинного фаната Игры престолов, вам может быть любопытно, кто является самым влиятельным человеком в Вестеросе. Или вы знаете, что Эддард Старк и Рэндил Тарли связаны, но не совсем уверены, как именно они связаны. Связаны ли они третьим или четвертым лицом? Было бы здорово, если бы вы могли визуализировать сеть? Как энтузиаст данных, вы решаете провести..