Публикации по теме 'analytics'


Кластеризация: два подхода
Что такое кластеризация? Это процедура поиска отдельных групп в данных, если они существуют. Такие группы представляют собой кластеры. Они являются частью неконтролируемого моделирования. Мы используем неконтролируемое моделирование в машинном обучении (ML), когда нам нужно найти общие закономерности в данных и у нас нет конкретной цели. У нас может быть только несколько независимых переменных. Примечание. крайне важно, чтобы мы использовали кластеризацию в качестве метода..

Попробуйте TextHero: самый простой способ очистки и анализа текста в Pandas
Обработка естественного языка (NLP) стала проще для Python Упрощенная обработка естественного языка Я всегда ищу новые инструменты, которые помогут мне упростить конвейеры обработки естественного языка, поэтому, когда я наткнулся на короткий видеоклип, демонстрирующий функциональные возможности Texthero, я понял, что должен сразу же его попробовать. Texthero разработан как оболочка Pandas, поэтому с ним проще, чем когда-либо, предварительно обрабатывать и анализировать текстовые..

Первые принципы мышления в науке о данных.
Мышление из первых принципов определяется как «сведение проблем к их наиболее фундаментальным истинам». Итак, когда дело доходит до науки о данных, каковы первые принципы? На мой взгляд они: Показатели центральной тенденции — среднее, медиана, мода. Показатели дисперсии — дисперсия, стандартное отклонение, межквартильный диапазон. Большинство тем в науке о данных так или иначе сводятся к центральной тенденции или дисперсии. Позвольте мне объяснить на нескольких примерах:..

Предскажет ли искусственный интеллект вашу смерть?
Предскажет ли искусственный интеллект вашу смерть? Это был заголовок, который, возможно, вызвал головокружение: Google утверждает, что новая технология EHR на основе искусственного интеллекта может предсказывать результаты лечения пациентов в больнице, включая смерть ». Со всеми новостями о больших данных, беспилотных автомобилях и кибервойнах этот заголовок может показаться разумным следующим шагом в области искусственного интеллекта (ИИ) и одним из пугающих последствий. Если..

Практический пример: анализ первопричин и анализ данных для пользователей сегмента в качестве специалиста по обработке и анализу данных
При выполнении проекта сегментации многие думают, что самым важным шагом является модель или алгоритм, но это не так. Часто меня гораздо больше впечатляют опытные аналитики, чем статистики и инженеры машинного обучения. Лично для меня самым важным шагом является четкое определение того, что решает проблема. и как это влияет на бизнес. Кроме того, нам нужно прояснить корень проблемы, упростить сложную проблему и рассказать историю наглядно. Оттуда мы будем убеждать заинтересованные..

Как аналитика дала Netflix преимущество перед голливудом
Как аналитика дала Netflix преимущество перед голливудом В ряде недавних статей обсуждается озабоченность Голливуда недавней волной многомиллионных сделок Netflix с такими звездами, как Шонда Раймс , Райан Мерфи или Обамы , которые создают контент для платформы. В отличие от динамизма Netflix, традиционная киноиндустрия скована бизнес-моделью , которая сильно зависит от сиквелов, приквелов и римейков популярных фильмов, снятых несколько десятилетий назад, и где успех,..

Инновационные документы, основанные на использовании клинических данных для получения важной информации, связанной с…
Объединение мультимодальной МРТ и клинических данных на основе CNN-LSTM для прогнозирования функционального исхода у пациентов с инсультом ( arXiv ) Автор: Нима Хатами , Тэ-Хи Чо , Лаура Мечтуф , Омер Фарук Экер , Дэвид Руссо , Кэрол Фриндель Аннотация: Прогнозирование клинического исхода играет важную роль в ведении пациентов с инсультом. С точки зрения машинного обучения одной из основных проблем является работа с разнородными данными при поступлении пациента, то..