Публикации по теме 'data-science'


В поисках Уолдо - сопоставление функций для OpenCV в Python
1. Введение В этой статье мы сделаем простое сопоставление функций, чтобы разогреться, прежде чем приступить к обнаружению объектов с помощью видеоанализа. Сначала мы сделаем некоторое обнаружение со статическими изображениями. «Где Уолли» - это популярная британская серия сборников-головоломок, которая вызвала интерес как у детей, так и у взрослых. Найти Уолдо никогда не бывает легко, и у OpenCV есть способ, который может позволить нам быстро найти Уолдо :) 2. Концепции,..

EDA просто как 1, 2, 3
В мире науки о данных и машинного обучения «EDA» означает «исследовательский анализ данных». Это относится к начальному анализу данных или первому шагу процесса обработки данных, несколько туманному начинанию, которое я видел множеством способов. Как человеку, который плохо знаком с рабочим процессом науки о данных, может быть довольно сложно узнать, что именно он должен делать во время EDA. В сегодняшней атмосфере вездесущих данных процесс EDA кажется более важным и запутанным, чем..

Распространенные заблуждения в области науки о данных: разоблачение мифов
В постоянно развивающейся области науки о данных дезинформация и заблуждения могут легко затуманить наше понимание фундаментальных концепций. Хотя платформы социальных сетей, такие как LinkedIn и YouTube, предлагают отличное пространство для обмена идеями, крайне важно обеспечить точность и достоверность распространяемой информации. В этом сообщении блога мы рассматриваем некоторые распространенные заблуждения в науке о данных, проливая свет на их неточности и предлагая более четкую точку..

Анализ временных рядов
Часть 1. Введение Серия статей на тему Анализ временных рядов в науке о данных Анализ временных рядов Введение В большинстве случаев обработки анализа данных вы можете иметь дело с данными временных рядов, т. е. с данными, которые были записаны последовательно в течение определенного периода времени. Данные временных рядов часто возникают, когда вы отслеживаете такие процессы, как продажи, в течение определенного периода времени. Из этого вытекают два важных атрибута:..

Прогрессии
Прогрессии Использование цепей Маркова для извлечения сходства песен Вы отправляетесь в путешествие с друзьями, и в плейлисте есть знаковое вступление к Ice Ice Baby . К этому моменту вы потренировались в душе тысячи раз; это ваш большой прорыв. Вступление заканчивается, вы начинаете интенсивный рэп только для того, чтобы услышать: «Мм ба ба де Ммм ба де…» - Королева Это Under Pressure от Queen, и вы сидите в неловкой тишине всю оставшуюся поездку, под давлением смирения...

7 основ для подхода к процессу машинного обучения
ДНЕЙ[3] ВЫБОР МОДЕЛИ Следующим шагом в нашем рабочем процессе является выбор модели. Алгоритмы — умные и сильные солдаты сложной модели машинного обучения. Другими словами, алгоритмы машинного обучения являются основой, когда мы играем с данными или когда дело доходит до обучения модели. Исследователи и специалисты по данным создали множество моделей за эти годы. Некоторые из них очень хорошо подходят для данных изображений, другие — для последовательностей (например, текста..

Сделайте логистическую регрессию снова простой
Предположим, вы - специалист по данным, стремящийся разработать модель оттока / удержания: модель, позволяющая предсказать, вернется ли конкретный клиент, чтобы купить больше ваших продуктов, или вместо этого полностью откажется от ваших услуг. Во многих случаях вам нужно предсказать не только, кто будет сохранен, а кто нет, но и почему . (Если мы поймем эти факторы, мы сможем удержать больше клиентов в будущем, что хорошо для бизнеса!) Другими словами, ваша модель должна быть..