Публикации по теме 'data-science'


Реализация поиска изображений на основе содержимого с помощью сиамских сетей в PyTorch
Эта статья была изначально написана Раулем Гомесом Брубаллой и размещена в блоге Neptune . Поиск изображений - это задача поиска изображений, связанных с заданным запросом. Под поиском изображений на основе содержимого мы обращаемся к задаче поиска изображений, содержащих некоторые атрибуты, которых нет в метаданных изображения, но присутствуют в его визуальном содержании. В этом посте мы: объясните теоретические концепции , лежащие в основе поиска изображений на основе..

Интеллектуальный анализ данных : влияние ввода
Я думаю, что для любой программной системы понимание входных и выходных данных гораздо важнее, чем знание того, что происходит между ними, и интеллектуальный анализ данных не является исключением. Ввод принимает форму концепций, экземпляров и атрибутов. Итак, в этой статье я объясняю эти термины и рассказываю о подготовке данных. Что такое концепция? В приложениях для интеллектуального анализа данных используются четыре принципиально разных стиля обучения. При..

Подход первых принципов в науке о данных
Наука о данных Подход первых принципов в науке о данных Подход первых принципов к решению проблем - это разбиение проблемы на фундаментальные части и последующее наращивание оттуда. I. Введение Подход, основанный на первых принципах, заключается в том, чтобы разбить проблему на фундаментальные части и развить их. Этот метод хорошо известен физикам еще со времен Аристотеля. Метод первых принципов - очень эффективный метод решения проблем. Илон Маск (генеральный директор..

Streamlit 101: подробное введение
Streamlit 101: подробное введение Погрузитесь в Streamlit с данными Airbnb NYC Streamlit - отличный новый инструмент , который позволяет инженерам быстро создавать интерактивные веб-приложения на основе своих данных, моделей машинного обучения и всего чего угодно. Лучшее в Streamlit - это то, что он не требует каких-либо знаний в области веб-разработки. Если вы знаете Python, готово! Вот полный код этого руководства , если вы хотите следить за ходом обучения. Почему Streamlit..

Регулярные выражения в Python
Regex для науки о данных Регулярные выражения - это специальные последовательности символов, которые определяют шаблоны поиска в текстах. В этом посте мы обсудим, как использовать один из самых основных методов регулярных выражений в Python, «re.findall ()», для извлечения начала строковых выражений. Давайте начнем! Для начала давайте импортируем модуль регулярных выражений python «re»: import re Предположим, у нас есть следующая строка: test_string1 = 'Python is Amazing!'..

Проверка гипотезы
Проверка гипотезы Что это такое и как это сделать в Python В этой короткой статье, которую я написал в соавторстве с Артуром Мелло , вы откроете для себя тестирование гипотез в новом свете и узнаете, как выполнять некоторые из его распространенных тестов на Python для ваших важных проектов по науке о данных. Почему это актуально? Гипотеза — это утверждение или предпосылка, которую мы хотим проверить. Проверка гипотез — это способ подкрепить ваши выводы данными более научным..

Прогнозирование матчей чемпионата Европы по футболу 2020
Простой подход регрессии Пуассона для прогнозирования результатов футбольных матчей с точностью 70%. Что ожидать? В этой статье я расскажу вам, как прогнозировать результаты футбольных матчей с помощью двух регрессий Пуассона с одной прогностической переменной с точностью более 70%. Это впечатляет, если учесть, что мы используем очень простую модель и только одну прогнозирующую переменную (рейтинг команды FIFA). Регрессия Пуассона будет сравниваться с базовой линейной регрессией..