Публикации по теме data-science

Публикации по теме 'data-science'

Интуиция для независимых и одинаково распределенных

Наука о данных Интуиция для независимых и одинаково распределенных Понимание ключевого допущения в статистике и его последствий Основная цель науки о данных в целом и машинного обучения в частности - использовать прошлое для предсказания будущего. Помимо конкретных предположений различных статистических моделей, неизбежным является предположение о том, что будущее можно предсказать на основе прошлых событий. Мы предполагаем, что существует некоторая функция, которую мы можем..

Руководство для начинающих по полиморфизму в Python: освоение объектно-ориентированного программирования

Полиморфизм — невероятно мощная концепция в мире программирования. Это позволяет создавать гибкий и эффективный код, который можно повторно использовать в различных проектах. Это особенно полезно в Python, где широко используется объектно-ориентированное программирование (ООП).

Значительно увеличьте результаты поиска в сетке с помощью этих параметров

Поиск по сетке на любом этапе конвейера машинного обучения с использованием EstimatorSwitch Очень распространенным шагом в построении модели машинного обучения является поиск по сетке параметров классификатора в наборе поездов с использованием перекрестной проверки для поиска наиболее оптимальных параметров. Что менее известно, так это то, что вы также можете выполнять поиск по сетке практически на любом этапе конвейера, например, на этапах разработки функций. Например. какая..

⚡️ Всем привет!

⚡️ Всем привет! 🇮🇳 Сегодня мы проведем глубокий анализ крупнейших фармацевтических компаний Индии. ❗️Сейчас фармкомпании можно использовать как хедж, так как они относятся к защитному сектору. Более того, диверсификация активов по странам также имеет смысл, учитывая многофакторные геополитические риски, поэтому стоит присмотреться к Индии. 🔎. Мы выбрали средние и крупные компании индийской фармацевтической промышленности, чтобы представить вам самые надежные и интересные активы...

Классификация документов с помощью векторизаторов Sklearn's Count / Hash / TDiF

Библиотека Sklearn предоставляет несколько мощных инструментов, которые можно использовать для извлечения функций из текста. В этой статье я покажу вам, насколько легко можно классифицировать документы на основе их содержимого с помощью Sklearn. import pandas as pd from sklearn.datasets import fetch_20newsgroups from sklearn.feature_extraction.text import CountVectorizer Вам нужно будет импортировать панды (конечно) и CountVectorizer. Мы будем использовать образец набора данных..

Тенденции в области науки о данных, которые будут править в 2022 году

2021 год был захватывающим годом для науки о данных: несмотря на увольнения и сокращения бюджета, связанные с пандемией COVID-19, эта область продолжала процветать. Согласно опросу, проведенному Anaconda, только 37% компаний сократили свои инвестиции в науку о данных . Для подавляющего большинства компаний наука о данных стала главным инструментом выживания и процветания в условиях пандемии. 2022 год обещает быть не менее интересным. TinyML Массивные модели, обученные на..

Нежное введение в TensorFlow Probability — «Обучаемые параметры»

Вероятностное глубокое обучение Введение Эта статья относится к серии «Вероятностное глубокое обучение». Эта еженедельная серия охватывает вероятностные подходы к глубокому обучению. Основная цель состоит в том, чтобы расширить модели глубокого обучения для количественной оценки неопределенности, то есть узнать, чего они не знают. Мы разрабатываем наши модели, используя TensorFlow и TensorFlow Probability (TFP). TFP — это библиотека Python, построенная поверх TensorFlow. Мы..