Публикации по теме data-science

Публикации по теме 'data-science'

Машинное обучение — это сложно. Сделайте это проще с Aero

Без управления инфраструктурой — развертывайте, управляйте и масштабируйте рабочие процессы Data Science & Machine Learning на надежной и простой в реализации платформе. Мы выпустили Aero! Наша бесплатная пробная версия уже доступна. Пожалуйста, перейдите по ссылке здесь , чтобы следить за новостями. Создавать программное обеспечение сложно. Создать масштабируемое, удобное в сопровождении и надежное программное обеспечение еще сложнее. Подсчитано, что 41 цент каждого доллара,..

Как неравенство Брунна-Минковского используется в машинном обучении, часть 4

Сильное неравенство Брунна — Минковского и его эквивалентность условию CD(arXiv) Автор: Маттиа Маньябоско , Лоренцо Портинале , Томмасо Росси . Аннотация: В условиях существенно неветвящихся метрических пространств с мерой доказывается эквивалентность между условием размерности кривизны CD(K,N) в смысле Лотта — Штурма — Виллани и вновь введенным понятием, которое мы называем сильным Брунном. — Неравенство Минковского SBM(K,N). Это условие является усилением обобщенного неравенства..

Python для науки о данных: всеобъемлющая дорожная карта

Python стал самым популярным языком программирования для науки о данных, и неудивительно, почему. Python прост в изучении и использовании, он достаточно мощен для решения сложных задач по обработке и анализу данных, и у него огромное сообщество разработчиков, которые постоянно создают новые библиотеки и инструменты. Если вы только начинаете работать с Python или хотите освежить свои навыки, эта дорожная карта Python для науки о данных для вас. Эта дорожная карта охватывает основные..

Данные OSEMN

В сообщении 2010 года под названием «Таксономия науки о данных » в блоге dataists Хилари Мейсон и Крис Виггинс представили структуру OSEMN. В основном это включало категоризацию общего рабочего процесса, который обычно выполняют специалисты по данным. Это список задач, над которыми ученый данных должен быть знаком и чувствовать себя комфортно. В этом посте я расскажу о структуре науки о данных, проведя вас через каждый этап жизненного цикла проекта, а также обсудив ключевые навыки..

Я объявляю себя врагом №1 избыточной/недостаточной выборки, SMOTE и ADASYN, вот почему и как я…

Введение В машинном обучении несбалансированные наборы данных являются распространенной и сложной проблемой. Как специалисты по данным, мы часто оказываемся в ситуациях, когда мы пытаемся построить модели с данными, где один класс значительно превосходит другой по численности. Классическим решением этой проблемы было использование методов избыточной/недостаточной выборки. Эти методы уравновешивают данные, либо увеличивая экземпляры класса меньшинства (избыточная выборка), либо уменьшая..

Ведущие инструменты бизнес-аналитики для крупных технологических компаний

Откройте для себя силу данных с лучшими инструментами бизнес-аналитики для крупных технологических предприятий. Эти инструменты, от анализа данных на основе искусственного интеллекта до упрощенной визуализации данных, способствуют принятию более эффективных решений и обеспечивают конкурентное преимущество». Введение Крупные технологические компании производят огромные объемы данных каждый день в нынешний цифровой период. С помощью этих данных можно сделать осознанный выбор и..

Приложения моделей BERT, часть 2 (Машинное обучение, 2023 г.)

Можем ли мы использовать зондирование, чтобы лучше понять тонкую настройку и дистилляцию знаний BERT NLU? (arXiv) Автор : Акуб Хосцилович , Марцин Совански , Пётр Чубовский , Артур Яницкий . Аннотация: В этой статье мы используем зондирование для исследования явлений, возникающих во время тонкой настройки и дистилляции знаний модели понимания естественного языка (NLU) на основе BERT. Нашей конечной целью было использовать зондирование, чтобы лучше понять практические..