Публикации по теме data-science

Публикации по теме 'data-science'

Градиентный спуск - дорожная карта подножия холма

Вступление Градиентный спуск - это итеративный алгоритм оптимизации, который используется для поиска локального / глобального минимума дифференциальной функции. Поскольку основная цель этой функции - найти минимум, она широко используется в машинном обучении для поиска идеальных параметров, которые минимизируют стоимость. В этой статье мы увидим, как работает этот алгоритм, математику, лежащую в основе этого алгоритма, и типы градиентного спуска. Как именно это используется в..

Интеллектуальный анализ данных — Что, почему, как?

Что такое интеллектуальный анализ данных? Проще говоря, интеллектуальный анализ данных — это процесс просеивания больших наборов данных для выявления и описания паттернов , обнаружения и установления отношений с целью предсказать будущие тенденции. на основе этих шаблонов и отношений . Почему интеллектуальный анализ данных актуален сейчас? Разве мы не добывали данные с незапамятных времен? И да, и нет. Это правда, что данные всегда анализировались для выявления..

Классификация ожирения и анализ данных с помощью машинного обучения

Введение Я решил продолжить анализ набора данных , который я использовал для своего EDA для окончательного проекта. Набор данных зафиксировал уровни ожирения у людей из Мексики, Перу и Колумбии, а также их пищевые привычки и физическое состояние. Поскольку в рамках проекта нас просили создать модель машинного обучения, мне было интересно построить точную модель, учитывающую, страдает человек ожирением или нет (проблема двух классов), а также найти функции, которые будут наиболее..

Простое руководство по настройке гиперпараметров в нейронных сетях

Пошаговое руководство в записной книжке Jupyter по оптимизации гиперпараметров. Это четвертая статья из моей серии о полностью связанных (ванильных) нейронных сетях. В этой статье мы оптимизируем нейронную сеть и проведем настройку гиперпараметров, чтобы получить высокопроизводительную модель на функции Била - одной из многих тестовых функций, обычно используемых для изучения эффективности различные методы оптимизации. Этот анализ можно повторно использовать для любой функции, но..

Введение в BigQuery ML

Несколько месяцев назад Google анонсировал новую функцию Google BigQuery под названием BigQuery ML, которая в настоящее время находится в стадии бета-тестирования. Он состоит из набора расширений языка SQL, который позволяет создавать модели машинного обучения, оценивать их прогнозную производительность и делать прогнозы для новых данных непосредственно в BigQuery. Одним из преимуществ BigQuery ML (BQML) является то, что для его использования достаточно знать только стандартный SQL..

Предварительная обработка данных стала проще

Содержание этой статьи вдохновлено курсом Udemy Machine Learning A-Z Кирилла Еременко и Хаделин Де Понтевес. Если вы специалист по данным, самая важная часть вашего пути - это предварительная обработка данных. Эта часть определяет остальную часть вашей работы. На этом этапе сбора данных данные, которые мы получаем, могут быть не всегда правильными, у нас могут быть некоторые недостающие значения, нежелательные функции или строковые данные. Но для любой хорошей модели машинного обучения..

Объяснение машинного обучения бабушке: перекрестная проверка

Как объяснить перекрестную проверку простым языком Как специалист по данным в области цифровой медицины, мне часто приходится объяснять модели машинного обучения нетехническим специалистам. На самом деле это происходит так часто, что я создал кучу объяснений распространенных методов машинного обучения, которые настолько просты, что вы можете использовать их, чтобы объяснить машинное обучение бабушке! Не забудьте прочитать Объяснение машинного обучения бабушке: модели на основе..