Публикации по теме 'data-science'


Серия интервью ML-Индия | Доктор Маянк Ватса, IIIT Дели
Серия интервью ML-Индия | Доктор Маянк Ватса, IIIT Дели Доктор. Mayank Vatsa — адъюнкт-профессор Института информационных технологий Индрапрастха, Дели (IIIT-Дели), Индия. Он получил степень магистра права. и доктор философии получил степень в области компьютерных наук в Университете Западной Вирджинии, Моргантаун, Западная Виргиния, США, в 2005 и 2008 годах соответственно. Он является автором более 200 публикаций в реферируемых журналах, главах книг и на конференциях. Его..

Учебное пособие по Python: таблица поиска имен для наборов данных с нечеткими именами
Серия учебных пособий по статистике Python Учебное пособие по Python: таблица поиска имен для наборов данных с нечеткими именами Повышение точности сопоставления имен людей за счет использования комбинаций компонентов имени Это шестая статья нашего путешествия в мир исследования данных Python. Щелкните ссылку над заголовком, чтобы получить список всех статей. Цель этого урока Подведем итоги того, чего мы достигли на нашем последнем уроке . Мы разработали алгоритм нечеткого..

XGBoost: улучшение по сравнению с машинами для повышения градиента
В первой части этого обсуждения XGBoost я заложил основу для понимания основных компонентов повышения. Короче говоря, повышение использует последовательности деревьев решений, которые стремятся уменьшить остатки предыдущего дерева. Другими словами, каждое новое дерево использует остаток предыдущего дерева в качестве целевой переменной для текущего дерева. При этом для каждого нового дерева большее внимание уделяется более крупным ошибкам предыдущих деревьев. После создания достаточного..

Прогнозирование цен на вино с помощью настроенных деревьев с градиентным усилением
Использование Optuna для поиска оптимальной комбинации гиперпараметров Что такое настройка гиперпараметров? Многие популярные библиотеки машинного обучения используют концепцию гиперпараметров. Это могут быть настройки конфигурации или элементы управления для вашей модели машинного обучения. Хотя многие параметры изучаются или решаются во время подгонки вашей модели (подумайте о коэффициентах регрессии), некоторые входные данные требуют, чтобы специалист по данным заранее указал..

Наука о данных
Наука о данных преобразует данные в знания, которые можно использовать для принятия рациональных решений. Что такое наука о данных? Наука о данных — это отрасль больших данных, направленная на предоставление значимой информации на основе больших объемов сложных данных. Наука о данных — это сочетание компьютерных наук, математики и статистики, экспертизы в предметной области, которая стремится получить представление о данных. Аналитик данных обычно объясняет, что происходит,..

Объяснение линейной алгебры - Часть 1
Линейная алгебра требуется для большинства областей, особенно для машинного обучения и науки о данных. Я посмотрел серию видео под названием Суть линейной алгебры и нашел их очень полезными для понимания логики линейной алгебры. Я хотел поделиться некоторыми важными моментами из этих видео. Если у вас нет времени смотреть видео или вы просто хотите запомнить основы линейной алгебры, не стесняйтесь читать этот пост. Что такое вектор? Есть разные представления о векторах. Физики..

AI улучшил молекулярные открытия и оптимизацию
Обращение ко всем ученым и разработчикам Мы находимся на пороге нового научного метода, использующего возможности искусственного интеллекта для ускорения научных открытий. «За последние несколько лет объем данных, генерируемых экспериментами и моделированием, породил четвертую парадигму науки - науку, управляемую данными , которая объединяет первые три парадигмы теории, эксперимента и вычислений / моделирования ». - Анкит Агравал из Северо-Западного университета Наука..