Публикации по теме data-science

Публикации по теме 'data-science'

Лекция 003 - Подход к машинному обучению как химик-органик

Теперь я готов увидеть, что случилось с машинным обучением, поскольку этой области потребовалось время, чтобы созреть. Я просмотрел около 100 репозиториев в химико-информационном пространстве, и список здесь: Список Салстиса / хемоинформатика Вы не можете выполнить это действие в данный момент. Вы вошли в другую вкладку или окно. Вы вышли на другой вкладке или… github.com

Категории кодирования

Категориальные признаки — это те, которые содержат данные в виде категорий. Модели машинного обучения обрабатывают только числовые данные, но категориальные признаки в основном относятся к строковому типу данных. Поэтому кодирование, то есть преобразование этих категорий в числовые значения, имеет важное значение. Давайте подробно обсудим кодировку. Традиционные методы кодирования включают: Горячее кодирование Кодирование частоты подсчета Порядковое/меточное кодирование В..

Могу ли я использовать Java для машинного обучения?

Машинное обучение Могу ли я использовать Java для машинного обучения? Ответ да, и я покажу вам практический пример Честно говоря, я немного скептически относился к тому, что Java можно использовать для машинного обучения. Обычно вы используете Python или, в некоторых случаях, R. Но использование Java для машинного обучения просто не представлялось возможным.

Наука о данных: конфиденциальность, справедливость, аудит и соответствие

Мы обсуждали, как завершить рабочий процесс Data Science в предыдущих главах. В этом процессе есть определенные аспекты, которые, как правило, подробно не обсуждаются, но могут повлиять на выполнение и успех вашего проекта по науке о данных. Конфиденциальность - В проекте по науке о данных мы работаем с наборами данных из различных источников и систем. Некоторые из этих данных будут конфиденциальными с точки зрения PII (личной идентифицируемой информации) или корпоративных данных...

Ваша запатентованная модель искусственного интеллекта не имеет для меня никакого значения

… Если вы не поделитесь подробностями о его цели, дизайне, тестировании и показателях Продавцы во всем мире, пожалуйста, не говорите мне, что ваша модель машинного обучения (или, еще лучше, ИИ ) точна на 99%. Не говорите мне, что все, что нам нужно сделать, это подключить ваши данные , и произойдет какое-то блестящее волшебство. Я не единственный. Недавно 31 ученый оспорил исследование Google Health, потому что не было опубликовано достаточных доказательств, чтобы определить..

Объяснимая ограниченная машина Больцмана для совместной фильтрации

Ограниченная машина Больцмана - это тип искусственной нейронной сети, которая является стохастической по своей природе. Ограниченная машина Больцмана - это особый тип машины Больцмана. Что такое машина Больцмана? Машина Больцмана - это нейронная сеть с одним видимым слоем, обычно называемым «входным слоем», и одним «скрытым слоем». Так что нет выходного слоя. Он использовался для решения комбинаторных задач. Нейроны в скрытых слоях и видимых слоях также были соединены между собой...

Как работает активное обучение, часть 4 (машинное обучение)

Опрос об активном онлайн-обучении (arXiv) Автор : Давиде Каччарелли , Мурат Кулахчи . Аннотация: Активное онлайн-обучение — это парадигма машинного обучения, целью которой является выбор наиболее информативных точек данных для маркировки из потока данных. Проблема минимизации затрат, связанных со сбором помеченных наблюдений, привлекла большое внимание в последние годы, особенно в реальных приложениях, где данные доступны только в неразмеченной форме. Аннотирование каждого..