Публикации по теме 'data'


30 дней науки о данных — День 8: Самый само собой разумеющийся инструмент в науке о данных
В предыдущей статье я писал о некоторых распространенных ошибках, которые я не хочу совершать как Data Scientist. Если вы пропустили это, вот оно 30 дней Data Science — День 6: ошибки, которые я не хочу совершать как будущий специалист по данным Изучение чужих ошибок может дать понимание того, чего не следует делать и может помочь предотвратить возникновение подобных проблем… medium.com Есть некоторые ошибки, которые я хочу углубить в..

Понимание концепции протеомики, часть 2 (биотехнология)
1. Определение предела протеома-носителя для одноклеточной протеомики ( PubMed ) Автор: Томми К. Ченг , Чьен-Юн Ли , Флориан П. Байер , Аттикус Маккой , Бернхард Кастер , Кристофер М. Роуз . Аннотация: Протеомика одиночных клеток с помощью масс-спектрометрии (SCoPE-MS) — это недавно введенный метод количественной оценки мультиплексированных протеомов одиночных клеток. Хотя этот метод вызвал большой интерес, лежащие в его основе технологии (изобарическая маркировка и..

Обнаружение ковариатного сдвига: руководство по многомерному подходу
млн операций в секунду Обнаружение ковариатного сдвига: руководство по многомерному подходу Старый добрый PCA может предупредить вас об изменении распределения ваших производственных данных. Конечная цель любой модели машинного обучения — приносить пользу ее владельцу. Как правило, это значение проявляется в том, что алгоритм делает что-то лучше или быстрее (или и то, и другое), чем это может сделать человек. Стоимость инвестиций в разработку и развертывание модели часто высока...

Исследовательские работы по генеративно-состязательным сетям (GAN): модель глубокого обучения, часть 1
Инверсия GAN для увеличения данных для улучшения классификации поражений при колоноскопии ( arXiv ) Автор: Маянк Голхар , Тейлор Л. Бобров , Саовани Нгамруенгфонг , Николас Дж. Дурр Аннотация . Основной проблемой применения глубокого обучения к медицинской визуализации является нехватка аннотированных данных. Это исследование демонстрирует, что синтетические изображения колоноскопии, созданные с помощью инверсии генеративно-состязательной сети ( GAN ), можно использовать..

Дрейф данных и его влияние на производительность моделей
Введение Точно так же, как автомобили, данные дрейфуют. Однако, чтобы полностью понять дрейф данных, вы должны сначала понять дрейф модели. Дрейф модели — это изменение поведения модели. Эти изменения в первую очередь являются результатом двух факторов. Во-первых, это сдвиг концепции, также известный как дрейф концепции. Когда статистические свойства целевой переменной (переменных), которые модель машинного обучения должна предсказывать, изменяются, происходит дрейф концепции...

Краткий обзор: Бизнес-статистика — Первый курс (WIP)
Это работа в процессе… Вы можете связаться со мной по Linkedin по любым вопросам. Это краткое изложение «Первый курс бизнес-статистики» компании Pearson, призванное помочь людям, нуждающимся в кратком руководстве по статистике. Темы, которые будут затронуты, упомянуты ниже. Ссылки будут доступны для каждой из тем, как только они будут написаны и опубликованы. Темы для обсуждения: Определение и сбор данных Организация и визуализация переменных Численные описательные меры..

Рано или поздно вы столкнетесь с этой проблемой
Несколько дней назад Мерседес-Бенц , проводившийся на kaggle , закончился, и это соревнование было одним из самых сложных, в котором я когда-либо участвовал (и я не одинок). В этом посте я объясню, почему, и поделюсь некоторыми уроками. мы можем извлечь из этого. Этот пост должен быть кратким, я написал его, чтобы поделиться с вами опытом, который моя команда получила при работе над этим соревнованием, объяснить, почему решение проблемы, представленной нам, по-прежнему считается..