Публикации по теме 'data'


Машинное обучение - будущее качества данных?
Некоторые методы машинного обучения для оценки качества данных «Мусор на входе, мусор на выходе», в мире данных мы часто слышим эту фразу, которая означает, что если ваши данные «плохие», вы никогда не сможете принимать «хорошие» решения ( держим пари, что вы этого не ожидали: P ). Путь от «плохого» к «хорошему» - вот что такое качество данных. Плохие данные могут означать многое, например: Данные устарели, Своевременность Данные неточные, Точность Данные имеют разные..

Понимание дискурсов на нескольких языках
Создание нового набора данных для определения структуры французского текста Авторы Маджид Лаали и Арчи де Беркер В этом посте описывается статья Улучшение проекции дискурсивных отношений для построения аннотированных корпусов дискурса »авторов Маджида Лаали и Лейлы Коссейм . В библейской истории о Вавилонской башне люди мира говорят на одном языке, который отняли у них в наказание за их стремление построить башню, чтобы достичь Бога. В результате они остаются в..

Генераторы Python
Учебное пособие по разработке функций генератора Python с использованием ключевого слова yield Проще говоря, генераторы Python упрощают функциональность для поддержания постоянных состояний. Это позволяет выполнять инкрементные вычисления и итерации. Кроме того, для экономии памяти вместо массивов можно использовать генераторы. Это связано с тем, что генераторы не хранят значения, а скорее логику вычислений с состоянием функции, аналогично неоцененному экземпляру функции, готовому к..

Каждый специалист по анализу данных должен это усвоить
Этот единственный навык откроет для вас мир новых возможностей У вас когда-нибудь была идея об этом удивительном проекте по науке о данных: вы ищете данные, которые вам понадобятся, в Интернете, но, к сожалению, их нигде нет? К сожалению, не все наборы данных, которые вам когда-либо понадобятся, доступны в Интернете. Итак, что нужно делать? Отказаться от идеи и вернуться к kaggle? Нет! Настоящий специалист по данным должен уметь собирать свои ДАННЫЕ! Что такое веб-парсинг и зачем..

Современная аналитическая архитектура
Как мы знаем, данные являются бизнес-активом любой организации, которая подвергается аудиту и защите. Чтобы добиться успеха в своем бизнесе, для каждой организации становится очень срочно выбирать несколько хороших моделей прогнозных данных и проверять их с помощью тестовых данных, прежде чем выяснять план ввода в действие модели, которая будет развернута в производственной среде, чтобы приложения могли ее использовать. Компаниям необходимо извлекать больше пользы из своих данных. Однако..

Как создать стратегию обработки данных для вашей организации
Заметки об ИИ Как создать стратегию обработки данных для вашей организации Три основных принципа создания надежной стратегии обработки данных Здесь я хочу простыми словами описать стратегию обработки данных и помочь вам создать ее для вашей организации. В последние годы данные стали стратегическим ресурсом для компаний, и каждая компания должна разработать стратегию обработки данных, чтобы не проиграть игру своим конкурентам. Главный вопрос - как? Чтобы ответить, вы должны,..

Объяснение шумоподавляющих автоэнкодеров
В прошлом месяце я писал о Вариационных автоэнкодерах и некоторых их сценариях использования. На этот раз я взгляну на другой тип автоэнкодера: автоэнкодер с шумоподавлением, который может восстанавливать поврежденные данные. Автоэнкодеры - это нейронные сети, которые обычно используются для выбора и извлечения функций. Однако, когда в скрытом слое больше узлов, чем входов, Сеть рискует изучить так называемую «функцию идентичности», также называемую «нулевой функцией», что означает, что..