Публикации по теме 'machine-learning'


Как выполнить сопоставление строк нечеткого фрейма данных с помощью RecordLinkage
Расширенная очистка данных Как выполнить сопоставление строк нечеткого фрейма данных с помощью RecordLinkage Элитный пакет для самых сложных задач Введение В одной из своих предыдущих статей я писал о том, как выполнить подобие строк для очистки текстовых данных с помощью пакета fuzzywuzzy . Узнать о пакете и применить его на практике было действительно здорово. Но разве не было бы еще лучше, если бы мы могли выполнять тот же процесс между строками фреймов данных? Собственно,..

Федеративное обучение - машинное обучение с сохранением конфиденциальности
На помощь приходят безопасные многосторонние вычисления Федеративное обучение [1] , также известное как Совместное обучение или Машинное обучение с сохранением конфиденциальности , позволяет нескольким организациям, которые не доверяют друг другу (полностью), чтобы сотрудничать в обучении модели машинного обучения (ML) на их объединенном наборе данных; без фактического обмена данными - решение критических проблем, таких как конфиденциальность, права доступа и доступ к..

Group2Vec для предварительного категориального кодирования
Создавайте полноценные представления категорий с высокой мощностью Кодирование категориальных переменных является обязательным этапом предварительной обработки в каждом проекте машинного обучения. Выбрать правильную технику кодирования - серьезная и важная задача. Доступны многочисленные варианты: от классического однократного или целочисленного отображения до умной целевой функции кодирования или хеширования и, наконец, до более сложного векторного представления. Фиксированной..

Аннотация данных для машинного обучения | Услуги по маркировке данных | Аннотации | Маркировщик данных
Аннотации данных — это процесс прикрепления меток к наборам данных, которые используются для обучающих машин. Около 80% времени разработки проекта искусственного интеллекта тратится на подготовку данных. Успех любого проекта ИИ или машинного обучения прямо пропорционален качеству аннотированных данных, подаваемых в алгоритмы для их обучения. Даже малейшая ошибка может оказаться катастрофой для человечества, особенно если вы доверяете машинам свою жизнь. Аннотации данных для..

Прогнозирование веб-трафика
с помощью Wavenets от Google DeepMind В соавторстве с Apoorva Reddy Addvalli , Atindra Bandi Мотивация. Временные ряды, являющиеся важным понятием в статистике и машинном обучении, часто менее изучаются энтузиастами данных, такими как мы. Чтобы изменить ситуацию, мы решили поработать над одной из самых актуальных проблем современных временных рядов - «прогнозирование веб-трафика» . Этот блог отражает наш мозговой штурм, связанный с прогнозированием временных рядов..

Введение в персептрон и визуализацию
Привет. Надеюсь, у тебя все хорошо. В моем последнем посте мы настроили необходимую среду. Давайте начнем с сегодняшнего поста о персептроне. Перцептрон - это фундаментальная единица нейронной сети. Это алгоритм контролируемого обучения (мы говорим, что правильно, а что неправильно) для двоичной классификации (ноль или единица). Персептрон также является базовой математической моделью нейрона. Он пытается воспроизвести работу нейрона. Итак, чтобы реализовать перцептрон,..

Шноркель - слабая система наблюдения
Современные мощные модели, такие как DNN, дают самые современные результаты по многим задачам, и их легче развернуть, чем когда-либо прежде ( с использованием современных предварительно обученных моделей, таких как ULMFiT и BERT ). Таким образом, вместо того, чтобы тратить большую часть нашего времени на тщательную разработку функций для наших моделей, теперь мы можем передавать необработанные данные - изображения, текст и т. Д. В эти системы, и они могут изучать свои собственные функции...