Публикации по теме data

Публикации по теме 'data'

Федеративное обучение — обзор проблемы, вызовов и возможностей — Рауль Хименес…

Большинству алгоритмов машинного обучения нужны данные, и чем больше данных мы снабжаем наши модели, тем лучше они узнают о динамике мира. К счастью для нас, в современном мире данные повсюду, они разбросаны по разным местам, где они были собраны. Примерами этого являются пользовательские данные, которые ежедневно собираются нашими мобильными телефонами, медицинским оборудованием и практикующими врачами в медицинских учреждениях и т. д. Обычно, если мы хотим обучить модель обучения, мы..

Переоснащение против недостаточного

Руководство по распознаванию и исправлению вашей модели машинного обучения Один из наиболее тревожных индикаторов плохо работающей модели машинного обучения - это проверка точности данных обучения и тестирования. Проверка ваших данных покажет, является ли ваша модель переоборудованной, неполноценной или сбалансированной. Причина, по которой у нас есть разделение на поезд и тест, заключается в том, чтобы мы могли определять и настраивать производительность наших моделей. В противном..

Скучно, шаблонные наборы данных! Используйте эти 17, чтобы создать действительно отличное портфолио

Уникальные наборы данных от микробиологии до спорта Возможно, вы уже почувствовали легкое отвращение, когда увидели, как люди снова и снова используют одни и те же наборы данных. Все хотят легкого. Новички используют такие наборы данных, как Titanic, Iris и Ames Housing Dataset, потому что они до глупости просты; большинство создателей курсов и блоггеров используют их, потому что они находятся всего в одном поиске Google (или даже добавлены в закладки). Сегодня я решил поделиться..

Pandas Unleashed: швейцарский армейский нож аналитика данных — Часть III

Группировать df.groupby(Column Name/Names) Метод Pandas groupby используется для группировки данных по категориям и применения функции к категориям. Это также помогает эффективно агрегировать данные. Если какая-либо агрегатная функция не предоставлена, она просто предоставит вам объект ‹pandas.core.groupby.generic.DataFrameGroupBy по адресу 0x7fd1d06656f0> . Агрегатные функции являются обязательными для метода goupby. Базовыми агрегатными функциями являются mean, min, max,..

Как легко понять ER-диаграммы

Хорошие разработчики умеют работать с базами данных. Мы сосредоточимся на понимании ER-моделирования, рассмотрев один простой пример — базу данных COMPANY. К концу этого руководства мы рассмотрим основы разработки концептуальной схемы для реляционной базы данных. Я разработал учебник, чтобы: Представьте проблему Показать решение Прохождение, как мы решили проблему Если вы хотите бросить вызов себе. Я предлагаю вам сначала прочитать задачу. Попытка разработать схему. Затем..

Определение данных в мире машинного обучения

В мире искусственного интеллекта и машинного обучения мы часто слышим, как ученые говорят, что ваша модель машинного обучения настолько хороша, насколько хороши ваши данные. Верно, но что именно представляют собой эти данные, которые могут создать или разрушить основу модели? И как эти модели обучаются после сбора и хранения «правильного» количества и качества данных? Чтобы понять вышеизложенное, нам нужно сделать шаг назад и сначала понять различные типы данных, доступные для обучения...

Исследовательские работы для чтения о прогрессе, достигнутом в области языков программирования

Проверка типов для языка программирования логики с ограничениями на основе наборов ( arXiv ) Автор: Максимилиано Кристиа , Джанфранко Росси Аннотация: {log} (читается как «setlog») — это язык логического программирования с ограничениями (CLP) и решатель выполнимости, областью ограничений которого является теория конечных множеств. Основанный на CLP и Прологе, {log} по существу предоставляет нетипизированный язык. Таким образом, он может принимать формулы, которые заставляют..