Публикации по теме 'data'


Что такое увеличение данных?
Количество и разнообразие данных являются важными факторами эффективности большинства моделей машинного обучения. Количество и разнообразие данных, предоставляемых во время обучения, сильно влияет на точность прогнозирования этих моделей. Скрытые нейроны распространены в моделях глубокого обучения, которые были обучены хорошо выполнять сложные задачи. Количество обучаемых параметров растет вместе с количеством скрытых нейронов. Количество необходимых данных пропорционально количеству..

Код Випассана Сезон 1
Код Випассана Сезон 1 TL;DR 5-недельная серия, посвященная практической разработке приложений с использованием сервисов Google Cloud по темам баз данных, бессерверных технологий и машинного обучения (ML). Ответить сейчас! (Кстати, TLDR относится к резюме документа и переводится как Слишком длинно, не читал . Меня это успокаивает.) #КодВипассана Випассана — это буддийская практика проницательной медитации, основанная на серии инструкций, направленных на познание истины..

Лучшие практики, чтобы стать хорошим специалистом по данным или инженером по машинному обучению
Изучение важных практик, применяемых специалистами по обработке и анализу данных и инженерами по машинному обучению, гарантирует, что работа будет выполняться качественно и эффективно для организации. Существует большое количество курсов, посвященных основам программирования и обработки данных. Они хорошо подкрепляют различные концепции машинного обучения и показывают различные шаги, которые обычно выполняются при создании проекта с возможностями машинного обучения. Хотя эти курсы в..

Почему вы должны заботиться о конвейерах ETL?
Что такое конвейер ETL? ETL означает Извлечение , Преобразование , Загрузка . Конвейер ETL — это процедура извлечения данных из одного или нескольких источников, их преобразования в соответствии с требованиями и загрузки в целевую систему (системы). Например, ETL может объединять информацию о компании с ее транзакционными данными, находящимися в разных исходных системах, и сохранять эту новую информацию в S3 в качестве целевой системы. Без конвейера ETL данные извлекаются из..

Машинное обучение — Набор данных Iris — 3 алгоритма
Набор данных Iris — это набор данных, используемый новичками для изучения работы базовых алгоритмов классификации. Данные по ирисам основаны на видах цветков ириса. Вы можете получить CSV-версию этого набора данных здесь . Он имеет 4 функции: длина чашелистика, ширина чашелистика, длина лепестка, ширина лепестка, все они указаны в сантиметрах. В общей сложности он имеет 150 строк данных, состоящих из 3 видов, по 50 строк для каждого вида. Затем также дается столбец с его видами...

Должны ли вы получить степень магистра (MSc) в области науки о данных или аналитики?
Магистр наук о данных и аналитике стал довольно хорошо внедряться в учебные программы университетов. В настоящее время они предлагают более тысячи магистров из разных отделов и школ, из школ информатики, математики и статистики, экономики или бизнеса. При рассмотрении вопроса о магистратуре в области науки о данных у вас, вероятно, возникнет несколько вопросов…

Каждая концепция в Data 101
Сегодня я собираюсь дать обзор всех терминов данных в мире данных. Я разделю это на 3 разные части — Data Engineer, Data Scientist и Data Analyst. В изобилии контента в Интернете легко потеряться и запутаться в практическом применении данных в реальном мире. Поэтому важно иметь полное представление об основах в области данных. Давай начнем! 1. Данные Данные представлены в виде чисел, которые легко понимает компьютер. Данные включают фактические числа, текст, изображения, звук и..