Публикации по теме 'data-science'


Как неправильно использовать экземпляры ноутбуков AWS Sagemaker
Как неправильно использовать экземпляры ноутбуков AWS Sagemaker Я использую Sagemaker в качестве основного разработчика. Среда для создания и развертывания продукта Data Science не менее 2 лет. Работая с людьми с разным уровнем опыта, я заметил множество антипаттернов , которых следует избегать при использовании Sagemaker. В следующем посте я сначала упомяну варианты использования антипаттернов и любые заблуждения, а затем объясню, почему их следует избегать и какова альтернатива...

Магия трансферного обучения: как превратить данные в золото
Введение В мире машинного обучения трансферное обучение стало модным словом, и на то есть веская причина. Трансферное обучение произвело революцию в том, как мы обучаем и разрабатываем нейронные сети, упрощая достижение высокой точности с ограниченными данными, сокращая время и стоимость обучения и улучшая обобщение. Итак, что такое трансферное обучение? Проще говоря, это метод использования знаний, полученных моделью, для решения конкретной задачи и применения их к другой..

Что такое причинно-следственный вывод и как он может помочь нам избежать неправильных толкований?
Цели этой статьи — представить основы причинно-следственного вывода, изучить примеры того, как таблица данных может быть легко неверно истолкована, и обсудить, как специалист по данным может интегрировать причинно-следственный вывод в конвейер машинного обучения. Основным справочным материалом для этой статьи является книга Перла, Глимура и Джуэлла «Причинно-следственные связи в статистике: учебник для начинающих» . Дополнительная библиография и ссылки представлены в конце этой..

Minerva от Google, решение математических задач с помощью ИИ
Количественные рассуждения сложны для людей и сложны для компьютеров. Новая модель Google только что дала поразительные результаты в решении математических задач. Мы привыкли сейчас к языковым моделям типа ТПТ-3 , но в основном их вывод текстовый. Количественное рассуждение сложно (многим из нас до сих пор снятся кошмары об исчислении из университета). Трудно и языковым моделям, где их исполнение далеко от человеческого уровня . Решение математических или научных задач требует..

Обзор: VGGNet - 1 место, занявшее второе место (классификация изображений), победитель (локализация) в ILSVRC 2014
В этой истории рассматривается VGGNet [1] . VGGNet была изобретена VGG ( Группа визуальной геометрии ) из Оксфордского университета, хотя VGGNet является 1-м занявшим второе место , а не победителем ILSVRC ( Конкурс крупномасштабного визуального распознавания ImageNet. ) 2014 г. в задаче классификации , которая значительно превосходит ZFNet (Победитель в 2013 году) [2] и AlexNet (Победитель в 2012 году) [3]. И GoogLeNet - победитель ILSVLC 2014, я также расскажу об этом позже.) Тем не..

Работа с семантическим сходством, часть 2 (машинное обучение)
Потеря семантического сходства при обобщении исходного кода нейронных сетей (arXiv) Автор : Чиа-И Су , Коллин МакМиллан Аннотация: В этой статье представлена ​​улучшенная функция потерь для обобщения исходного кода нейронов. Суммирование кода — это задача написания описаний исходного кода на естественном языке. Суммирование нейронного кода относится к автоматизированным методам создания этих описаний с использованием нейронных сетей. Почти все современные подходы используют..

Приложения пространственной кластеризации на основе плотности с шумом (DBSCAN)
Среди используемых в настоящее время алгоритмов обучения без учителя одним из самых популярных является DBSCAN. Неконтролируемое обучение - это когда сам используемый алгоритм должен идентифицировать шаблоны в наборах данных, которые не классифицируются и не маркируются, на основе аналогичных атрибутов и взаимосвязей в данных. Кластерный анализ - это тип обучения без учителя, при котором заданный некатегориальный набор данных группируется в естественные кластеры на основе характеристик..