Публикации по теме deep-learning

Публикации по теме 'deep-learning'

Как использовать глубокое обучение на рынке?

Автор Жюльен Плу (разработчик лаборатории) Эра современного искусственного интеллекта началась в середине 1940-х годов. В 1950 году Алан Тьюринг представил самую раннюю задачу искусственного интеллекта, ориентированную на обработку естественного языка, названную тестом Тьюринга . Цель этого теста, по словам Тьюринга, можно рассматривать как игру, в которой человек разговаривает с двумя разными собеседниками через компьютер, и он должен определить, кто из них человек, а какой..

Объяснение статей 50: PaLM

Языковая модель Pathways (PaLM) — это плотно активированная языковая модель Transformer с 540 миллиардами параметров. Он обучается на чипах 6144 TPU v4 с использованием Pathways, новой системы машинного обучения, которая обеспечивает высокоэффективное обучение на нескольких модулях TPU. PaLM 540B достигает прорывной производительности, превосходя передовые технологии в наборе многошаговых логических задач и превосходя среднюю производительность человека в недавно выпущенном тесте..

Мета-трансформатор: унифицированная структура для мультимодального обучения

В этом посте мы углубимся в мета-трансформер, метод мультимодального обучения, который был представлен в исследовательской статье под названием «Мета-трансформер: унифицированная структура для мультимодального обучения». В статье исследователи показывают, что они смогли обрабатывать информацию из 12 (!) различных модальностей, которые мы видим на изображении выше, включая изображения, текст, аудио, инфракрасные данные, табличные данные и многое другое. Это вдохновлено человеческим..

Создание библиотеки глубокого обучения на JavaScript с нуля (часть 2)

В части 1 этой серии руководств мы подробно остановились на некоторых мельчайших аспектах и основах реализации нашей собственной библиотеки глубокого обучения на JavaScript. Мы также реализовали некоторые базовые математические операции с функциями с одним значением - благодаря этому мы смогли увидеть, как работает автоматический расчет градиента, а также узнали идею, лежащую в основе статического графика. Во второй части мы обсудим, как реализовать тензоры и некоторые базовые..

Прогнозы глубокого обучения: ARIMA, Фурье и индексы формируют цены на акции.

В этой статье обсуждается использование ARIMA и преобразований Фурье в качестве характеристик модели глубокого обучения для эффективного прогнозирования финансовых результатов. При анализе данных временных рядов ARIMA также называется AutoRegressive Integrated Moving Average. Преобразования Фурье, с другой стороны, используют математический подход для разбиения данных временных рядов на составные компоненты путем изучения прошлой производительности. В результате выявляются разнообразные..

Использование динамики Ланжевена в машинном обучении, часть 1

Ускорение Langevin Dynamics путем микширования (arXiv) Автор: Александр Кристи , Юаньюань Фэн , Гаутам Айер , Алексей Новиков . Аннотация: Мы изучаем переддемпфированное уравнение Ланжевена на d-мерном торе со стационарным распределением, пропорциональным p=e−U/κ. Когда U имеет несколько лунок, время смешивания связанного процесса экспоненциально велико (размера eO (1 / κ)). Добавим дрейф в динамику Ланжевена (без изменения стационарного распределения) и получим количественные..

Построение модели трансформатора со слоями кодировщика и декодера в TensorFlow

В этом уроке мы продолжаем реализацию полной модели Transformer в TensorFlow. Для достижения этой цели мы реализуем Encoder и Decoder шаг за шагом. В первом уроке мы познакомились с Трансформерами. Что они собой представляют и какие преимущества и ограничения они несут. Также мы реализовали слой PositionalEmbedding в TensorFlow. После первого урока мы перешли ко второму уроку . Во втором уроке мы реализовали слои Add & Norm , BaseAttention , CrossAttention ,..