Публикации по теме 'deep-dives'


Распределенное обучение сверхшироких сетей GCN без усилий
В этом посте я сделаю обзор недавно предложенной распределенной обучающей среды для крупномасштабных сверточных сетей на основе графов (GCN), называемой обучением подсетей, не зависящих от графа (GIST) [1]. GIST значительно ускоряет процесс обучения GCN для любой архитектуры и может использоваться для обучения крупномасштабных моделей, которые превышают возможности одного графического процессора. Я постараюсь охватить наиболее важные аспекты GIST в этом посте, включая соответствующую..

Идеальное перемешивание
Идеальное перемешивание Исследуя математику, лежащую в основе тасования фаро, отвечая на вопрос: сколько точных перетасовок необходимо, чтобы вернуть колоду карт в ее первоначальный порядок? Это было 2 года назад, когда я наткнулся на колоду игральных карт ремесленников. Гладкий, с неоново-красным акцентом, я купил его, не особо задумываясь. Я никогда особо не умел обращаться с картами, раскладывать карты веером или тасовать фаро было для меня трудным делом. Но эта новая колода..

Хорошие специалисты по данным пишут хороший код
Советы о том, как быть вежливым с собой и своими коллегами при разработке кода для продуктов данных Продукты данных — это программные приложения. Как специалисты по данным, мы создаем продукты данных , то есть продукты, которые используют данные для решения реальных проблем. Продукты данных могут принимать самые разные формы и формы в зависимости от решаемой проблемы и включать в себя статические отчеты, информационные панели в реальном времени, интерактивные веб-приложения,..

Совместное обнаружение объектов, сегментация экземпляров, отслеживание объектов и классификация в видеодомене
TT-SRN: платформа сегментации экземпляров видео на основе трансформатора Совместное обнаружение объектов, сегментация экземпляров, отслеживание объектов и классификация в видеодомене Что, черт возьми, такое TT-SRN и VIS? У вас есть 5 секунд, скажите, что такое TT-SRN? «Быстрый, простой, но точный модуль сегментации экземпляров видео на основе преобразователей» План атаки Сегментация экземпляров видео (VIS) - это недавно представленное исследование компьютерного зрения,..

Разумная эффективность глубокого обучения для прогнозирования временных рядов
Строительные блоки для современных моделей Очень общее определение Говоря о временных рядах, люди часто имеют тенденцию делать это очень практичным способом, ориентированным на данные: если вы попытаетесь найти какое-то определение, вы можете найти такие выражения, как серия точек данных, проиндексированных (или перечисленных, или графически) в временной порядок ( Википедия ), набор данных, собранных в последовательные моменты времени или в течение последовательных периодов..

Однажды я обучил ИИ рифмовать, и это заняло у GPT-J много времени
Поскольку Colab был медленным, я обновился до Pro. Каждый лимерик стоил мне десять центов. В марте 2022 года я исследовал использование ИИ для написания стихов с определенным размером для моей Статьи о глубоком хайку . Для этого проекта я обучил языковую модель GPT-J [1] обращать внимание на количество слогов во фразах для создания коротких стихотворений на заданную тему. Умение модели писать прозу с помощью рифм я не взял. Для этого проекта под названием Deep Limericks я провел..

pymoode: дифференциальная эволюция в Python
Решайте задачи одно- и многокритериальной оптимизации с помощью алгоритмов дифференциальной эволюции. Дифференциальная эволюция (DE) (Storn & Price, 1997) изначально была разработана для скалярной целевой оптимизации. Однако из-за простой реализации и эффективного качества решения задач DE был модифицирован различными способами для решения задач многокритериальной оптимизации. В этой статье мы увидим алгоритмы и операторы, доступные в пакете Python pymoode , с приложениями к..