Публикации по теме deep-learning

Публикации по теме 'deep-learning'

Новое понимание автоматической дифференциации, часть 2 (машинное обучение)

Реконструкция потока с помощью многоразовой оптимизации дискретных потерь с автоматическим дифференцированием (arXiv) Автор : Петр Карнаков , Сергей Литвинов , Петрос Кумуцакос . Аннотация: Мы представляем мощный вычислительный метод для решения обратных задач в механике жидкости. Мы рассматриваем обратные задачи, сформулированные в терминах детерминированной функции потерь, которая может учитывать данные и условия регуляризации. Мы вводим метод многосеточной декомпозиции,..

Хронология основных событий ИИ

Искусственный интеллект (ИИ) — это быстро развивающаяся область, и за эти годы произошло много важных событий, которые повлияли на ее развитие. Вот хронология некоторых из наиболее важных событий ИИ, названия важных событий выделены жирным шрифтом: 1950 Алан Тьюринг публикует свою статью «Вычислительные машины и интеллект», в которой представлен тест Тьюринга — проверка способности машины демонстрировать интеллектуальное поведение, эквивалентное человеческому или неотличимое от..

Разверните свой LLM API на ЦП

LLAMA 2 — это мощная языковая модель, которая продемонстрировала замечательные возможности в понимании и создании текста, похожего на человеческий. В этой статье мы проведем вас через процесс развертывания языковой модели LLAMA-2–13b-chat (LLM) в качестве API с использованием платформы FastAPI Python. Это позволит вам взаимодействовать с вашей моделью LLAMA 2 через HTTP-запросы и получать ответ в потоковом режиме, что позволяет использовать широкий спектр приложений, таких как чат-боты,..

Это квокка или капибара?

Заметки и мысли урока FastAI 1 По рекомендации некоторых старых коллег я решил пройти курс фастая , чтобы изучить некоторые основы глубокого обучения. Мне это нравится! Очень ориентирован на программиста, а это именно то, что мне нужно, учитывая мой личный технический опыт. Fastai кажется очень крутой библиотекой — оболочкой, которая делает обучение модели почти таким же простым, как изучение нового API. Я не делал ничего сверхъестественного с первым «домашним заданием» по курсу —..

Как стать «Data Scientist»?

Так как же стать специалистом по данным? Прежде чем мы ответим на вопрос, кто такой специалист по данным? Специалист по обработке и анализу данных использует данные, чтобы понимать и объяснять окружающие их явления и помогать организациям принимать более обоснованные решения. Прохладный. Тогда запишите меня, это звучит просто, не так ли? Ну, не такой быстрый чемпион. Давайте посмотрим, какие навыки необходимы для роли специалиста по данным начального уровня. Ученая степень в..

Руководство 2021 г. по улучшению стратегий обучения CNN: методология обучения и регуляризация

Это будет мой пятый пост в моей серии Руководство по улучшению CNN 2021 . Влияние стратегий обучения Методы обучения, такие как регуляризация, являются ключевыми для преодоления ограничений сетей глубокого обучения. Хотя им часто уделяется меньше внимания в исследовательских работах по сравнению с сетевыми архитектурами, большая часть улучшений в современных сетях связана с улучшенными методами обучения, включая методы регуляризации. Например, совершенно новая статья [1] показала,..

Как позиционные вложения работают в самовнимании

В языках порядок слов и их положение в предложении имеют значение. Если изменить порядок слов, смысл всего предложения изменится или предложение может стать бессмысленным после изменения порядка слов. Рекуррентные нейронные сети имеют встроенный механизм, который занимается упорядочением последовательностей. Но трансформеры не используют какие-либо рекуррентные нейронные единицы, такие как LSTM или GRU, и поэтому рассматривают каждое слово в последовательности как независимое друг от..