Публикации по теме 'computer-vision'


Ускоренный курс компьютерного зрения
Компьютерное зрение - это область искусственного интеллекта, которая обучает компьютеры интерпретировать и понимать визуальный мир. Используя изображения и видео, машины могут идентифицировать и классифицировать объекты. Изображение можно описать как комбинацию пикселей. Эти пиксели могут быть сохранены как 8-битовые целые числа с диапазоном возможных значений от 0 до 255. Следовательно, каждое изображение в градациях серого может быть выражено в форме матрицы размером n x m. Это..

Превратите камеру вашего мобильного телефона в детектор объектов (самостоятельно!)
Пришло время раскрыть потенциал вашей камеры! Что, если бы больше людей смогли превратить камеры своих мобильных телефонов в детекторы объектов с помощью всего лишь нескольких строк кода? Эта история написана для того, чтобы добавить веселья в жизнь каждого! Вероятно, это отличный способ начать изучать JavaScript и React! Эта история предполагает простые базовые знания JavaScript, npm и React. Что ж, это может быть действительно легко реализовать, просто выполнив следующие действия!..

Нейронное структурированное обучение и состязательная регуляризация
Повышение устойчивости классификационной модели с помощью состязательной регуляризации в TensorFlow Введение Как многие из нас, без сомнения, знают, неизменный прогресс, достигнутый в области компьютерного зрения, привел к некоторым невероятным достижениям во многих дисциплинах, от здравоохранения и беспилотных автомобилей до изучения климата и игр, и это лишь некоторые из них. От современного оборудования с охлаждением жидким азотом в виде блоков обработки тензорных блоков (TPU)..

Добро пожаловать в Core ML
После выступления на конференции WWDC17 мы с моим другом Aleph были в восторге от нового фреймворка Core ML. Затем мы начали экспериментировать и решили поделиться тем, что мы здесь сделали. С помощью Core ML вы можете предоставить своим приложениям машинное обучение, которое запускается локально и оптимизировано для работы на устройстве, сводя к минимуму объем памяти и энергопотребление. Core ML поддерживает множество моделей машинного обучения (нейронные сети, ансамбли..

Чему вас научат мастера машинного обучения
Мнение и опыт Чему вас научат мастера машинного обучения Распространенные заблуждения о получении ученой степени в области машинного обучения Введение В этой статье представлены аспекты и заблуждения в области машинного обучения, которым не обязательно учат на ученых степенях. Содержание этой статьи основано на моем опыте, поэтому учтите, что ваш опыт и опыт других могут отличаться от моего. Тем не менее, наслаждайтесь чтением. Машинное обучение как академическая..

Маска R-CNN от чего и как работает? Попытка 1
Всплеск цвета: сегментация экземпляра с помощью Mask R-CNN и TensorFlow Объясняется путем создания фильтра всплеска цвета engineering.matterport.com Экземпляр → сложно, так как мы должны подсчитать количество экземпляров на изображении → очень сложно, и они могут перекрываться. Быстрая RCNN → обновления → Маска RCNN. В основном → изображение закодировано → это кодировка функции. (еще одна сеть, обученная классификации..

FaceNet: унифицированное встраивание для распознавания лиц и кластеризации
FaceNet - это встраиваемая среда обучения для проверки лиц, распознавания / классификации и кластеризации. Структура оценивается на человеческих лицах, проверяя, принадлежат ли два лица одному и тому же человеку, и группируя лица, которые принадлежат одному человеку, как в Google Picasa. В статье основное внимание уделяется триплетным потерям. Оцениваются различные сети встраивания, такие как начальные и варианты AlexNet. Главный вывод: Triplet loss изучает вложение для классификации и..