Всем привет, добро пожаловать в Dynamicly Typed #39, Medium edition!

Сегодня в области искусственного интеллекта я расскажу о системе машинного обучения Cloudflare, которая блокирует вредоносных ботов, пытающихся получить доступ к веб-сайтам своих клиентов; и у меня есть ссылки на пользовательское исследование инструмента Google для выявления заболеваний с использованием искусственного интеллекта и статью о роботах для доставки еды на тротуаре. Для исследований машинного обучения и искусственного интеллекта в области изменения климата у меня также есть целый ряд быстрых ссылок, а также описание проекта мониторинга окружающей среды в стартап-программе NVIDIA Inception. И, наконец, для интересного, я нашел веб-сайт, который позволяет вам рисовать на своем лице в дополненной реальности. Давайте погрузимся!

Произведенный искусственный интеллект 🔌

Компания, занимающаяся веб-инфраструктурой, Cloudflare использует машинное обучение, чтобы блокировать посещение веб-сайтов своих клиентов «плохими ботами». В Интернете вредоносные боты используются для очистки контента, рассылки спама, серфинга по кредитным картам, накопления запасов, и многое другое. Плохие боты составляют поразительные 37% интернет-трафика, видимого Cloudflare (люди несут ответственность за 60%).

Чтобы заблокировать этих ботов, Cloudflare создала систему подсчета очков, основанную на пяти механизмах обнаружения: машинное обучение, механизм эвристики, анализ поведения, списки проверенных ботов и снятие отпечатков пальцев JavaScript. На основе этих механизмов система присваивает каждому запросу, проходящему через Cloudflare, оценку от 0 (вероятно, бот) до 100 (вероятно, человек) — около 11 миллионов запросов в секунду. Эти оценки отображаются в виде полей для Правил брандмауэра, где администраторы сайта могут использовать их в сочетании с другими свойствами, чтобы решить, должен ли запрос пройти через их веб-серверы или быть заблокированным.

Машинное обучение отвечает за 83% механизмов обнаружения. Поскольку ключевыми требованиями были поддержка категориальных функций и скорость вывода, Cloudflare выбрала деревья решений с градиентным усилением в качестве модели выбора (реализованной с помощью CatBoost). Они выполняются примерно за 50 микросекунд на вывод, что достаточно быстро, чтобы включить некоторые интересные дополнения. Например, несколько моделей могут работать в теневом режиме (записывая свои результаты, но не влияя на решения о блокировке), чтобы инженеры Cloudflare могли оценить их производительность на реальных данных, прежде чем развертывать их в системе управления ботами.

Алексей Бочаров написал о разработке этой системы для блога Cloudflare. Это отличная статья о добавлении функции на основе ИИ в более крупное предложение продукта с хорошим освещением всех компромиссов, связанных с этим процессом.

Быстрые ссылки на искусственный интеллект 🔌

Исследования в области машинного обучения 🎛

Быстрое исследование машинного обучения + ссылки на ресурсы 🎛 (просмотреть все ресурсы TODO)

Искусственный интеллект для климатического кризиса 🌍

К 50-летию Дня Земли Иша Салин написал о трех стартапах, использующих глубокое обучение для мониторинга окружающей среды, которые являются частью Начальной программы NVIDIA для стартапов. Вот что они делают.

Orbital Insight наносит на карту вырубку лесов, чтобы помочь Global Forest Watch, аналогично работе, проводимой and 20tree.ai (DT # 25) и лабораторией Дэвида Дао в ETH Zurich (DT # 28):

Инструмент также может помочь компаниям оценить риск вырубки лесов в их цепочках поставок. Такие товары, как пальмовое масло, привели к повсеместной вырубке лесов в Юго-Восточной Азии, что побудило несколько производителей взять на себя обязательство добиться нулевой чистой вырубки лесов в своих цепочках поставок в этом году.

3vGeomatics отслеживает таяние вечной мерзлоты в канадской Арктике в рамках проекта Канадского космического агентства. Почему это важно:

К 2100 году может растаять до 70 процентов вечной мерзлоты, что приведет к выбросу в атмосферу огромного количества углерода. Оттаивание вечной мерзлоты, вызванное изменением климата, также вызывает оползни и эрозию, которые угрожают населению и важнейшей инфраструктуре.

Азевеа осуществляет мониторинг строительства вокруг нефте- и газопроводов для выявления строительных работ, которые могут привести к повреждению труб и возникновению утечек:

Ежегодно нефтегазовая промышленность США выбрасывает в атмосферу около 13 миллионов метрических тонн метана, большую часть которых можно предотвратить. Одним из основных источников является ущерб от раскопок, нанесенный третьими лицами, которые не знают, что они копают газопровод.

Я всегда немного не решаюсь освещать стартапы машинного обучения, которые работают с нефтегазовыми компаниями, но я думаю, что в этом случае их работа приносит чистую прибыль. Подробнее о технологии GPU, используемой во всех этих проектах, см. в полной публикации Салина.

Быстрые ссылки на ИИ для климата🌍

Классные вещи ✨

Сирил Диань, постоянный художник, дизайнер и программист Google Arts & Culture, создал AR Face Doodle — веб-сайт, который позволяет вам рисовать на своем лице в 3D. Он основан на MediaPipe Facemesh, облегченном конвейере машинного обучения, предсказывающем 486 трехмерных ориентиров лица для определения приблизительной геометрии поверхности человеческого лица, который может работать в браузере в режиме реального времени с помощью TensorFlow.js. Сайт позволяет рисовать волнистые линии поверх изображения с селфи-камеры, а затем прикрепляет их к ближайшей точке на вашем лице. Когда вы двигаете своим лицом или даже морщите его, каракули прилипают к своим местам и удивительно хорошо перемещаются в 3D. AR Face Doodle должен работать в любом современном браузере; вы также можете проверить код сайта на GitHub: cyrildiagne/ar-facedoodle.

Ссылки на интересные вещи ✨

Спасибо за прочтение! Если вам понравился этот выпуск Dynamically Typed, рассмотрите возможность подписаться, чтобы получать новые выпуски прямо на ваш почтовый ящик каждое второе воскресенье.

Первоначально опубликовано 10 мая 2020 г. на странице https://dynamicallytyped.com.