3 июля 2018 г.

Новости о машинном обучении (ML), искусственном интеллекте (AI), Data Science (DS) и связанных областях расширенной аналитики.

Добро пожаловать в первую публикацию xplore.ai из 15 тщательно отобранных статей о ИИ из ежемесячной серии. Цель этой серии - предоставить аудитории тщательно подобранный список самых интересных новостей, публикаций и инструментов, с которыми наша команда столкнулась в течение предыдущего месяца.

15. ✏️ TensorEditor

TensorEditor - это визуальный инструмент, который позволяет даже неопытным пользователям создавать свои собственные модели TensorFlow всего за несколько кликов. Пользователь может настроить любой параметр из нейронной сети. Как только модель будет готова, инструмент сгенерирует соответствующий код Python, чтобы вы могли интегрировать его где угодно и выполнять на нем прогнозы.



14. 📈 Записная книжка "Парадокс вероятностей"

Хотя этому блокноту уже больше двух лет, мы столкнулись с ним в этом месяце и почувствовали, что должны поделиться им с вами. «Вероятность, парадокс и принцип разумного человека» содержит коллекцию из 10 аккуратно объясненных решений Python.

Http://nbviewer.jupyter.org/url/norvig.com/ipython/ProbabilityParadox.ipynb

13. 🔎 Единый подход Python для объяснения результатов работы любой модели машинного обучения. Визуализирует в JS

В последнее время мы все чаще наблюдаем тенденцию прилагать больше усилий для объяснения моделей машинного обучения и машинного обучения. Это хороший рыночный знак, поскольку он означает, что эти модели были запущены в производство, и многим заинтересованным сторонам необходимо понимать результаты модели, чтобы принимать дальнейшие решения. Мы понимаем, что получение информации на каждом этапе конвейера обработки данных имеет жизненно важное значение. Поэтому в xplore.ai мы пробуем этот модуль в наших текущих проектах.



12. 🤼 Оценка плотной позы человека в дикой природе

У исследовательского отдела Facebook есть открытые источники, позволяющие в реальном времени отображать все человеческие пиксели двухмерных RGB-изображений на трехмерную поверхностную модель тела. Они открыли исходный код используемых данных обучения: вручную аннотировали 50K изображений COCO. В статье также обсуждается, как региональные модели превосходят классические сверточные нейронные сети. FB использовал собственную платформу глубокого обучения Caffe2.



11. 🗣 Глубокое обучение для разговорного ИИ

PolyAI поделилась впечатляющей 187-страничной презентацией, раскрывающей текущее состояние разговорного ИИ. Они дают анализ последних тенденций исследований в области глубокого обучения для разговорного ИИ. Они также представляют отраслевой взгляд на текущий глубокий разговорный ИИ. Кажется, сейчас подходящий момент для изучения новых масштабируемых способов воздействия на эту огромную отрасль.

Https://www.poly-ai.com/docs/naacl18.pdf

10. 💢 СНАЙПЕР: эффективное многомасштабное обучение

SNIPER - это эффективный многомасштабный подход к обучению для задач распознавания на уровне экземпляра, таких как обнаружение объектов и сегментация на уровне экземпляра. Вместо того, чтобы обрабатывать все пиксели в пирамиде изображений, SNIPER выборочно обрабатывает контекстные области вокруг реальных объектов.



9. 📑 Статьи с кодом

Эта великолепная веб-страница содержит ссылки на исследовательские работы и их реализации кода в GitHub. Он даже сообщает вам количество звезд GitHub и какой фреймворк ML использовался для реализации. Не забывайте подписываться на их еженедельный дайджест.



8. 📜 Изучение перевода: контекстуализированные словесные векторы

Очень точное и конкретное объяснение от исследовательской группы Salesforce. Дается очень хорошее введение о векторах слов, а затем они объясняют, как различные методы, такие как внимание, кодеры, скрытые векторы, внимание, генерация и т. Д., Могут помочь в НЛП. Затем вводятся различные задачи НЛП: машинный перевод, ответы на вопросы, классификация, вывод, переход и т. Д. Они исследовали, что, комбинируя информацию из GloVe, CoVe и символьных векторов, значительно повышается производительность наших базовых моделей. на множество задач НЛП.



7. 👨 ‍⚖️ Помощник юриста Alibaba по искусственному интеллекту

Это исследование ясно показывает, что ИИ можно успешно внедрить в юридической сфере и что он может даже повысить точность при работе с большими объемами юридических документов по сравнению с профессиональными юристами. 8 юристов сравнили 600 юридических онлайн-соглашений с ИИ. ИИ достиг более высокого уровня точности в миллионных долях времени.



6. 🍎🍏 Обнаружение сходства изображений в Pinterest

В этом посте команда разработчиков Pinterest объясняет, как использовать пакетное локально-чувствительное хеширование поверх Spark и TensorFlow для обнаружения почти дублирующихся изображений. Применяется широкий спектр умных уловок, чтобы избежать необходимости делать 10 * 10 возможных сравнений.



5. 🏎 ️100 раз быстрее НЛП в Python

Смешивая внутренние структуры данных Cython и Scipy, Томас Вольф предлагает различные методы создания высокоскоростных алгоритмов НЛП на основе полезного профилирования и любезности C.



4. 💅 Что такое скрытый стиль

Stitch Fix известен, помимо прочего, вниманием к деталям, заботой о дизайне и любовью к данным. В этом коротком посте Эрин и Яна рассказывают об инструментах, которые они использовали для понимания стилей: PyTorch, Matrix Factorization, PCA и Ортогональная аппроксимация матрицы Прокруста. С помощью этих инструментов они смогли создать пространство скрытого стиля, в котором каждый элемент может быть представлен числовым вектором. Это напомнило мне статью Zalando's Research Fashion DNA.



3. 🦅🐊🐅🦍 Модельный зоопарк

Эта сеть позволяет пользователям открывать для себя открытый код глубокого обучения и предварительно обученные модели. Создание и обучение моделей - дело сложное и дорогое, особенно потому, что это зависит от данных нефти 21 века. В эпоху открытого исходного кода имеет смысл сначала обратить внимание на то, что другие сделали и узнали о проблеме, с которой вы столкнулись, хорошая инициатива!

Https://modelzoo.co/

2. Распознавание речи с TensorFlow

Реализация модели seq2seq для распознавания речи с использованием TF. Архитектура похожа на Слушай, слушай и произноси. Модель представляет собой пирамидальные двунаправленные LSTM в кодировщике, что снижает временное разрешение и повышает производительность на более длинных последовательностях.



1. TensorFlow: детали, которые сбивают с толку (1)

Часть 1 из серии сообщений, которая поможет читателю лучше понять, что такое TensorFlow, как он работает и как его использовать. Хотя концепции, представленные в этом руководстве, являются фундаментальными для всех программ TensorFlow, довольно легко перестать любить TF из-за необходимости научиться использовать его трудным способом. Таким образом, я бы порекомендовал это чтение любому новичку или промежуточному пользователю TensorFlow.



И это то, что нам показалось интересным в июне. В xplore.ai мы всегда пробуем новейшие инструменты, экспериментируем с передовыми алгоритмами и читаем о последних тенденциях в каждой отрасли, где данные создают беспрецедентную ценность.

Если вам понравилась статья, хлопайте в ладоши и подписывайтесь. Вы также можете проверить другие статьи в нашем блоге xplore.ai. Вы также можете подписаться на нас в LinkedIn и Twitter. Надеемся, у вас впереди отличный месяц!