Привет, человек! Это новый выпуск моего еженедельного информационного бюллетеня, содержащий небольшую подборку интересных статей с прошлой недели, проектов, руководств и инструментов; все, что связано с данными, искусственным интеллектом и смежными темами. Приятного аппетита!
📝 Интересные статьи на этой неделе
- Исследователи Microsoft заявляют о современной модели биомедицинского НЛП
3'
PubMedBERT применяет предметно-ориентированное обучение, чтобы усилить свое понимание и обоснование биомедицинских текстов. - MLOps с Jupyter, Git и Kubernetes (блог Kubeflow)
13'
Инженеры Kubeflow объясняют, как они построили конвейер CI / CD для развертывания продукта машинного обучения с использованием Jupyter, Papermill, Tekton, GitOps и Kubeflow; делимся советами о том, как построить свой. - Решение проблем обнаружения данных в Shopify (Shopify Engineering)
10'
Процессы обнаружения и управления данными ухудшаются по мере увеличения объема хранимой информации. Инженеры Shopify делятся своим опытом и созданным ими решением для повышения производительности, доступности и управления данными. - Знакомство с обучением движению (блог Ubisoft)
13'
Как можно использовать машинное обучение для значительного сокращения использования памяти Motion Matching, мощным механизмом для анимации персонажи в играх.
💡 Проекты
- NeRF in the Wild (Google)
Реконструкция трехмерных сцен из коллекции Интернет-фотографий. Смотреть видео!
🔧 Учебники
- Поиск в Grubhub и пользовательское намерение: Dask, Snorkel и TensorFlow (спиральный блог)
7'
Резюме прямой трансляции с Алексом Эггом, старшим специалистом по данным в GrubHub. Он показал, как они построили конвейер машинного обучения для определения намерений пользователя (включая видео и код). - Плотные титры видео с помощью Pytorch
7'
Как обнаружить интересные события из необрезанного видео и создать текстовое описание для каждого из них. - Наука о данных на благо общества
6'
Краткая подборка ресурсов, примеров и возможностей, которые могут вас заинтересовать, если вы думаете о применении науки о данных на благо общества.
📦 Ресурсы
- Набор данных arXiv
1,7 миллиона статей, выпущенных arxiv.org, с полным текстом и соответствующими функциями. - Набор данных Unsplash
2M + HQ изображений, выпущенных Unsplash, с большим количеством метаданных. - Многоязычный набор данных от Salesforce
Текстовые данные с открытым исходным кодом от Salesforce со структурированной документацией на нескольких языках. - Pandera
Библиотека Python для проверки данных.
🎓 Курсы
- MIT 6.S191: Введение в глубокое обучение (MIT)
Теперь доступен вводный курс с полными лекциями.
🚀 Дополнительные биты
- Разумны ли люди? (Аррам Сабети)
9'
Эссе, написанное GPT-3, о человеческом интеллекте. - Философы о GPT-3 (Daily Nous)
45'
Девять философов говорят о GPT-3 и его последствиях. - Как Simulmatics Corporation изобрела будущее (житель Нью-Йорка)
30'
Когда J.F.K. баллотировалась в президенты, команда специалистов по обработке данных, намеревающаяся моделировать поведение американских избирателей и манипулировать им. - Знакомьтесь, Пушистик: робот-собака (Форд)
2'
Пушистик - робот Boston Dynamics, работающий с инженерами Ford.
💬 «Интеллект - это все, что делают люди» - GPT-3 (Являются ли люди разумными?)
👉 Newsletter en Español
👋 ¡Увидимся на следующей неделе!