Воскресный брифинг D4S №103
Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.
16 мая 2021 г.
Дорогие друзья,
Добро пожаловать в 103-й выпуск воскресного брифинга.
На этой неделе мы продолжим перерыв в ведении блога (для столь необходимого отпуска), но вы можете наверстать упущенное в последнем сообщении на G4Sci: Компоненты графа: сильно и слабо связанные компоненты, обзор алгоритмов для определения связанных компонентов и того, как они могут использоваться для лучшего понимания сети связи в реальном мире. Вы должны Подписаться на G4Sci, чтобы не пропустить пост!
На Medium Конкурирующие штаммы CoVID-19 — самая последняя публикация в серии Эпидемиология, а Посредничество — последняя в серии Причинно-следственная связь, пока мы продолжаем работать над особенно длинным разделом 3.8 Букваря. Наконец, как всегда, вы можете найти код в репозиториях Эпидемиология и Причинно-следственная связь GitHub соответственно.
Май — это месяц анализа временных рядов, второй вебинар Расширенные временные ряды для всех состоится 26 мая. На этом вебинаре мы развиваем понятия, представленные на первом занятии, и представляем более продвинутые методы и модели.
На этой неделе мы узнаем о Clustergam, о том, как мозг отображает идеи и воспоминания, как работает поиск изображений в Dropbox и Современной денежной теории.
Из Ivory Tower у нас есть глобальная база данных прививок от COVID-19, Геометрическое глубокое обучение, дистанционная основа сложных сетей и Обзор подходов к увеличению данных для НЛП.
Наконец, в Книге по науке о данных на этой неделе будет Анализ данных: байесовское руководство Д.С. Изучая прошлое, настоящее и будущее».
Данные показывают, что лучший способ распространения информационного бюллетеня — это распространение из уст в уста, поэтому, если вы думаете, что кому-то из ваших друзей или коллег понравится этот информационный бюллетень, просто перешлите ему это письмо. Это поможет нам распространить информацию!
Всегда разбирайтесь,
Команда D4S
Блог:
Вышел последний пост в подстеке Graphs for Data Science: Компоненты графа: сильно и слабо связанные компоненты. Вы должны Зарегистрироваться, чтобы не пропустить пост!
Последний пост из серии Причинно-следственная связь посвящен разделу 3.7 — Медиация, рецепту расчета контролируемого направленного эффекта. Код для каждого поста в блоге из этой серии размещен в специальном репозитории GitHub: https://github.com/DataForScience/Causality
В последнем посте из серии CoVID-19 Конкурирующие штаммы CoVID-19 рассматривается вероятное влияние, которое может оказать появление более вирулентного штамма в ходе пандемии. Как обычно, весь код доступен на GitHub: http://github.com/DataForScience/Epidemiology101
Книга по науке о данных:
На этой неделе книга по науке о данных называется Анализ данных: байесовский учебник Д. С. Сивии и Дж. Скиллинга. Байесовский анализ — это статистический подход с долгой и богатой историей, который позволяет нам использовать вероятностные утверждения для количественной оценки нашей неопределенности в отношении конкретных параметров. Эта короткая книга представляет собой отличное первое введение в это мощное семейство техник с практическими примерами. Книга быстро уводит нас от фундаментальной интуиции, лежащей в основе теоремы Байеса, к более продвинутым концепциям и приложениям, таким как сравнение моделей, вывод и непараметрическая оценка.
Лучшие ссылки:
Учебники и сообщения в блогах, которые попались нам на стол на этой неделе.
- Мозг отображает идеи и воспоминания как пространства [quantamagazine.org]
- Microsoft закрывает свою службу Azure Blockchain [zdnet.com]
- Построение новой векторной модели хранения данных [questdb.slab.com]
- Современная денежная теория, объяснение [vox.com]
- Рекурсия в Python: введение [realpython.com]
- Clustergam: визуализация кластерного анализа [martinfleischmann.net]
- Как работает поиск картинок в Dropbox [dropbox.tech]
- Наборы данных на arXiv [medium.com/paperswithcode]
- Десять лучших советов и рекомендаций по Git [honeybadger.io]
- Извлечение данных из устройств слежения [jeffhuang.com]
Только что из прессы:
Некоторые из самых интересных научных статей, опубликованных за последнее время
- Глобальная база данных прививок от COVID-19 (Э. Матье, Х. Ричи, Э. Ортис-Оспина, М. Розер, Дж. Хаселл, К. Аппель, К. Джаттино, Л. Родес-Гирао)
- Прогнозирование новых научных коллабораций через мультиплексные сети (М. Тунинетти, А. Алета, Д. Паолотти, Ю. Морено, М. Старнини)
- Ландшафт согласованности сетевых сообществ (Д. Ли, С. Х. Ли, Б. Дж. Ким, Х. Ким)
- Геометрическое глубокое обучение: сетки, группы, графы, геодезические и калибры (М. М. Бронштейн, Дж. Бруна, Т. Коэн, П. Величкович)
- Дистанционная магистраль сложных сетей (Т. Симас, Р. Б. Коррейя, Л. М. Роша)
- Улучшение способности моделирования последовательности рекуррентных нейронных сетей с помощью семем (Ю. Цинь, Ф. Ци, С. Оуян, З. Лю, К. Ян, Ю. Ван, К. Лю, М. Сунь)
- Обнаружение сообществ на основе потоков в гиперграфах (А. Эрикссон, Т. Карлетти, Р. Ламбиотт, А. Рохас, М. Росвалл)
- Обзор подходов к увеличению данных для НЛП (С. Ю. Фэн, В. Гангал, Дж. Вей, С. Чандар, С. Восуги, Т. Митамура, Э. Хови)
Видео недели:
Интересные обсуждения, идеи или учебные пособия, которые попадались нам на стол.
Прошлое, настоящее и будущее геометрического глубокого обучения
Все видео недели теперь доступны в нашем плейлисте Youtube.
Предстоящие События
Возможности учиться у нас:
- 9 июня 2021 г. — Обработка естественного языка (НЛП) для всех [Регистрация]
- 25 июня 2021 г. — НЛП с глубоким обучением для всех [Регистрация]
- 9 июля 2021 г. — Прикладная теория вероятностей для всех [Регистрация] 🆕
- 26 июля 2021 г. — Преобразование анализа Excel в модели данных Python и pandas [Регистрация] 🆕
Благодарим вас за подписку на нашу еженедельную рассылку с кратким обзором мира наук о данных и машинного обучения. Пожалуйста, поделитесь своими контактами, чтобы помочь нам расти!
Публикуется в воскресенье.
Авторские права © Data For Science, Inc., 2021. Все права защищены.