ВЫПУСК №85
Воскресный брифинг D4S №85
Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.
10 января 2021 г.
Дорогие друзья,
Добро пожаловать в 85-й выпуск воскресного брифинга.
На этой неделе мы продолжаем наш перерыв в блогах о причинно-следственных связях и моделировании эпидемий. А пока вы можете ознакомиться с серией причинно-следственных связей с нашей последней публикацией, подробно описывающей обратное вероятностное взвешивание как метод, облегчающий расчет эффектов вмешательств. Как обычно, не забудьте проверить репозиторий Causality на GitHub. Вы также можете ознакомиться с серией Эпидемиология в нашем недавнем посте CoVID-19: прогнозирование числа погибших и коде в разделе Эпидемиология на GitHub.
Мы также с гордостью объявляем о нашем новом проекте Graphs for Science, подмножестве графических и сетевых приложений для Data Science. Это будет параллельно с нашим обычным ведением блога на Medium и этой рассылкой. Первый пост уже вышел: Графовые алгоритмы для науки о данных. Мы будем анонсировать здесь новые публикации, но вам следует зарегистрироваться, чтобы не пропустить ни одной публикации! Большинство сообщений будут общедоступными, а несколько более длинных и подробных будут доступны только платным подписчикам.
Январь посвящен НЛП, впереди два вебинара. Первым в ближайшую пятницу, 15 января, станет Обработка естественного языка (НЛП) для всех, за которым последует НЛП с глубоким обучением для всех 27 января. У обоих еще есть несколько свободных мест, так что зарегистрируйтесь прямо сейчас!
На этой неделе у нас есть краткая биография Дональда Кнута, одного из крестных отцов компьютерных наук, и эссе на тему Стать великим ученым. У нас также есть обзор последних разработок Графиков знаний в НЛП, представленных на EMNLP 2020, и Справочник, который поможет вам научиться распознавать и преодолевать теории заговора.
На академическом фронте у нас есть всеобъемлющий Атлас для начинающих сетевых ученых, документ Использование данных Fitbit для изучения факторов, влияющих на уровень повседневной активности студентов колледжа и обзор Алгоритмы для изучения графиков на финансовых рынках. .
Наконец, на этой неделе у нас есть самая первая статья из Книги по науке о данных: Наука о данных для бизнеса Фостера Провоста и Тома Фосетта. В видео недели у нас есть введение в Получение данных OpenStreetMap с помощью OSMnx в Python.
Данные показывают, что лучший способ распространения информационного бюллетеня — это распространение из уст в уста, поэтому, если вы думаете, что кому-то из ваших друзей или коллег понравится этот информационный бюллетень, просто перешлите ему это письмо. Это поможет нам распространить информацию!
Всегда разбирайтесь,
Команда D4S
Блог:
Вышел первый пост в подстеке Graphs for Data Science: Graph Algorithms for Data Science. В этом посте мы расскажем о миссии подстека и некоторых темах, которые мы затронем. Вы должны вы должны Зарегистрироваться, чтобы убедиться, что вы никогда не пропустите сообщение!
Последний пост из серии Причинно-следственная связь посвящен разделу 3.6 — Обратное взвешивание вероятностей — рецепту расчета эффекта ковариатных стратифицированных вмешательств. Код для каждого поста в блоге из этой серии размещен в специальном репозитории GitHub: https://github.com/DataForScience/Causality
В последнем посте из серии CoVID-19 CoVID-19: прогнозирование числа погибших рассматривается влияние, которое структура нашей социальной сети может оказать на распространение эпидемии. Как обычно, весь код доступен на GitHub: http://github.com/DataForScience/Epidemiology101
Книга по науке о данных:
Наша самая первая книга по науке о данных — Наука о данных для бизнеса Фостера Провоста и Тома Фосетта. Эта книга отличается тем, что была первой книгой, которую я когда-либо читал, когда впервые начал интересоваться наукой о данных. Хотя он не погружается в стек программирования Data Science, Провост и Фосетт обладают даром помещать фундаментальные концепции и идеи Data Science в практический бизнес-контекст, что позволяет понять, когда следует применять каждый алгоритм и где его можно найти. отсутствует.
Лучшие ссылки:
Учебники и сообщения в блогах, которые попались нам на стол на этой неделе.
- Дональд Кнут: математик и мастер программирования [hindustantimes.com]
- Справочник по теории заговора [climatechangecommunication.org]
- Атака Капитолия не оправдывает расширение наблюдения [wired.com]
- Демоны науки, от Декарта до Дарвина и далее [newyorker.com]
- Э.О. Уилсон о том, как стать великим ученым [fs.blog]
- pytudes — программы на Python, обычно короткие, для совершенствования определенных навыков программирования [github.com/norvig]
- Графики знаний в НЛП @ EMNLP 2020 [mgalkin.medium.com]
Только что из прессы:
Некоторые из самых интересных научных статей, опубликованных за последнее время
- Ретроспективный анализ стратегии выхода Италии из карантина COVID-19 (В. Марциано, Г. Гузетта, Б. М. Рондиноне, Ф. Боккуни, Ф. Риккардо, А. Белла, П. Полетти, Ф. Трентини, П. Пеццотти , С. Брусаферро, Г. Резца, С. Явиколи, М. Аджелли, С. Мерлер)
- Сетевой анализ экспортных потоков стран: прочная основа для строительных блоков экономики (Дж. Кальдарелли, М. Кристелли, А. Габриэлли, Л. Пьетронеро, А. Скала, А. Такчелла)
- Атлас для начинающего сетевого ученого (М. Кошиа)
- Масштабирование реплицированных конечных автоматов с компартментализацией (М. Уиттакер, А. Айлицзян, А. Чарапко, М. Демирбас, Н. Гиридхаран, Дж. М. Хеллерштейн, Х. Ховард, И. Стойка, А. Секерес)
- Слова, описывающие чувства по поводу смерти: сравнение чувств к себе и другим и изменения во времени (Л. Р. Миллер-Льюис, Т. В. Льюис, Дж. Тиман, Д. Роулингс, Д. Паркер, Ч. Р. Сандерсон)
- Использование данных Fitbit для изучения факторов, влияющих на уровень повседневной активности студентов колледжей (К. Ван, О. Лизардо, Д. С. Хачен)
- Взаимодействующие процессы обнаружения в сложных сетях (И. Якопини, Г. Ди Бона, Э. Убальди, В. Лорето, В. Латора)
- Комбинаторный подход к процессам распространения в сетях (Д. Маццелли, Ф. Радиччи)
- Алгоритмы обучения графов на финансовых рынках (Дж. В. де Миранда Кардосо, Дж. Ин, Д. П. Паломар)
Видео недели:
Интересные обсуждения, идеи или учебные пособия, которые попадались нам на стол.
Получение данных OpenStreetMap с помощью OSMnx в Python
Все видео недели теперь доступны в нашем плейлисте Youtube.
Предстоящие События
Возможности учиться у нас:
- 15 января 2020 г. — Обработка естественного языка (НЛП) для всех [Регистрация]
- 27 января 2020 г. — НЛП с глубоким обучением для всех [Регистрация]
- 11.02.2020 — Прикладная теория вероятностей для всех [Регистрация] 🆕
- 25 февраля 2020 г. — Преобразование анализа Excel в модели данных Python и pandas [Регистрация] 🆕
Благодарим вас за подписку на нашу еженедельную рассылку с кратким обзором мира наук о данных и машинного обучения. Пожалуйста, поделитесь своими контактами, чтобы помочь нам расти!
Публикуется в воскресенье.
Авторские права © Data For Science, Inc., 2021. Все права защищены.