Воскресный брифинг D4S № 196

Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.​​​​​​​​​​​​

26 марта 2023 г.

Дорогие друзья!

Добро пожаловать на воскресный брифинг от 26 марта. На этой неделе у нас перерыв в ведении блога. Пока мы работаем над нашим следующим постом, вы можете наверстать упущенное в последнем посте из серии Viz4Sci: Диаграмма водопада. Последний пост Среднего 10 лучших книг, которые мы прочитали в 2022 году и самый свежий пост из серии G4Sci: Сетевые атаки: Взлом сети без полного наблюдения за ней.

В последние недели некоторые из вас обратились к нам с вопросом, как они могут помочь в работе, которую мы делаем здесь, в Data For Science. Несмотря на то, что воскресный брифинг — это труд любви, и он всегда останется бесплатным, он не обходится без затрат, и любая помощь приветствуется.

Если вы хотите поддержать нашу работу, есть несколько вариантов:

  1. Платная подписка на Графики для науки или Визуализация для науки, которая дает вам полный доступ к архиву предыдущих сообщений.
  2. Подпишитесь на Medium по нашей реферальной ссылке без дополнительной оплаты для вас
  3. Напрямую через разовое пожертвование PayPal.

Не забывайте, что у нас есть самый первый выпуск вебинара Интерактивная визуализация данных с помощью Python, который выйдет менее чем через 24 часа, но еще есть время Зарегистрироваться, чтобы не пропустить все, что вам нужно знать о создание интерактивных визуализаций для ваших данных с использованием matplotlib, bokeh и plotly.

В нашем регулярно запланированном контенте мы узнаем, как создать семантический поисковик с помощью OpenAI и Pinecone, как запустить более 100 миллиардов языковых моделей дома в стиле BitTorrent и изучить Руководство для начинающих по синтетическим данным.

На академическом фронте мы погружаемся в сильную связность в реальных направленных сетях, манифест применения науки о поведении и Коррелированную динамику воздействия в науке.

Книга по науке о данных на этой неделе — Рекурсивная книга рекурсии Эла Свейгарта. Как всегда, вы можете найти все рекомендации предыдущих книг на нашем веб-сайте. В видео недели у нас есть учебник, который научит вас Как создать GPT: с нуля, в коде, прописано.

Данные показывают, что лучший способ распространения информационного бюллетеня — это распространение из уст в уста, поэтому, если вы думаете, что кому-то из ваших друзей или коллег понравится этот информационный бюллетень, просто перешлите ему это письмо. Это поможет нам распространить информацию!

Всегда разбирайтесь,

Команда D4S

Книга по науке о данных на этой неделе — Рекурсивная книга рекурсии Эла Свейгарта, очень рекомендуемая книга для программистов всех уровней. Книга объясняет рекурсию ясным и доступным способом. Он начинается с закладки важной основы и объясняет функции, их работу и особенности. Автор тратит значительное время на объяснение стека вызовов, его функций, структуры и работы, что приводит к обсуждению переполнения стека — одного из рисков использования рекурсии. Затем он посвящает целую главу сравнению рекурсии и итерации, демонстрируя, что в подавляющем большинстве случаев рекурсивные функции не нужны и в некоторых случаях работают хуже, чем их итерационные аналоги.

Тем не менее, книга также показывает, где рекурсия на самом деле является хорошей идеей, а где она подходит. Свейгарт исследует обход древовидных структур и демонстрирует, как мемоизация может повысить эффективность некоторых рекурсивных функций. Книга заканчивается несколькими проектами, основанными на концепциях, появившихся ранее, включая эффект Дросте, метод рекурсивного искусства, который создает подобное рекурсивное изображение из любой фотографии или рисунка с использованием изображений.

В целом, Recursive Book of Recursion отлично подходит как для начинающих, так и для программистов среднего уровня. Книга учит о рекурсии и побуждает читателя думать по-другому, уверенно показывая, что, казалось бы, возвышенные концепции находятся в пределах досягаемости.

Учебники и сообщения в блогах, которые попались нам на стол на этой неделе.

  1. Создание семантической поисковой системы с помощью OpenAI и Pinecone [sigmoidprime.com]
  2. Запускайте более 100 миллиардов языковых моделей дома в стиле BitTorrent [petals.ml]
  3. Джин убегает: Стэнфорд копирует ChatGPT AI менее чем за 600 долларов [newatlas.com]
  4. Непредсказуемые способности больших моделей ИИ [quantamagazine.org]
  5. Использование сегментации временных рядов и машинного обучения для повышения точности прогнозирования [odsc.medium.com]
  6. Руководство по синтетическим данным для начинающих [pub.towardsai.net]
  7. Рецепт катастрофы: формула, которая убила Уолл-Стрит [wired.com]

Некоторые из самых интересных научных статей, опубликованных за последнее время

Давайте создадим GPT: с нуля, в коде, по буквам

Все видео недели теперь доступны в нашем плейлисте Youtube.

Предстоящие События

Возможности учиться у нас:

  1. 28 марта 2023 г. — Интерактивная визуализация данных с помощью Python 🆕 [Регистрация]
  2. 11.04.2023 — Таймсерия для всех 🆕 [Регистрация]

Видео по запросу

Подробные руководства:

  1. Обработка естественного языка 5,5 часов, охватывающая базовые и продвинутые техники с использованием NLTK и Keras.
  2. Анализ временных рядов для всех 6 часов, охватывающий предварительную обработку данных, визуализацию, модели ARIMA, ARCH и глубокого обучения.

Благодарим вас за подписку на нашу еженедельную рассылку с кратким обзором мира наук о данных и машинного обучения. Пожалуйста, поделитесь своими контактами, чтобы помочь нам расти!

Публикуется в воскресенье.​

Читайте все истории на Medium и помогите поддержать мою работу, подписавшись по моей ссылке: https://bgoncalves.medium.com/membership.