Лучшие темы Твиттера от специалистов по данным № 14

В тренде на этой неделе: важность интерпретируемого человеком машинного обучения; Почему ML борется с причинно-следственными связями; 141 прогноз кибербезопасности; Полное руководство по успешному прохождению собеседований по программированию для специалистов по данным!

Каждую неделю мы анализируем самые обсуждаемые темы в Твиттере от влиятельных лиц в области науки о данных и искусственного интеллекта.

Следующие темы, URL-адреса, ресурсы и твиты были автоматически извлечены с использованием метода моделирования тем, основанного на Sentence BERT, который мы улучшили, чтобы он соответствовал нашему варианту использования.

Хотите узнать больше об используемой методологии? Перейдите к этой статье для получения более подробной информации и найдите коды в этом репозитории Github!

Обзор

На этой неделе влиятельные лица Data Science и AI в Твиттере говорили о:

Новые проблемы машинного обучения
Обновления KDnuggets
Информационная безопасность

В следующих разделах представлены все подробности по каждой теме.

Новые проблемы машинного обучения

На этой неделе влиятельные лица говорили об актуальных темах, связанных с машинным обучением и его использованием. В частности, они сосредоточились на понимании того, как машинное обучение может служить людям и компаниям, как работают модели машинного обучения и как использовать его безопасным способом.

Андреас Штауб поделился документом (магистерская диссертация) под названием На пути к полезному машинному обучению, в котором рассматриваются проблемы удобства использования машинного обучения, присутствующие в нетехнических областях с высокими ставками, посредством тематического исследования в области скрининга благополучия детей. Он фокусируется на четырех ключевых проблемах юзабилити ML и оттачивает один многообещающий инструмент расширения ML для их решения.

Он также поделился замечательной статьей о Важности человеческого интерпретируемого машинного обучения, первой из серии из четырех статей, посвященных той же теме. В этом посте дается исчерпывающее объяснение интерпретируемого машинного обучения: мотивация, зачем его понимать, насколько это важно, какие критерии учитывать для интерпретации модели и какую область интерпретации следует учитывать (глобальную или локальную?).

Наконец, Ipfconline поделился постом о Федеративном обучении, децентрализованной форме машинного обучения. В нем объясняется, как использование федеративного обучения помогает решать проблемы конфиденциальности, поскольку оно позволяет обучать алгоритмы на устройствах, распределенных по сети, без необходимости передачи данных с каждого устройства. Затем в этой статье также подробно описаны пять этапов федеративного обучения, а также связанные с ним преимущества и проблемы. В нем представлены некоторые хорошо известные примеры использования, в которых уже используется федеративное обучение.

Обновления KDnuggets

На этой неделе KDnuggets поделился несколькими свежими статьями, охватывающими различные темы, от подходов к машинному обучению до удивительных советов по программированию.

Во-первых, они поделились постом, объясняющим, почему машинное обучение борется с причинно-следственными связями. В частности, в нем говорится о фактических ограничениях подходов к машинному обучению, которые ответственны за отсутствие причинно-следственных представлений в моделях машинного обучения. Затем в этом посте представлены некоторые направления, которые исследователи изучают для добавления причинно-следственной связи в машинное обучение. Одним из них является объединение механизмов машинного обучения и структурных причинно-следственных моделей. Исследователи говорят, что сочетание причинно-следственных графов с машинным обучением позволит агентам ИИ создавать модули, которые можно применять к различным задачам без особого обучения.

На ту же тему причинно-следственных связей они также поделились статьей, которую они считают Должен знать для ученых и аналитиков данных: шаблоны причинно-следственного проектирования. Этот пост посвящен наблюдательному причинно-следственному выводу. Основное внимание уделяется его использованию в розничной торговле. Чтобы проиллюстрировать возможные применения, в посте представлен краткий обзор различных методов причинно-следственного вывода, таких как стратификация, взвешивание показателей склонности, разрыв регрессии и разница в различиях, с мотивирующими примерами из потребительской розничной торговли.

Наконец, они публикуют пост, который они называют Полное руководство по собеседованиям по коду для специалистов по данным, в котором рассматривается понимание 4 типов вопросов на собеседованиях по кодированию и эффективная подготовка к ним. В этом посте объясняется, почему вопросы по кодированию задаются во время интервью с учеными данных, для каких ролей, в частности, и предоставляется очень точная информация о четырех категориях интервью по кодированию и их содержании.

Информационная безопасность

На этой неделе многие влиятельные лица в области науки о данных одобрили различные обновления в области кибербезопасности.

Тамара Макклири поделилась статьей о том, как Международная киберконвенция станет будущим кибербезопасности. Она также поделилась двумя действительно интересными материалами о U.S. Система предупреждения о кибербезопасности и Борьба за власть в сфере кибербезопасности в США.

Андреас Штауб поделился со своими подписчиками 141 прогнозом кибербезопасности, опубликованным Forbes.
В статье говорится о роли новых технологий (ИИ, машинное обучение, 5G, квантовые вычисления) и развивающихся технологий (IoT, мобильные — в том числе автономные транспортные средства, облако) будут играть роль в повышении эффективности и результативности, широты и глубины кибератак. Хотя статья немного устарела, но она полностью по делу.

Ipfconline поделился со своими подписчиками тем, что кибербезопасности нужна API-first Revolution. Наряду со статьей, объясняющей что такое DevSecOps и ее важность. И, наконец, Рональд ван Лун поделился статьей 4 Ключевые соображения для последовательного управления и безопасности IoT.

Лучшие темы Твиттера от специалистов по данным № 14

Обзор

Новые проблемы машинного обучения

Обновления KDnuggets

Информационная безопасность

Вопросы по теме