Конечно, может быть несколько исключений, но большинство из нас, кто работает с данными, делают это, чтобы дать людям возможность принимать правильные решения. Мы идем миллионами разных путей, чтобы достичь общей цели: лучше познать мир, по одной маленькой (или даже крошечной) полоске за раз. В серии статей Рамы Рамакришнана От предсказания к действию последовательность, которая ведет нас к действию, разбивается на иногда сложные компоненты; самый последний выпуск посвящен решающему этапу сборки правильного набора данных для проблемы, которую мы стремимся решить. (Пока вы здесь, вы могли бы также вернуться к Части 1.)
Определение правильных данных для просмотра, а затем создание процесса для извлечения из них практических идей - это суть работы Кейт Галло в качестве продуктового аналитика. Эта роль остается менее известной, чем некоторые из более распространенных описаний должностей, ориентированных на данные, и Кейт терпеливо знакомит нас с ее подробностями. Для нее продуктовый аналитик - это человек, который работает с несколькими партнерами в качестве защитника интересов пользователей: человек, чья роль состоит в том, чтобы убедиться, что пользователи получают удовольствие от продукта и получают от него ценность, и делать это посредством тщательного анализа тщательно отобранных продуктов. метрики.
В публикациях Рамы и Кейт тема достоверности данных рассматривается через призму бизнес-решений, но проблема понимания того, смотрим ли мы на правильные данные или нет, - достаточно ли у нас этого? Это надежно? Точно ли он представляет мир? - идет и глубже, и шире. Как пишет Эйдан Пеппин в своем первом посте TDS, процесс обеспечения измеримости наблюдаемых явлений требует множественных форм редукции - и неспособность учесть редуктивный характер данных является основной причиной многих алгоритмических вред и неудачи . Для Эйдана необходимы тщательный дизайн и внимание к выбору, который мы делаем на этом пути, если мы хотим избежать наихудшей из этих опасностей.
Есть так много способов наблюдать, собирать, представлять и использовать данные - если вы хотите изучить еще несколько направлений на этой неделе, мы вам поможем (как всегда!):
- Откройте для себя возможности моделирования структурными уравнениями. Лаура Кастро-Шило делится полезным и подробным введением в SEM и объясняет, почему этот подход стал фаворитом многих бихевиористов и социологов.
- Будьте в курсе последних исследований в области глубокого обучения. Роберт Ланге с долгожданным августовским выпуском рекомендаций академической статьи здесь! Этот документ полон сердечных чтений по темам, которые варьируются от Vision Transformers до тестов оптимизатора глубокого обучения.
- Узнайте о смене парадигм в AI. Недавние разговоры об искусственном интеллекте часто сводятся к простой бинарной системе, взаимодействующей между человеком и человеком. В последнем выпуске подкаста TDS Джереми Харрис и гостья Дивья Сиддарт исследуют другие идеи и приложения ИИ и рассматривают способы, которыми правительства могли бы сыграть положительную роль в следующей главе этой технологии.
Мы надеемся, что вам понравится чтение на этой неделе - спасибо за то, что вы проводите время с нами и нашей работой, и за то, что сделали все это возможным благодаря вашей поддержке.
До следующей переменной
Редакторы TDS
Последние добавления к нашим кураторским темам:
"Начиная"
- На что обращать внимание при масштабировании группы обработки данных от Шил Чокси
- Сила цвета в визуализации данных Мари Лефевр
- Рабочий стол GitHub для специалистов по данным, автор Дрю Сивальд
Практические руководства
- Полное руководство по созданию модели маркетингового микса в 2021 году от Теренс Шин
- 4 плагина предварительной фиксации для автоматизации проверки и форматирования кода в Python от Хуен Тран
- Создание поддельных данных с помощью Pandas, очень быстро, Хуан Луис Руис-Тагле
Глубокие погружения
- Thrill-K: план нового поколения машинного интеллекта Гади Сингер
- Прикладной байесовский вывод (часть 1) от Ани Мадуркар
- Раздел 7) Дифференциальная эволюция - автоматизированное машинное обучение Брэндон Морган