Как узнать, достаточно ли у вас данных?

Конечно, может быть несколько исключений, но большинство из нас, кто работает с данными, делают это, чтобы дать людям возможность принимать правильные решения. Мы идем миллионами разных путей, чтобы достичь общей цели: лучше познать мир, по одной маленькой (или даже крошечной) полоске за раз. В серии статей Рамы Рамакришнана От предсказания к действию последовательность, которая ведет нас к действию, разбивается на иногда сложные компоненты; самый последний выпуск посвящен решающему этапу сборки правильного набора данных для проблемы, которую мы стремимся решить. (Пока вы здесь, вы могли бы также вернуться к Части 1.)

Определение правильных данных для просмотра, а затем создание процесса для извлечения из них практических идей - это суть работы Кейт Галло в качестве продуктового аналитика. Эта роль остается менее известной, чем некоторые из более распространенных описаний должностей, ориентированных на данные, и Кейт терпеливо знакомит нас с ее подробностями. Для нее продуктовый аналитик - это человек, который работает с несколькими партнерами в качестве защитника интересов пользователей: человек, чья роль состоит в том, чтобы убедиться, что пользователи получают удовольствие от продукта и получают от него ценность, и делать это посредством тщательного анализа тщательно отобранных продуктов. метрики.

В публикациях Рамы и Кейт тема достоверности данных рассматривается через призму бизнес-решений, но проблема понимания того, смотрим ли мы на правильные данные или нет, - достаточно ли у нас этого? Это надежно? Точно ли он представляет мир? - идет и глубже, и шире. Как пишет Эйдан Пеппин в своем первом посте TDS, процесс обеспечения измеримости наблюдаемых явлений требует множественных форм редукции - и неспособность учесть редуктивный характер данных является основной причиной многих алгоритмических вред и неудачи . Для Эйдана необходимы тщательный дизайн и внимание к выбору, который мы делаем на этом пути, если мы хотим избежать наихудшей из этих опасностей.

Есть так много способов наблюдать, собирать, представлять и использовать данные - если вы хотите изучить еще несколько направлений на этой неделе, мы вам поможем (как всегда!):

Откройте для себя возможности моделирования структурными уравнениями. Лаура Кастро-Шило делится полезным и подробным введением в SEM и объясняет, почему этот подход стал фаворитом многих бихевиористов и социологов.
Будьте в курсе последних исследований в области глубокого обучения. Роберт Ланге с долгожданным августовским выпуском рекомендаций академической статьи здесь! Этот документ полон сердечных чтений по темам, которые варьируются от Vision Transformers до тестов оптимизатора глубокого обучения.
Узнайте о смене парадигм в AI. Недавние разговоры об искусственном интеллекте часто сводятся к простой бинарной системе, взаимодействующей между человеком и человеком. В последнем выпуске подкаста TDS Джереми Харрис и гостья Дивья Сиддарт исследуют другие идеи и приложения ИИ и рассматривают способы, которыми правительства могли бы сыграть положительную роль в следующей главе этой технологии.

Мы надеемся, что вам понравится чтение на этой неделе - спасибо за то, что вы проводите время с нами и нашей работой, и за то, что сделали все это возможным благодаря вашей поддержке.

До следующей переменной
Редакторы TDS

Как узнать, достаточно ли у вас данных?

Последние добавления к нашим кураторским темам:

"Начиная"

Практические руководства

Глубокие погружения

Мысли и теория

Как узнать, достаточно ли у вас данных?

Последние добавления к нашим кураторским темам:

"Начиная"

Практические руководства

Глубокие погружения

Мысли и теория

Вопросы по теме