Когда данные не лгут

Данные не лгут, но иногда правда ранит. Когда вы получаете машину для изучения данных и использования ее для построения шаблонов и аналитических моделей, вы достигнете того, что теперь называется машинным обучением. Поскольку эти данные поступают в реальном времени и обычно не обрабатываются, результаты этих моделей в большинстве случаев говорят вам правду.

Но, как и все, что создано руками человека, эти алгоритмы имеют предвзятость, что делает их сомнительными. Они настолько хорошо умеют предсказывать, что могут видеть больше, чем кажется на первый взгляд.

Бывали случаи, когда машинное обучение было настолько хорошим, что было плохо.

Google Поиск против Дональда Трампа

В декабре 2018 года Сундар Пичаи был вынужден ответить в Сенат, почему поиск по слову «Идиот» вытащил изображения президента США. Многие считали, что это была попытка политического манипулирования результатами, но это всего лишь ML, делающий свою работу.

Результаты поиска Google сортируются по различным факторам, таким как релевантность, популярность и актуальность. Поэтому, когда случилось так, что эти два слова использовались вместе слишком часто, стало неизбежно, что эти слова связаны между собой.

Насколько хороша эта корреляция? Это вам судить

2. Когда TARGET показывал целевые объявления о беременности

В 2012 году New York Times опубликовала статью под заголовком Как компании узнают ваши секреты. В ней рассказывается о родителе, который противостоит выпуску Target из-за того, что отправил свою дочь, которая тогда была в Высшей школе. Школа, купоны на детские товары. Мужчине показалось, что они поощряют ее дочь забеременеть. В статье утверждалось, что статистик Эндрю Поул разработал алгоритм, который может предсказать, беременны ли вы, на основе продуктов, которые вы покупаете.

Через неделю, когда менеджер позвонил и извинился за ошибку, выяснилось, что дочь мужчины действительно беременна.

С тех пор, как был опубликован отчет, появилось много заявлений о том, правдива ли следующая история, но с этого начался разговор о том, как данные и алгоритмы могут заглядывать в нашу жизнь и как мы можем подвергаться персонализированной рекламе.

3. Таргетированная реклама в Instagram

Каждый раз, когда вы на собеседовании или встречаетесь с кем-то новым, в разговоре возникает вопрос: «Итак, каковы ваши интересы, хобби?» или какой-то другой вопрос. Если вы чем-то похожи на меня, это именно тот момент, когда вы понятия не имеете, какие у вас интересы. Что ж, Instagram вас поддержит.

Это занятие обязательно нужно попробовать, когда у вас есть свободное время. В приложении Instagram перейдите к следующим параметрам: Настройки ›Безопасность› Данные доступа ›Реклама.

Он показывает вам список ваших интересов, основанный на том, какие объявления и контент нацелены на вас. Данные собираются с платформ Instagram и Facebook и сторонних приложений.

Так что в следующий раз просто держите под рукой несколько слов из них.

4. Facebook - Cambridge Analytica

Facebook - Cambridge Analytica была одним из крупнейших скандалов, связанных со сбором данных, который продемонстрировал важность конфиденциальности и защиты данных.

Cambridge Analytica создала приложение, которое побуждало людей проходить онлайн-тест.
Почти 300 000 человек прошли онлайн-психологический тест и получили за него деньги. Это позволило компании собирать их данные вместе с данными людей из их круга друзей в Facebook.

Эти данные использовались для создания психографических профилей, с помощью которых показывалась реклама для голосования.

Люди были разделены на две группы.

Люди, которые поддержали определенного кандидата,
Люди, которые были на заборе

Последнюю группу людей преследовали в основном потому, что так легче поднять голоса.

К концу Cambridge Analytica собрала данные почти о 87 миллионах пользователей. Ключевым аспектом этого является тот факт, что данные почти 87 миллионов человек были собраны без согласия и использовались, чтобы повлиять на выборы в демократической стране.

Мы живем в мире, где невозможно не быть связанным. Все происходит в Интернете. Все, что вы делаете в Интернете, отслеживается, анализируется и используется для лучшего понимания вас, как ваш сосед, которому просто нужно знать, что происходит в вашей жизни. То, о чем вы не обязательно рассказываете своим друзьям и семье, можно понять на основе результатов поиска. Так что иногда Интернет может просто понимать вас лучше, чем ваших друзей. Так что в следующий раз, когда вы будете что-то искать, скорее всего, агент ФБР будет следить за тем, что вы делаете ... Просто он всего лишь алгоритм.

Когда данные не лгут

Вопросы по теме