Начните с твитов пользователя Tweeter и посмотрите, что вы можете расшифровать.

В прошлом я начинал с статей, которые читал, а затем применял их метод определения различных демографических и психографических характеристик ко всем твитам. Мой новый подход заключается в том, чтобы взять набор твитов от человека и понять, что я могу узнать об этом человеке из его твитов.

Возможными могут быть возраст, пол, возможно, вы тролль или бот и т. д.

Первая идея состоит в том, чтобы составить список из пятисот твитов и взять за основу для следующего шага все твитеры, у которых более 100 твитов. Следующим шагом является сбор твитов для всех твитеров, чтобы проанализировать их с точки зрения демографии или психографии. График выше является результатом поиска лучших пользователей в моем первом списке из 500 твиттеров, у которых в истории более 100 твитов. Я начинаю это как серию, в которой я буду постепенно пытаться узнавать все больше и больше о пользователе. Первая функция будет пытаться определить возраст человека, используя известный набор данных и технику машинного обучения. Посмотрите видео, чтобы узнать, как это работает: https://www.youtube.com/watch?v=JNiDksVwJNk&t=186s