Наличие проекта по обработке естественного языка или НЛП в вашем портфолио Data Science выделяет ваше резюме. Но получение качественного набора данных может помешать вам. Ну, не больше.

Платформа микроблогов Twitter — отличный источник текстовых данных. В этом уроке мы обсудим, как вы можете настроить свою собственную учетную запись разработчика Twitter и API, которые позволят вам получать 2 миллиона твитов в месяц.

Вместо этого посмотрите обучающее видео

Если вы больше любите видео, посмотрите его на YouTube. К вашему сведению, каждую неделю мы запускаем новые проекты по машинному обучению. Поэтому не забудьте подписаться на наш канал, чтобы получить доступ ко всем нашим бесплатным курсам по машинному обучению.

Все файлы, связанные с проектом, хранятся на Google Диске. На этой ноте приступим.

Начало работы с Твиттером

Хорошо, наличие учетной записи Twitter является обязательным условием для начала работы. Итак, если у вас нет учетной записи, вы можете создать ее.

После того, как вы войдете в систему на twitter.com, я также предлагаю вам добавить номер телефона в свой профиль, так как вам все равно придется сделать это позже. Вы можете выполнить следующие действия:

  • На главной странице нажмите More ›› Setting & Privacy ›› My account
  • Возможно, вам потребуется указать пароль своей учетной записи здесь, чтобы получить доступ
  • Добавьте свой номер телефона (вам также может потребоваться предоставить код подтверждения, полученный на телефоне, так что будьте готовы к этому)

И это для начала..

Настройка Twitter Dev A/c

Следующим шагом является настройка учетной записи разработчика Twitter. Для этого перейдите на сайт developer.twitter.com (далее я буду называть его «Портал для разработчиков»). Вы автоматически войдете в Dev Portal. Если нет, войдите снова, используя свои учетные данные для входа в Твиттер. Здесь нажмите «Портал разработчика» в правом верхнем углу.

Здесь заполните необходимые данные. На вопрос «Какой у вас вариант использования?» скажите: Exploring the API. Нажмите «Далее», а затем вы можете ознакомиться с условиями и принять их. В качестве важного следующего шага вам может потребоваться подтвердить свою электронную почту.

После того, как вы завершите проверку электронной почты, следующим шагом будет дать имя вашему приложению Twitter. В нашем случае мы назвали его Skillcate_Project1. Помните, имя должно быть уникальным.

Затем вы видите ключи API на следующем экране. На данный момент нет необходимости сохранять эти ключи, так как мы собираемся восстановить их через некоторое время, как только у нас будет

  • Разблокированный повышенный доступ
  • Настроенный доступ для чтения и записи

Теперь давайте отсортируем их один за другим.

Разблокировка повышенного доступа

Перейдите на панель инструментов Dev Portal прямо сейчас. Если вы получите запрос на сохранение ключей API, просто скажите «Да, я их сохранил». На панели инструментов вы увидите Ежемесячное ограничение использования твитов как 500 000 твитов в месяц. Но вы можете исчерпать эту квоту, если регулярно работаете с Twitter API.

Итак, чтобы решить эту проблему, мы подадим заявку на повышенный доступ, который увеличит этот предел до 2 миллионов твитов в месяц. Для этого выполните следующие действия:

  • На панели инструментов нажмите «Проект 1». Затем нажмите «Применить».

  • Затем приступайте к заполнению деталей. При текущем уровне навыков кодирования вы можете выбрать соответствующий.
  • На следующей странице в разделе Предполагаемое использование вам нужно дать краткую информацию о вашем конкретном случае использования повышенного доступа. Например, это хорошая запись для варианта использования.

Выполняю проект НЛП, в котором я планирую провести анализ настроений в живых твитах по определенному ключевому слову. Для этого я буду получать твиты по определенной актуальной теме с помощью Python Tweepy, выполнять анализ настроений с помощью Python TextBlob, а затем визуализировать результаты с помощью Python Matplotlib.

  • На последний вопрос о предоставлении информации государственному органу вы должны сказать «нет», поскольку вы собираетесь использовать ее в учебных целях.
  • Затем перейдите к следующему и ближе к концу, вы можете прочитать и согласиться с условиями политики и нажать «Отправить».

К этому моменту вы должны были разблокировать доступ с повышенными правами. Поздравляем!!

Следующим шагом является настройка доступа для чтения и записи.

Настроить доступ для чтения/записи

Для этого перейдите в панель управления. В разделе «Проект 1» нажмите кнопку «Ключ».

Теперь для токена доступа и секрета давайте сгенерируем ключи. Опять же, не нужно сохранять на этом этапе. Просто скажите: «Да, я их спас». Причина, по которой мы не сохраняем этот токен и секрет, заключается в том, что по умолчанию предоставлен доступ только для чтения.

Но нам нужен доступ для чтения и записи, чтобы мы могли выполнять операции записи, например: публиковать твиты, удалять твиты, подписываться на кого-то, отписываться от кого-то, лайкать твит, ретвитить и т. д. Чтобы внести это изменение, выполните следующие действия:

  • Перейдите в «Настройки» (показано вверху справа на скриншоте выше).
  • В разделе «Настройки аутентификации пользователя» нажмите «Настройка».
  • Здесь оставьте OAuth 2.0 как есть. Выберите OAuth 1.0a
  • В разделе «Разрешения приложения» выберите «Чтение и запись».

  • Вы также можете выбрать Чтение, Написание и Прямые сообщения, которые также позволяют нам обмениваться сообщениями. Для этого вы можете ввести фиктивный веб-сайт. В моем случае я использовал свой сайт skillcate.com.

Щелкните Сохранить. И вы сделали!!

Генерация учетных данных приложения

Теперь переходим в Dashboard ›› Keys. И теперь мы все готовы сгенерировать наши ключи на этот раз и записать их. Ключи и токены Twitter являются вашими личными вещами и не должны передаваться никому. Это 5 учетных данных, которые вы должны получить. Обязательно запишите их.

Теперь мы успешно настроили наш Twitter API и получили ключи.

Проверка учетных данных Twitter API

Чтобы проверить свои учетные данные API, вы можете использовать этот блокнот Jupyter, хранящийся в папке Project Drive.

Использование Twitter через Tweepy

В следующем уроке я дам вам краткое пошаговое руководство по Tweepy Python для выполнения операций чтения и записи в Twitter через этот API, который мы настроили.

Проект НЛП с Twitter API

В качестве дополнения к этому руководству вы можете выполнить полный проект НЛП, выполнив Анализ настроений в живых твитах.

Кратко о Skillcate

В Skillcate мы стремимся предоставить вам обучение машинному обучению на основе приложений. Каждую неделю мы запускаем новые проекты по машинному обучению. Итак, не забудьте подписаться на наш канал на YouTube, а также нажать на значок колокольчика, чтобы получать уведомления, когда наши новые проекты машинного обучения выходят в эфир.

Скоро вернусь с новым проектом ML. А пока удачного обучения 🤗!!