В этом блоге я планирую рассказать о своем плане проекта для Google Summer of Code, 2019.

Немного о себе

Прежде чем я начну свой путь к участию в Google Summer of Code — 2019 с Pharo Consortium, я начну с краткого введения о себе. Меня зовут Нихил Пиннапараджу, и в настоящее время я учусь на третьем курсе Международного института информационных технологий, Хайдарабад, Индия (IIIT-H).

Я получаю двойную степень бакалавра технологий в области компьютерных наук и магистра компьютерной лингвистики путем исследований, известную как CLD. По сути, это означает, что мы многое узнаем о методах обработки языка. И поэтому моя основная область знаний — обработка естественного языка и поиск информации на основе текста.

Что такое Google Summer of Code?

Google Summer of Code — это трехмесячная программа, направленная на популяризацию Open Source Development по всему миру. Google Summer of Code, обычно называемый GSoC, — очень популярная программа и мечта многих студентов по всему миру. GSoC предоставляет прекрасную платформу для работы с фантастическими организациями и людьми по всему миру и является поистине бесценной возможностью для любого студента.

Это помогает студенту отточить так много навыков — не только программирование, но и общение, презентация, планирование, дизайн и это лишь некоторые из них.

Есть несколько действительно отличных блогов о том, как подготовиться и подать заявку на GSoC, некоторые из которых я приведу ниже:

  1. https://medium.com/@i.oleks/how-to-apply-for-google-summer-of-code-95c1bfcd41a5
  2. https://medium.com/coding-blocks/one-stop-guide-to-google-summer-of-code-a9e803beeda7

Принятие в GSoC

Две вещи, которые я хотел бы упомянуть как решающие для моего принятия, по моему мнению:

  1. Искренний интерес к моему проекту.
  2. Регулярный контакт и руководство от моих наставников.

Без любой из этих двух вещей, я не думаю, что я был бы здесь, пишу этот блог сегодня.

Для моего проекта GSoC я буду создавать библиотеку обработки естественного языка для Pharo. Библиотека нацелена на предоставление ключевых функций, таких как токенизация, стемминг, N-граммы, векторизация TF-IDF и многое другое. Вы можете найти мое подробное проектное предложение здесь — https://docs.google.com/document/d/1vsO5xpJ-ZXQhiYPwlsQpaXjRife7Nrfi6ZdA5if3vWw/edit?usp=sharing.

Я буду загружать блог каждую неделю, рассказывая о своих попытках реализации, почему что-то работает, почему что-то нет, подробности реализации и тому подобное. Это первый пост о захватывающем лете передо мной. Чтобы не пропустить новые блоги, подписывайтесь на меня в Твиттере (https://twitter.com/NPinnaparaju) или на Medium здесь.