Если вы занимаетесь машинным обучением или только начинаете им заниматься, вы знаете, что в какой-то момент вам придется что-то кодировать. И чаще всего мне попадались Jupyter Notebooks и Google Colaboratory (colab). Оба являются фантастическими вариантами, но они основаны на браузере. У них есть свои удобства, не поймите меня неправильно, они отлично подходят для курсов и работы с отдельными ячейками, но часто вам нужно быть активным в этом окне. Много раз мне приходилось уходить, а когда я возвращался, мне приходилось снова запускать все предыдущие ячейки, чтобы продолжить проект. Это кажется небольшой проблемой, но если вы работаете над проектом, который должен обрабатывать много данных, это может занять много времени.

Я хотел более простое локальное решение. Мне нравится использовать PyCharm IDE. Работа над проектами локально сослужила мне хорошую службу, и если я действительно хочу, я могу подключить проект к частному репозиторию на GitHub в качестве резервной копии. Таким образом, я получаю скорость и убеждаюсь в том, что работаю на своем локальном компьютере, а также гарантирую, что моя текущая работа также сохраняется, и мне не приходится иметь дело с истечением времени сеанса моего браузера. Любить это. Вот что я сделал.

Создайте локальный интерпретатор.

Создайте новый проект, я назвал свой «Тест». При запуске нового проекта вам придется выбрать более старый интерпретатор, так что давайте пока просто сделаем это. Нажмите кнопку «Создать».

В правом нижнем углу нажмите «Текущий интерпретатор», и вы должны увидеть опцию «Настройки интерпретатора», щелкните ее.

Нажмите «Добавить переводчика» и «Добавить локального переводчика». Убедитесь, что выбран «Новый». Дайте ему имя, я назвал свой «The_ML_Lab», и да, у вас все еще может быть старый интерпретатор в качестве «базы», ​​или если у вас есть другая версия, которую вы хотите использовать, вы можете выбрать ее там. Нажмите «ОК».

Настройте свой новый переводчик.

Теперь вы окажетесь в новой области, где мы можем настроить новый интерпретатор.

Нажмите кнопку «Плюс» (+), чтобы открыть еще одно окно. Теперь приступайте к установке некоторых основных библиотек машинного обучения, которые вам понадобятся для вашего будущего проекта. Для моего проекта мне нужны «scikit-learn» (sklearn), «pandas», «catboost» и «upgini». Другими часто используемыми библиотеками являются «numpy» и «matplotlib», поэтому не стесняйтесь устанавливать их, если хотите.

Применить, ок.

После того, как вы установили все основные пакеты, которые вам нужны, обязательно нажмите «Применить», затем «ОК». Теперь в любое время, когда вы работаете над проектом машинного обучения, вы можете просто выбрать этот интерпретатор из своего списка (внизу справа), и в нем будут предустановлены эти пакеты. По мере того, как ваше путешествие по машинному обучению продолжается, вы можете установить больше пакетов или создать другие для конкретного проекта.

Другие варианты.

Я фанат DIY, поэтому мне нравится создавать что-то самому, поэтому я пошел по этому пути. Но есть и другие варианты. Установка «Конда или МиниКонда» — это тоже путь. Он может создавать для вас виртуальные среды, в которых установлены многие из этих пакетов, я полагаю, что они все еще используют ноутбуки Jupyter.

Если вам нравится визуальная структура, которую предоставляет PyCharm, есть Spyder IDE, которая была специально создана для науки о данных и является бесплатной. Это также поставляется с предустановленными пакетами. У JetBrains, создателей PyCharm, также есть IDE Data Science IDE под названием DataSpell, но вам придется заплатить за нее.

Какой бы путь вы ни выбрали, я надеюсь, что ваше путешествие будет захватывающим.
Кодируйте крутые вещи.
Эш, Машинообучающийся.