Вещи, которые я хотел бы, чтобы кто-то сказал мне, прежде чем учиться на собственном горьком опыте.

В компьютерных науках есть вещи, которым можно научиться довольно быстро. Как нет, Келли Роуленд, вы не можете отправить текстовое сообщение из электронной таблицы Microsoft Excel.

Когда я впервые вошел в таинственный и удивительный мир компьютерных наук, я должен признать, что был довольно потерян. Между работой из командной строки (давайте будем честными, изучением того, что вообще такое командная строка), выяснением пути к файлу и устранением обычных ошибок кодирования, которые приводят к часам дыхательных упражнений, чтобы перестать рвать на себе волосы *трясет luscious dreads*, я решил поделиться с другими своей средней мудростью.

1. У вас есть кодовая ошибка, которую вы не можете понять? Прежде чем перейти к Stack Overflow и просмотреть результаты, проверьте правильность написания каждого элемента в строке кода. Вы будете удивлены, узнав, сколько ошибок связано с орфографическими ошибками.

2. В следующий раз, когда вы будете запускать большой проект или проект по машинному обучению, искусственному интеллекту или глубокому обучению и захотите увеличить скорость своей программы, подключите свой ноутбук к источнику питания. Правильно: подключите компьютер к сети. Многие ноутбуки работают на полную мощность только при подключении к сети. Это связано с возможностью экономии заряда батареи. Вы можете обойти это, удалив все параметры экономии заряда батареи, но я бы не советовал этого — просто подключите этот ноутбук и получите полную мощность вашего ноутбука.

3. Прежде чем использовать алгоритм или создавать сложную функцию, спросите себя, действительно ли это необходимо. Часто в пакете есть готовая функция или простая строка кода, которую можно развернуть вместо нее и которая может привести к такому же или лучшему результату. Не все требует модели, чтобы найти решение.

4. Я, скорее всего, буду возражать против этого, но поверьте мне: визуализируйте свои данные ПРЕЖДЕ, чем вы начнете делать выводы и проводить анализ. Вы не поверите, сколько раз ПОСЛЕ работы с набором данных в течение ЧАСОВ я понимал, что имеющиеся у меня данные не могут ответить на вопросы, на которые я хотел ответить, особенно в случаях с несбалансированными и беспорядочными данными. Всего этого можно избежать с помощью визуализации. Визуализация данных творит чудеса как часть процесса очистки данных.

5. На некоторые из ваших самых сложных ответов лучше всего ответить в Excel. Я знаю, я знаю, как Data Scientist я должен презирать Excel и говорить, что SQL лучше в любой ситуации (в большинстве случаев это так). Хотите получить имя самого старого или самого молодого человека в данных? Хотите знать, когда была совершена последняя транзакция? Функции min и max в Excel здесь прекрасно работают.

6. Это подводит меня ко второму по значимости уроку: Будь проще, глупец. Принцип KISS должен быть мантрой, которую вы используете в каждой написанной вами строке кода. Как пела великая Лорин Хилл: «Все может быть так просто, но вы бы предпочли все усложнить». Не усложняйте кодирование, чем оно должно быть. Не надо. — Брайсон Тиллер

7. Итак, какой первый самый важный урок, спросите вы? Ну, это просто — сформулируйте свою историю данных вокруг проблемы, которую необходимо решить. У меня был разговор с мудрым человеком, который сказал: «Не давайте мне рекомендаций, не объяснив аудитории, почему их это должно волновать». Если вы работаете над большим и инновационным проектом со множеством решений, но не выявили и не сообщили о проблеме, которую он пытается решить, люди потеряют интерес, и вам будет трудно понять, что ваш проект жизнеспособный. Сосредоточьтесь на существующей проблеме, а затем избавьтесь от нее.

Это всего лишь несколько глупых, но ценных профессиональных советов, которые я усвоил в области компьютерных наук. Я что-то пропустил? Поделитесь своими мыслями в комментариях.