Меня преследовали многие последователи и спрашивали, как действовать, чтобы добиться успеха на этом треке. Я могу рассказать вам свою собственную историю.

Изучайте Python

Всем, кто стремится к DS, вам нужно принять Python без альтернативы, Y — ? у него есть все библиотеки, если вы хотите, R тоже хорошо, но Python лучше, я чувствую.
Хронология Ежедневно — 5–7 часов только это.

Модули в py для изучения — Pandas, Numpy, а затем Tensorflow, Keras, Scikit-learn, PyTorch.
Hackerrank может быть полезен, чтобы поддразнить вас. »

Изучите облако

AWS, Azure и GCP
AWS — https://aws.amazon.com/training/course-descriptions/
Azure — https://docs.microsoft.com/en-us/ Learn/azure/
GCP — https://cloud.google.com/training

Как только вы изучите основы, не ждите, возьмите любую задачу и попробуйте посмотреть, как вы можете делать то же самое во всех трех облаках.

Затем, как только вы освоитесь, попытайтесь понять, как вы можете снизить стоимость той же работы (это то, что компании изучают, когда переходят в облако).

Learn Big data & Spark
Честно говоря, я получил много материала из Интернета, в основном Youtube, который помог понять, и время от времени я делал большинство заметок.

Наконец
Изучите визуализацию — важно показать, что вы сделали, вся обработка данных и окончательный результат должны быть представлены, и я считаю, что PBI (PowerBI) дешев и лучше всего

Обучение PBI-https://docs.microsoft.com/en-us/power-bi/guided-learning/

Со всем вышеперечисленным вы можете извлекать данные с помощью python в облачную среду, где у вас есть большие данные, а затем вы обрабатываете свои данные с помощью искры и, наконец, отображаете данные в визуализации.

Это будет быстрый старт