Когда меня спрашивают, почему вы хотели стать специалистом по обработке и анализу данных, я хотел бы ответить так: «Это была работа моей мечты с самого детства». К сожалению, в то время о науке о данных никто не слышал. Я получил образование химика с более чем десятилетним опытом работы по исследованию полимеров. В своей предыдущей работе я всегда работал с числами, таблицами и рисунками, которые были экспериментальными результатами. Эти результаты должны быть проанализированы с помощью определенной процедуры расчета, прежде чем сделать вывод и получить представление о них. Я обнаружил, что получаю удовольствие от такого рода работы и увлекаюсь превращением чисел в цифры и, в конечном итоге, выводами. Таким образом, обработка данных не была для меня чем-то новым, и, кроме того, как и большинство американцев азиатского происхождения, я хорошо разбираюсь в математике, как и один из кандидатов в президенты от Демократической партии 2020 года.

Вместо того, чтобы посещать официальную программу по науке о данных в колледже/университете, я решил сделать это онлайн, потому что: гибкий график (это важно, если у вас есть семья), более быстрое завершение (я уверен в своих способностях), отсутствие поездок на работу (экономия много времени) и, наконец, снизить затраты. Я начал свой путь с изучения базы данных и хранилища данных. База данных содержит информацию, организованную в виде столбцов, строк и таблиц. Организации чаще всего используют базы данных для онлайн-обработки транзакций. Хранилище данных предназначено для хранения больших объемов исторических данных и обеспечения быстрой и комплексной обработки всех данных. Кроме того, я изучил и опробовал несколько конкретных инструментов, используемых для разработки решений для хранилищ данных и бизнес-аналитики.

Затем я углубился в науку о данных, присоединившись к учебному курсу General Assembly Immersive Data Science. Этот учебный курс охватил многие аспекты науки о данных: основы Python и Pandas и их применение, а также более сложные темы и технологии, такие как AWS, spark и т. д. Мы использовали учебную программу на основе Python, блокнот Jupyter для изучения и практики. вероятностный и статистический анализ. Я научился извлекать данные из внешних источников, организовывать и обрабатывать данные с помощью библиотеки Python, в частности Pandas. Затем были применены мощные модели машинного обучения для получения информации из данных. В этом учебном процессе мы всегда работали над реальными примерами из практики. Было разработано пять интересных проектов, чтобы научиться от базовой модели регрессии до продвинутых моделей глубокого обучения, от использования модели линейной регрессии для прогнозирования цены дома до встраивания обработки естественного языка в нейронную сеть. . Подробности этих проектов можно найти в моей учетной записи github.

Теперь я закончил даталагерь и перешел к следующему этапу: продолжать самообучение, применять полученные навыки в реальных проектах и ​​найти работу. В целом мой путь к тому, чтобы стать специалистом по данным, был приятным, плодотворным и дал мне чувство выполненного долга. Итак, если кто-то спросит меня, почему вы хотите стать специалистом по данным, я отвечу: «Мне это нравится, так почему бы и нет!»

ИЗБРАННЫЕ ПУБЛИКАЦИИ:

1. Чен, X.; Хьюзи, MC .; Карро, П. Дж. «Реологические свойства пенопластов LDPE и mPE, полученных литьем под давлением», Journal of Polymer Engineering, 2004, 44(11), 2158–2164.

2. Чен, X. Инь, Дж.; Ли, Л .; Солнце, З .; Ан, Л. «Энтальпия смешения и фазовое поведение смесей поли(этиленоксид)-поли(винилацетат)», Макромолекулы, 1999, 32(18), 5905

3. Чен, X. Сунь, Z.; Инь, Дж .; Ан, Л. «Термодинамика смесей ПЭО с ПВА: применение теории решетчатой ​​жидкости Санчеса-Лакомба», Polymer, 2000, 41, 5669.

4. Чен, X.; Инь, Дж .; Альфонсо, Г.; Туртурро, А .; Педемонте, Э. «Термодинамика смесей поли(этиленоксида) с поли(метилметакрилатом) и поли(винилацетатом); Прогнозирование смешиваемости на основе теории растворов Флори, модифицированной Хамадой», Полимер, 1998, 39, 4929

5. Инь, Дж.; Чен, X. Альфонсо, Г.; Туртурро, А .; и др. др. «Исследование смешиваемости и термодинамики смесей диацетата целлюлозы и поли(винилпирролидона)», Полимер, 1997, 38, 2127

Чен, X. Ху, Х.; Инь, Дж .; Чжэн, К. «Исследования смешиваемости смесей поли(этиленоксид)-поли(винилацетат) методами вискозиметрии», Journal of Applied Polymer Science, 1995, 56, 247