Назовете ли вы это математикой, математикой или традиционным способом называть это математикой, если у вас есть среднее или выше минимальное знание счета чисел, значит, вы уже обладаете навыком решать и анализировать проблемы.

Поскольку вы занимаетесь математикой, ваши возможности безмерно многочисленны с точки зрения работы и карьерного роста. От карьеры в области бухгалтерского учета, банковского дела, актуарной науки, метеорологии, преподавания, финансового анализа, статистики, инвестиционного анализа, исследований (математика), науки о данных и машинного обучения; Никто не станет с этим спорить, правда?

Я стремлюсь сделать карьеру в области науки о данных и машинного обучения, потому что сегодня эти две должности являются одними из самых высокооплачиваемых в мире. Я не тороплюсь, чтобы разбить это на самое простое понимание.

Если вы изучаете математику или у вас уже есть специальность по математике, поехали! поскольку я познакомлю вас с основами обеих областей. Если ваша область не связана с математикой, но вы можете легко складывать числа, как ребенок дошкольного возраста, вам тоже хорошо! Не все специалисты по анализу данных и инженеры по машинному обучению являются математиками, просто знайте, что вам придется работать над совершенствованием своих математических навыков сверхурочно.

Видите ли, оба поля являются субдоменами искусственного интеллекта. Они являются ключевыми компонентами, обеспечивающими работу ИИ. Знание математики - это основа всех наук, почти все методы науки о данных и машинного обучения имеют глубокую математическую основу.

Наука о данных

Наука о данных - это изучение данных. Он включает в себя разработку методов записи, хранения и анализа данных для эффективного извлечения полезной информации. Цель науки о данных - получить понимание и знания из любого типа данных - как структурированных, так и неструктурированных.

Структурированные данные

Это полностью готовые / подобранные вручную данные, которые прекрасно вписываются в базу данных. Он хорошо организован и легко анализируется. Большинство ИТ-специалистов привыкли работать с такими данными. Когда вы думаете о структурированных данных, это похоже на данные, которые хорошо вписываются в электронную таблицу Excel. Например, даты, номера телефонов, адреса, имена клиентов, названия продуктов, информация о транзакциях POS и т. Д.

Его красота заключается в его внутренней структуре, а упорядоченность делает его простым для понимания и анализа.

Неструктурированные данные

Все как раз наоборот. Он плохо вписывается в электронную таблицу или базу данных. Он может быть текстовым или нетекстовым. Он может быть создан человеком или машиной. Примерами являются мультимедийные файлы (аудио, изображения и видео), текстовые файлы, электронные письма, данные из социальных сетей, мобильные данные (текстовые сообщения и местоположения GPS) и сообщения (чаты и звонки). Эти примеры в значительной степени созданы человеком, но данные, созданные машинами, также могут быть неструктурированными, например спутниковые изображения, научные данные, изображения и видео наблюдения, данные датчиков погоды и т. Д.

Привет, я знаю, тебе уже скучно. Ха-ха. Открой свой разум, пока я расскажу тебе об эволюции науки о данных.

Эволюция науки о данных

Наука о данных существует очень давно, она началась в начале 20 века. Но в то время это не называлось наукой о данных, обычно это называлось вычислительным анализом.
Причина, по которой его называли наукой о данных, заключалась в БОЛЬШИХ ДАННЫХ.

Термин «большие данные» появился благодаря тому факту, что в 2010 году произошло резкое увеличение использования интернет-сервисов. Эти данные были слишком огромными, поскольку компании, занимающиеся интернет-серверами, записывали более 2 зеттабайт. (1 триллион гигабайт) данных. Вау! Действительно большие данные.

Это поле нуждалось в людях, чтобы отсортировать эти огромные данные. Таким образом, крупные технологические компании, такие как Google, Facebook, IBM, Apple, Microsoft, Intel, Cisco и Oracle, начали использовать и использовать эти огромные данные для улучшения своего бизнеса, обслуживания клиентов и, очевидно, для получения прибыли.

Вы когда-нибудь задумывались, что у Google всегда есть ответы на большинство ваших повседневных вопросов? Это большие данные. Большие данные также используются для получения информации об интернет-маркетинге и потребностях клиентов. Вы поймете лучше, когда мы перейдем к машинному обучению.

Быть специалистом по данным

Процесс обучения, чтобы стать специалистом по обработке данных, непрост. Вы должны знать, как работают языки программирования и как запускать коды. Я слышал, как люди говорят, что наука о данных не требует программирования, и вам просто нужно знать, как использовать электронную таблицу Excel, что является большой жирной ложью. Когда вы начнете углубляться в науку о данных, вы поймете, что нужно учиться программировать.

Вот наиболее часто используемые языки программирования в науке о данных, которые вы можете изучить:

Науке о данных также нужна прикладная математика. Возможно, вы до некоторой степени знаете основы математики, но если вы не знаете, как ее применять, это бесполезно. Чтобы быть очень хорошим специалистом по данным, вы должны хорошо разбираться в линейной алгебре, дискретной математике, дифференциальных уравнениях, численном анализе, абстрактной алгебре, теории чисел, реальном анализе, комплексном анализе и топологии. Это кажется подделкой, правда? Вы не обязаны знать все это с самого начала. Со временем вам придется все это изучить и привыкнуть.

Чтобы я не забыл, вам тоже нужно хорошо разбираться в статистике. Как вы, возможно, знаете, статистика занимается сбором, организацией, анализом, интерпретацией и представлением данных. Статистика важна. Тем не менее, самый важный навык в науке о данных - это критическое мышление.

Работая специалистом по данным, никого не волнует, откуда берутся ваши данные, нам просто нужны данные, которые являются подлинными и могут быть поняты всеми, только если вам предоставлен источник данных для работы. Понимаете, данные бесконечно малы, у них нет границ.

Наука о данных шире, чем это базовое объяснение, которое я только что дал. Один из лучших способов преуспеть в качестве специалиста по данным - это иметь возможность делиться своими мыслями, используя данные, в основном для нетехнических специалистов. Таким образом, вы можете продать свои уточненные данные кому угодно и заработать большие деньги. Как я уже говорил ранее в этой статье, сегодня это одна из самых оплачиваемых должностей в мире. В среднем крупные технологические компании платят специалистам по данным от 90 000 до 150 000 долларов. Это стоит того.

P.S: Это более или менее похоже на базовое объяснение того, что такое наука о данных. Погрузитесь глубже, поищите в Интернете больше идей. Если вы хотите продвинуться дальше, вы можете получить степень магистра в области анализа данных.

Машинное обучение (ML)

Машинное обучение - это подобласть искусственного интеллекта (ИИ), которая предоставляет системам возможность автоматически учиться и улучшать свой опыт без явного программирования. ML фокусируется на разработке компьютерных программ, которые могут получать доступ к данным и использовать их для обучения.

Наша способность учиться и становиться лучше благодаря опыту - это часть человеческого бытия. Когда ты родился, ты ничего не знал и мало мог сделать для себя. Но довольно скоро вы учились и становились способными день за днем. Тот же процесс работает с компьютерами.

Машинное обучение предоставляет как структурированные данные, так и статистику в сочетании с высокотехнологичными алгоритмами, позволяющими компьютерам научиться выполнять данную задачу без программирования.

Например, если я хочу, чтобы компьютерная система могла различать собаку и кошку, мне придется накормить ее тысячами изображений собак и кошек, указывающих на большие различия между собаками и кошками, у собак большие головы, у кошек есть меха и т. д. Со временем компьютерная система сможет различать и то, и другое.

Но, конечно, могут быть ошибки. Чем больше данных получает компьютер, тем точнее он настраивает свой алгоритм и тем точнее может быть в своих прогнозах.

Машинное обучение сегодня широко применяется в мире. Возьмем, к примеру, иногда Facebook уведомляет вас о том, что вы были на чьей-то фотографии или кто-то опубликовал ваше изображение, а вас не отметили в сообщении.

Facebook смог узнать вас, потому что вы публикуете свои фотографии, и они уже есть в своем архиве. Вы загрузили его своими данными (изображениями), он автоматически узнает, что это вы, не запрограммированный вручную в фоновом режиме.

Теперь вы можете лучше понять, что отлаженная структура данных + алгоритм ML = AI (искусственный интеллект). Это так просто.

Другой пример: если вы знакомы с использованием Google, Google имеет тенденцию использовать функцию прогнозирующего поиска, которая использует алгоритм прогнозирующего поиска, основанный на популярных поисковых запросах, для прогнозирования поискового запроса пользователя по мере его ввода, предоставляя раскрывающийся список предложений, которые меняются. по мере того, как пользователь добавляет больше символов к поисковому вводу.

Иногда Google также предлагает предложения, основанные на ваших предыдущих поисковых запросах. Эта функция возможна, потому что Google использовал и использовал данные (тексты), которые вы и другие люди вводили, для улучшения своих услуг и получения большей прибыли. Это работает не только в Google, но и с другими сериями сервисов и сервисов в Интернете.

Другие примеры работы машинного обучения:

  • Распознавание речи
  • Беспилотные автомобили
  • Рекомендации, основанные на вашей предыдущей истории
  • Целевые электронные письма (например, спам)
  • Ранжирование сообщений в социальных сетях (например, тенденции в Twitter)
  • Виртуальные персональные помощники (например, Алекса, Сири)
  • Прогнозы виртуальной карты
  • Электронная почта и фильтрация вредоносных программ
  • Онлайн-поддержка клиентов
  • Рекомендации по продукту
  • Обнаружение онлайн-мошенничества

С моими основными объяснениями вы теперь можете понять, что наука о данных похожа на конвейер, который соединяется с машинным обучением.

Лучшие навыки инженера по машинному обучению

  • Основы информатики и программирования
  • Вероятность и статистика
  • Моделирование и оценка данных
  • Применение алгоритмов и библиотек машинного обучения
  • Программная инженерия и системное проектирование

Все эти навыки кажутся сложными, но на самом деле они не такие уж сложные. Когда вы начинаете углубляться в это, они становятся проще.

ML-инженерия относительно сочетает в себе разработку программного обеспечения с исследованием данных. И наука о данных, и машинное обучение работают рука об руку в том смысле, что навыки машинного обучения могут быть применены и наука о данных, и наоборот.

Сегодня в Нигерии инженеры машинного обучения и специалисты по обработке данных зарабатывают от 400 тыс. До 1,2 млн. Евро. В конце концов, неплохо для вложенных в него усилий.

Думаю, сейчас вы заинтересованы в обеих областях. Некоторые люди, как правило, работают и специалистами по обработке данных, и инженерами машинного обучения, что является дополнительным преимуществом.

Работая в любом из двух секторов, вы можете работать в любых исследуемых секторах, таких как технологии, медицина, транспорт, банковское дело и финансы, сельское хозяйство, индустриализация, недвижимость, исследования и разработки и во многих других секторах, если у них есть огромные данные, которые вы может проникать и исследовать.

Чтобы узнать больше об обеих областях, начните с онлайн-курсов по питону, управлению базами данных, науке о данных, основам машинного обучения, основам программирования и особенно математике. Получите сертификаты от признанных платформ онлайн-обучения, таких как Udemy, Coursera, Udacity и т. Д.

Без математики карьера в области науки о данных и машинного обучения - это просто догадки.

Продолжайте и начните учиться прямо сейчас. Мир науки о данных и машинного обучения ждет вас!

Дополнительные ресурсы (щелкните ссылки)

Как начать заниматься наукой о данных

Основы математики для науки о данных

Как я стал специалистом по обработке данных, несмотря на то, что изучал математику

7 проектов по науке о данных с открытым исходным кодом, которые вы должны добавить в свое резюме

edX: линейная алгебра: от начала до границ

Coursera: математика для машинного обучения: линейная алгебра

Поищите в Интернете дополнительные ресурсы…

Спасибо за внимание.

Другие мои статьи:

Пандемия изменила наш Интернет

Социальные сети и ваше психическое здоровье

Как выжить и добиться процветания после COVID-19 с помощью технологий

9 приложений, которые гарантируют ежедневную производительность

32 интернет-термина, которые необходимо знать

Пожалуйста, прочтите и поделитесь.