Публикации по теме 'data'


Переход с Cron на Apache Airflow
Мы все были там. Когда выполняются десятки или сотни заданий cron, и вы (или ваш босс) рветесь за волосы, пытаясь понять, почему критически важное задание не было выполнено прошлой ночью. Вы озадачены и сбиты с толку. Разве не запустилось? Это не удалось? Почему это могло потерпеть неудачу? В AMPATH использование заданий cron для планирования заданий ETL становилось все более невозможным. Наши процессы ETL включают сначала денормализацию и сглаживание данных, а затем..

Это языки программирования для науки о данных, которые использует Tesla!
Добро пожаловать обратно! Что ж, эта статья о Tesla, которую я написал на днях, стала довольно вирусной , так что теперь давайте немного подробнее рассмотрим языки программирования, которые использует Tesla, в частности языки, которые они используют для науки о данных. Процесс поиска этих языков был чрезвычайно сложным и сложным, шучу, я просто зашел на страницу их карьеры, посмотрел на должности в области науки о данных и подсчитал, какие языки программирования им требуются:..

Экономия денег с помощью науки о данных
Почему тот ученик в классе, который спросил вашего учителя математики: «Когда я когда-нибудь собираюсь использовать это?» вероятно сломан В предыдущей статье я обсуждал как использовать алгоритм STL , чтобы разбить любой временной ряд на его сезонную, трендовую и шумовую составляющие. Я провел вас через пример, используя курс акций Amazon. В этой статье я покажу вам, как можно использовать ту же технику, чтобы сэкономить деньги при аренде квартиры. Я собираюсь использовать..

Учебное пособие по YAML: начните работу с YAML за 5 минут
Синтаксис, основные функции и расширенные функции YAML - это язык сериализации данных, позволяющий хранить сложные данные в компактном и удобочитаемом формате. Это важно для DevOps и виртуализации, поскольку необходимо для создания эффективных систем управления данными и автоматизации. Разработчики часто упускают из виду, что это мощный и простой инструмент, который может значительно улучшить ваши перспективы трудоустройства всего за пару часов обучения. Сегодня мы поможем вам..

Проклятие монстра озера данных
от Киран Пракаш и Люси Чемберс В настоящее время в моде искусственный интеллект и машинное обучение. Каждая организация пытается ухватиться за эту подножку и заработать на своих резервах данных. В ThoughtWorks мы согласны с тем, что эта технология имеет огромный потенциал, но, как и во всем остальном, осознание ценности зависит от понимания того, как лучше всего ее использовать. К нам часто обращаются клиенты, которые хотят дать импульс своим инициативам в области ИИ, создав озеро..

Почему наука о данных так увлекательна?
Любой, кто занимается наукой о данных, уже знает, что эта отрасль быстро превращается в одну из самых захватывающих профессий 21 века. Многие даже считают эту роль самой сексуальной ролью современности. Вы бы согласились? Вот несколько причин, по которым наука о данных так интересна. Быть специалистом по обработке данных - значит работать детективом, современным Шерлоком Холмсом. Индустрия отлично подходит для любознательных людей, которые любят решать повседневные головоломки...

Метрики сходства и расстояния для науки о данных и машинного обучения
Метрики сходства и расстояния для науки о данных и машинного обучения Применяется в системах рекомендаций В предыдущей статье, посвященной системам рекомендаций , мы несколько раз упоминали понятие меры сходства . Почему? Потому что в системах рекомендаций и контент-фильтрация, и алгоритмы совместной фильтрации используют некоторую конкретную меру сходства, чтобы определить, насколько равны два вектора пользователей или элементов между ними. В конце концов, мера сходства - это не..