Публикации по теме 'monitoring'
Является ли мониторинг AI/ML просто инжинирингом данных? 🤔
В то время как будущее машинного обучения и MLOps обсуждается , специалистам-практикам по-прежнему необходимо следить за своими моделями машинного обучения в производственной среде. Это непростая задача, поскольку инженеры машинного обучения должны постоянно оценивать качество данных, которые входят и выходят из их конвейеров, и следить за тем, чтобы их модели генерировали правильные прогнозы. Чтобы помочь инженерам машинного обучения решить эту задачу, было разработано несколько решений..
Профилирование в производственной среде для выявления узких мест на сервере
Я работаю техническим руководителем в команде Системы, отвечающей за производительность и стабильность услуг. С марта по ноябрь 2020 года Miro вырос в семь раз, достигнув 600+ тысяч уникальных пользователей в день. В настоящее время наш монолит работает на 350 серверах, и мы храним пользовательские данные примерно в 150 экземплярах.
Чем больше пользователей взаимодействуют с сервисом, тем сложнее найти и устранить узкие места на его серверах. Вот как мы решили эту проблему.
Часть..
5 этапов модели зрелости наблюдаемости
Измеряйте и повышайте способность вашего бизнеса достичь полной наблюдаемости и выше с помощью 5 этапов модели зрелости наблюдаемости от LOGIQ.AI.
Обзор
Мониторинг существует уже довольно давно. Это был традиционный метод получения информации и мониторинга производительности системы. Однако с появлением наблюдаемости все стало намного эффективнее.
Не то чтобы наблюдаемость заменила мониторинг, но это скорее его дополнение/надмножество, если не замена.
Теперь, с беспрецедентным..
Надежность: подготовьте свой завод к машинному обучению в будущем — начните сохранять данные об отказах!
Инструменты управления надежностью оборудования гораздо более автоматизированы и интеллектуальны, чем в прошлые годы, но то, будут ли они работать и насколько хорошо они будут работать для какой-либо отдельной компании, зависит от постоянной проблемы: доступных данных. Хорошо известно, что машинное обучение (МО) на основе данных о состоянии датчиков может ускорить выявление и анализ проблем, но плохие или отсутствующие данные об отказах могут замедлить МО, а также диагностику человека и..
Система мониторинга с Grafana и Prometheus
В современном цифровом мире системный мониторинг стал неотъемлемой частью обеспечения производительности и стабильности онлайн-приложений и сервисов. Системные администраторы и рабочие группы должны постоянно следить за состоянием своих систем, выявляя и устраняя проблемы до того, как они затронут конечных пользователей. Именно здесь на помощь приходит Prometheus, мощный инструмент мониторинга и оповещения, разработанный специально для современных инфраструктурных сред.
Node Exporter..
Прогнозирование временных рядов для Prometheus и Grafana с помощью BigQuery ML
Используйте BigQuery ML, чтобы добавить в Prometheus возможности прогнозирования и сделать мониторинг более интеллектуальным.
Для мониторинга и оповещения я использую Prometheus и Grafana, которые отлично подходят для этого. Но некоторые метрики имеют тенденции и повторяющиеся закономерности, что затрудняет их отслеживание с помощью предупреждений на основе пороговых значений. Поэтому я хотел узнать, может ли BigQuery ML прийти на помощь. Он предлагает прогнозирование временных..
Максимизация ценности стека мониторинга Grafana: интеграция Loki и Tempo
В этом посте я хочу углубиться в сложную тему, с которой инженеры часто сталкиваются при настройке системы мониторинга для производства. Отладка сложных приложений, особенно тех, которые содержат несколько микросервисов, может быть сложной задачей. Однако наличие такой комплексной системы, как Grafana, включающей ведение журнала, экспорт метрик и отслеживание, может значительно облегчить этот процесс. Но чтобы по-настоящему раскрыть его ценность, решающее значение имеет интеграция этих..