Публикации по теме 'data-science'


Мусор на входе, мусор на выходе: автоматизированное машинное обучение начинается с качественных данных
Ни для кого не секрет, что методы машинного обучения сильно зависят от качества данных, которые они получают на входе. Если вы думаете о машинном обучении как о производственном процессе, то чем выше качество входных данных, тем выше вероятность того, что конечный продукт также будет высокого качества. Эти отношения представляют собой большую проблему для аналитических команд, когда дело доходит до выяснения правильных данных для решения бизнес-задач. Этим командам необходимо..

Случайный лес - модель, созданная для создания структуры в хаосе
Случайный лес - модель, созданная для создания структуры в хаосе Представьте себе: вам нужно делать прогнозы на основе огромного количества характеристик. Какой алгоритм приходит на ум в первую очередь? Что касается меня, я обычно всегда выбираю случайный лес. Когда вы сталкиваетесь с проблемой чрезмерной подгонки, метод машинного обучения, который приходит на помощь (чаще всего), снова представляет собой случайный лес. Когда нам нужно простое решение проблемы, которую вызывает..

Справочник MLOps: передовой опыт обеспечения надежности систем машинного обучения
В этой статье представлен простой, но всеобъемлющий набор лучших практик MLOps для организаций, чтобы оценить производственную готовность систем машинного обучения. Это также оказалось полезным для оценки готовых платформ MLOps на предмет полноты функций и возможностей. Может существовать целый ряд передовых методов разработки программного обеспечения для создания надежного программного обеспечения, но аналогичные передовые методы для работы систем машинного обучения находятся только в..

7 простых шагов для создания собственного веб-парсера с использованием Python
Эффективное извлечение веб-контента Извлечение большого количества данных с веб-сайта вручную может занять много времени и усилий. А как известно, время - деньги. Вот здесь и пригодится веб-скрапинг, который упростит и ускорит работу. Сделать простой скребок тоже несложно. Так что, если вы хотите узнать больше о парсинге веб-страниц и о том, как создать свою собственную версию на Python, пристегнитесь! Что такое веб-скрапинг? Веб-скрапинг - это автоматизированный метод..

Использование науки о данных и машинного обучения: стратегическое место для строительства нового сверчка…
Введение Крикет - популярный вид спорта, особенно в таких азиатских странах, как Индия, Пакистан, Шри-Ланка, Бангладеш и т. Д. В результате глобализации многие поклонники крикета, переехавшие в Канаду, не могут смотреть спорт по телевизору или летать на тысячи километров. на стадион. Таким образом, чтобы по-настоящему почувствовать себя фанатами спорта, часто возникает желание посмотреть игру на стадионе, который находится поблизости от них. Чтобы воспользоваться этой..

Сокровищница исследователя данных.
Сокровищница исследователя данных. Ну, а кто такой Data Scientist? Я знаю, что некоторые из вас так думают. Некоторым, кто читал технические блоги и был известен в СМИ, должно быть интересно, в чем разница между специалистом по анализу данных и инженером по машинному обучению? Разве они не все одинаковые? Что ж, давайте сначала решим эти несколько вопросов, а затем перейдем к части охоты за сокровищами, круто. Давай начнем. Таким образом, специалист по анализу данных - это тот,..

Использование машинного обучения для анализа данных об использовании клиентов для устройств Интернета вещей
Что такое Интернет вещей? Интернет вещей (IoT) - это модное техническое слово, но что это на самом деле означает? Определение простое: Интернет вещей - это концепция подключения любого устройства с переключателем включения / выключения к Интернету и друг к другу. Количество устройств, поддерживающих Wi-Fi, таких как смартфоны, часы и даже домашние развлекательные системы, быстро растет. Кроме того, эта технология дешевле и проще, что помогает ей получить более широкое..