Публикации по теме 'data'


Прочтите CSV-файл из Интернета прямо в свой код
Программирование Прочтите CSV-файл из Интернета прямо в свой код Используйте такие функции, как download.file (), read.csv () и pd.read_csv (), чтобы прочитать файл CSV из Интернета непосредственно в код R или Python. Вступление Прежде чем проводить какой-либо анализ данных, нам в первую очередь необходимо иметь надежный источник данных. Одним из надежных источников данных являются данные из Интернета. Существует так много веб-сайтов, на которых можно получить наборы данных..

Типы данных
Наука о данных — ничто без основного ингредиента: «Данные». Так что же такое данные? «Ф факты и статистические данные, собранные вместе для справки или анализа » Джон Тьюки в своей статье 1962 года под названием «Будущее анализа данных» предложил новую научную дисциплину под названием «Анализ данных», это была одна из важных работ в основе науки о данных. Позже книга «Исследовательский анализ данных» в 1977 году сделала эту область более заметной. Реальные данные и данные..

Модульные тесты для науки о данных - основные варианты использования
Вопрос на миллион долларов - каковы распространенные варианты использования модульного тестирования в конвейере кода Data Science? Как вы, несомненно, знаете, вопрос не в том, нужно ли использовать модульное тестирование в конвейере DS, поскольку ответ определенно - черт возьми, да! Но на что обращать внимание при модульном тестировании? Во-первых, что такое тестирование? Тестирование определяется как задача, которая проверяет, соответствуют ли фактические результаты ожидаемым,..

Прогнозирование банкротства компаний с помощью машинного обучения
Использование логистической регрессии и ключевых финансовых показателей Введение В этом руководстве мы будем использовать набор данных из репозитория машинного обучения Калифорнийского университета, который содержит ключевые финансовые показатели компаний. Мы будем использовать эти данные, чтобы предсказать, объявила компания о банкротстве или нет. Чтобы делать наши прогнозы, мы будем использовать модель логистической регрессии, реализованную с помощью scikit-learn на Python...

Краткое введение в машинное обучение для нетехнических специалистов
Краткое введение в машинное обучение для нетехнических специалистов Машинное обучение постепенно по-разному распространилось в нашу жизнь. Например, недавно рекомендованная музыка из Spotify и видео из Netflix. Люди все время говорят о машинном обучении, и, возможно, вы уже слышали об этом несколько раз в телешоу, новостях или даже в анимации. Вроде панацея от множества сложных проблем (конечно, не) Однако вы все еще можете не понимать, что это на самом деле? Вот простое краткое..

Как в нужный момент собирать данные с помощью JavaScript
Я всегда работал с предположением, что если я приложу достаточно времени и усилий к чему-либо, в конечном итоге я получу желаемый результат. Если я смогу бросить достаточно тяжелой работы (и кофе: P) на свою проблему, я смогу найти для нее отличное решение. Упрямство было и остается одним из моих лучших и худших качеств. Я узнаю, что деспотичный подход редко работает в сфере программирования. Иногда ситуация требует тонких рук и тонкости для достижения наилучшего результата. Это..

Отбелите ваши данные с помощью imperio WhiteningTransformer
Разработка функций - это процесс преобразования ваших входных данных таким образом, чтобы они были более репрезентативными для алгоритмов машинного обучения. Однако о нем очень часто забывают из-за отсутствия простого в использовании пакета. Вот почему мы решили создать одно - imperio , третье наше непростительное проклятие. Как работает WhiteningTransformer? Отбеливание или сферирование - это этап предварительной обработки данных. Его можно использовать для удаления корреляции..