Публикации по теме 'data'


Сериализация и десериализация: как данные перемещаются по компьютерной сети ?
Почему выбран JSON? Что такое TCP? Что такое байтовая строка и байтовый поток? Сериализация — это процесс преобразования объекта данных в поток байтов. Вы найдете эту информацию во многих статьях, но все они объясняются с использованием модных словечек. Это создает больше путаницы. В этой статье я попытаюсь объяснить концепции в рамках вопросов/ответов. Держись со мной! Что такое сериализация? Сериализация — это процесс преобразования объекта данных в поток байтов ...

Расчет процентиля в разных контекстах
Мы видим, что в разных учебниках, статистических библиотеках и т. д. процентили рассчитываются по-разному. Давайте разберемся в контексте. Контекст 1: (Не образец) Представьте, что на вашем пути есть набор вех. Есть три вехи. Это не образец. Это население. Вы начинаете с 1, переходите к 2, достигаете 3. Сколько шагов мы прошли? 1- › 2 и 2- › 3 Для n этапов у вас есть n-1 шагов . 100% путь состоит из n-1 шагов. В этом случае, чтобы вычислить процентильный ранг..

Базовый конвейер регрессии / классификации
Наука о данных Базовый конвейер регрессии / классификации В этой статье объясняются важные части конвейера регрессии / классификации (различия показаны там, где это необходимо). Дополнительные баллы могут быть добавлены в зависимости от домена и отрасли, в которой вы работаете. Обычно развертывание модели и облачная интеграция следуют этому процессу, но сегодня мы говорим не об этом. Еще один момент, который не был выделен как таковой ниже, - это «очистка данных», которую..

День 2 из 66 дней данных
66 дней данных День 2 из 66 дней данных Документирование моего пути обучения науке о данных Сегодня я подготовил несколько слайдов для лекции о важности программирования в рамках вводного курса #Python , который я преподаю. Курс предназначен для студентов бакалавриата по программе медицинских технологий, которые ранее не имели опыта работы с компьютерами. Медицинские технологи — это медицинские работники, работающие в клинических лабораториях, которые являются невоспетыми..

Введение в подготовку данных для машинного обучения с помощью Pandas
Импорт, исследование, очистка, преобразование и разделение данных Pandas — популярная библиотека Python, используемая для обработки, анализа и подготовки данных. Он предоставляет структуры данных для эффективной обработки данных, а также функции для очистки, преобразования и визуализации данных. Pandas широко используется в машинном обучении, потому что…

Как справиться с разрастанием конфиденциальных данных
Краткое руководство по обеспечению большей безопасности в ваших приложениях У каждой организации есть конфиденциальные данные — данные клиентов, данные сотрудников или операционные данные. Конфиденциальные данные могут поступать во многих формах, в том числе: Кадровые записи Учетные данные, используемые в коде приложения или облачных службах Личная информация (PII) Личная медицинская информация (PHI) Данные платежной карты, на которые распространяется PCI DSS Каждый тип..

Когда помощник становится твоим другом, который знает тебя лучше, чем кто-либо другой.
В наши дни многие люди тусуются с Siri, Alexa, Cortana или даже с этим парнем из Google Now. Вы думаете о них как о помощниках, но на самом деле они хотят быть друзьями, лучшими друзьями. Когда они впервые появились на сцене, большинство считало их милыми, некоторые высмеивали их, а другие просто игнорировали. Независимо от ваших чувств, они никуда не делись и становятся только популярнее. Что изменилось? Ну, технологии усердно работали (с помощью некоторых умных людей), учась тому,..