Публикации по теме 'data'


Ошибка новичков в науке о данных объявила недействительной дюжину медицинских исследований
Когда Жиль Вандевил заметил большое количество исследований, сообщающих о почти идеальной точности в прогнозировании преждевременных родов у будущих мам, у него отвисла челюсть. Это было огромно. Невыносимо высокий уровень младенческой смертности преследует человечество с момента его зарождения. Преждевременные роды, от которых страдает каждый десятый новорожденный в США, являются основной причиной этих преждевременных смертей. Если бы можно было с уверенностью сказать, родит ли..

Загружайте быстрее в Python с помощью сжатых солений
Храните любой объект Python быстрее и с меньшим размером файла Вы ненавидите, как долго загружаются данные? На вашем жестком диске мало свободного места? Вот четыре простые в реализации функции, которые помогут любому программисту Python, от новичка до продвинутого, управлять своими проектами. Сжатые соленья Если вы какое-то время работали с Python, возможно, вы знакомы с библиотекой _pickle . Он сохраняет почти любой объект Python (включая массивные наборы данных) как байты...

Набор навыков визуализации данных: 10 эксклюзивных онлайн-курсов
Набор навыков визуализации данных Мастерские навыки визуализации данных с этим пакетом, который включает 10 онлайн-курсов. Зарегистрируйтесь, чтобы изучить визуализацию данных с использованием Python, Tableau, Seaborn и других инструментов! Почему этот набор навыков визуализации данных? Представление данных в визуальном формате облегчает людям обнаружение закономерностей и тенденций в больших данных. Визуализация данных — важный навык в современном мире, управляемом..

Глубокое погружение в контроль версий с помощью Git
Освоение Git для эффективной разработки кода и совместной работы Git - это бесплатный инструмент, который позволяет эффективно изменять код, предоставляя систему распределенного контроля версий . Это один из самых полезных инструментов, которым я научился, когда начал изучать программирование. Работал ли я над своими побочными проектами, сотрудничал с друзьями или работал в профессиональной среде, Git оказался чрезвычайно полезным. Лучшая аналогия, которую я могу вам дать, - это..

Построение гистограмм с использованием Matplotlib
Построение гистограмм с использованием Matplotlib Руководство по представлению данных с помощью гистограмм Гистограмма - это метод визуализации данных, который можно использовать для представления числовых значений в наборе данных, чтобы показать, как разные точки данных отличаются друг от друга. Он использует столбик как меру величин. Чем больше полоса, тем выше число. Например, если сравнивать богатство, больший столбик на гистограмме означает большие деньги по сравнению с..

Дополненная аналитика: текущие возможности и ограничения
Многие фирмы, изучающие технологические тренды (Gartner, BBVA, Forbes и многие другие), в последнее время обсуждают новый тип тренда в аналитике: дополненную аналитику. Идея дополненной аналитики невероятно интересна. Способность компьютера превращать аналитические идеи в данные путем автоматизации подготовки данных, обнаружения идей и, наконец, обмена ими с соответствующими людьми имеет удивительный потенциал. Но насколько далеко зашел этот подход? Стоит ли инвестировать в это..

Понимание выбросов в глубину
Чтобы понять, что такое выброс, давайте возьмем пример. Предположим, на свадьбе существует дресс-код. На вечеринке мы можем наблюдать, что люди оделись в соответствии с упомянутым дресс-кодом. Теперь, если некоторые люди придут на вечеринку, не соблюдая дресс-код, их праздничная одежда будет выглядеть иначе, чем у других людей. Этих людей можно отнести к аутсайдерам. Точка данных является выбросом, если она лежит за пределами диапазона распределения других точек данных. Его..