Публикации по теме 'data-science'


Прокачка за 1 мин.
TL;DR Последовательное обучение — попытка последующей модели — правильно — ошибки — предыдущие модели Bias Variance Tradeoff — уменьшить и то, и другое — корректировка веса Взвешенная выборка — инициализация — равный вес — настройка — расстановка приоритетов — неправильно классифицированные экземпляры Несколько моделей Обучение на основе ошибок - обновляйте веса (последовательно) - более высокие ошибки получают более высокие веса построенная модель — знания из предыдущих моделей..

Худшие решения 2023 года: наука о данных
Reddit сказал Это легкая история о том, что люди должны были сказать, когда я спросил их об их худших новогодних резолюциях в науке о данных. Вот так! Худшее решение 1: «Отличное предложение» от SupplyChainPhD Предоставление общего доступа ко всем файлам Excel с помощью экрана печати, сохранения в формате pdf Мы все сталкивались с этим, особенно в сфере здравоохранения. Я наткнулся на множество начальных записей пациентов в EHR…

Регрессия хребта в простом режиме
Изучите теорию, лежащую в основе регрессионных моделей Ridge, как их кодировать и настраивать с помощью python и scikit-learn. Кто они такие? Ридж-регрессию можно рассматривать как шаг вверх от линейной регрессии . Они также известны как регуляризации Тихонова; и особенно полезны для смягчения проблемы мультиколлинеарности в линейной регрессии , которая обычно возникает в моделях с большим количеством параметров. Краткое описание линейных регрессий : они оценивают пересечение..

Единственный путь к «Просветлению Данных»!
Наука о данных уже давно стала модным словом, и кажется, что все хотят запрыгнуть на подножку. Но что такое данные в науке о данных? Это какая-то мистическая сущность, которую могут понять только избранные? Это набор чисел, которые могут расшифровать только математические гении? Не беспокойтесь, друзья мои, я здесь, чтобы пролить свет на эту загадочную тему «Данные». (Это своего рода нетехнический гайд с высоким обзором, технический гайд скоро появится) Способ получения информации..

Понимание документов без OCR с помощью Donut
Используйте недавно выпущенную модель Transformers для создания JSON-представлений данных вашего документа. Визуальное понимание документов (VDU) — это активно изучаемая новая область глубокого обучения и науки о данных, особенно потому, что в PDF-файлах или отсканированных документах содержится множество неструктурированных данных. Последние модели, такие как LayoutLM , используют архитектуру модели глубокого обучения трансформеры для маркировки слов или ответов на заданные вопросы..

Глубокое обучение, Интернет вещей и машинное обучение — Заметки из моего курса по основам науки о данных
Добро пожаловать в краткое исследование трех ключевых игроков на арене науки о данных: глубокое обучение, Интернет вещей и машинное обучение. Думайте об этом как о сокращенной версии того, что я узнал, — легком для понимания и готовом пробудить ваше любопытство к миру науки о данных. Являетесь ли вы сокурсником или просто человеком, заинтригованным магией данных, приходите, и я разобью сложные концепции на простые выводы. Давайте сразу же приступим и выясним, как эти инструменты..

Я не могу научить вас науке о данных за 10 дней
Подход тематического исследования к пониманию сущностей и требований в пространстве науки о данных «Около четырех с половиной лет назад я изо всех сил пытался понять всю концепцию Data Science. Исходя из не статистического фона, я был настроен скептически, обеспокоен и, что более важно, был неприятен. Я сомневался, смогу ли я выжить в отрасли, которая, как я полагал, была тяжелой для статистики. Но вот я все еще плыву по ветру, приобретая в процессе несколько навыков. Я не собираюсь..