Публикации по теме ml-so-good

Публикации по теме 'ml-so-good'

Объяснение PCA

Анализ основных компонентов (PCA) — это важный алгоритм в наборе инструментов специалиста по обработке и анализу данных. Он используется для уменьшения размерности набора данных при максимально возможном сохранении исходной информации. Это делает его особенно полезным для анализа больших наборов данных со многими переменными, где может быть сложно визуализировать и интерпретировать данные. Мы поймем его использование, работу и реализацию. Мы также обсудим некоторые распространенные..

Как выбрать лучший алгоритм для вашего проекта машинного обучения

Оптимизация | Машинное обучение | Наука о данных Как выбрать лучший алгоритм для вашего проекта машинного обучения Оптимизация производительности модели машинного обучения: руководство по выбору алгоритма «Пришел за данными, остался ради науки», — Кирк Борн, главный научный сотрудник DataPrime, Inc. Выбор правильного алгоритма классификации и регрессии машинного обучения имеет решающее значение для построения точной прогностической модели. Однако из-за широкого спектра..

Эксперимент активного обучения с задачей классификации НЛП

Введение В этой статье я хочу изучить активное обучение решению задачи классификации НЛП. В частности, используя конкурсный набор данных Spooky Author Identification , я хочу пометить его, притворяясь, что начинаю с совершенно неразмеченного набора данных. Основными ссылками на активное обучение являются Курс MIT «Введение в data-centric AI и, в частности, третий курс ) и Человек в цикле машинного обучения . Я сталкиваюсь с проблемой ручного аннотирования набора данных для..

Краткое введение в трансформаторы BERT и GPT

В последние годы в области обработки естественного языка (НЛП) произошел колоссальный сдвиг, и все это благодаря появлению моделей-трансформеров. Эти модели, такие как BERT (представления двунаправленного кодировщика из трансформаторов) и GPT (генеративный предварительно обученный преобразователь), не только изменили наш подход к задачам НЛП, но также открыли новые возможности, о которых раньше мы могли только мечтать. В этой статье мы собираемся отправиться в путешествие во внутреннюю..

Окончательное расширенное руководство по контролируемому обучению: методы, выходящие за рамки основ

Изучите продвинутые части контролируемого обучения: регуляризация, объяснимость и многое другое. Конкурентное преимущество строится на инсайтах. Понимание имеющейся информации имеет решающее значение для успеха в бизнесе.

Бесплатный курс Массачусетского технологического института по машинному обучению с помощью Python: от линейных моделей к глубокому обучению

Несмотря на то, что мы этого не замечаем, машинное обучение стало частью повседневной жизни каждого и незаметно влияет на нашу повседневную жизнь. Неудивительно, что машинное обучение — одна из самых горячих тем 21 века. С ростом популярности машинного обучения существует высокий спрос на машинное обучение…

Улучшите свой исследовательский анализ данных для табличных данных: часть 1

Табличные данные Исследовательский анализ данных Улучшите свой исследовательский анализ данных для табличных данных: часть 1 Я обсуждаю, почему я перешел от пяти к двум типам сюжета в своем предварительном EDA. Я также создал Github для всего кода в этом блоге. Репозиторий GitHub содержит три функциональных инструмента, которые вы можете сразу использовать в своем EDA. Много лет я анализировал данные, используя статические графики. Я также показываю свой переход на интерактивные..