Публикации по теме 'dimensionality-reduction'


ISOMAP как метод уменьшения размерности
Автор Бетул Мешиоглу Необходимость уменьшения размерности и связанные с этим проблемы: Когда мы имеем дело с данными с многочисленными функциями, мы не можем извлечь значимые релевантные структуры данных, которые скрыты в высоких измерениях. Чтобы решить эту проблему, нам нужно преобразовать данные из более высокого измерения в более низкое измерение, где человеческий разум гораздо лучше понимает структуры с помощью визуализации или с помощью других инструментов. К сожалению, не все..

Buzz: быстрое и интерактивное исследование низкоразмерных пространств.
За последние десятилетия объемы наборов данных значительно выросли. С одной стороны, приобретение стало дешевле и быстрее, что позволяет измерять больше экземпляров. С другой стороны, для каждого экземпляра выполняется больше измерений. Сложность интерпретации таких больших наборов данных подтолкнула вперед разработку методов уменьшения размерности. Алгоритмы, такие как PCA, MDS, T-SNE, UMAP или автоэнкодеры, успешно позволяют нам обрабатывать большие объемы многомерных данных с..

Неконтролируемое машинное обучение для начинающих
В моей предыдущей статье Машинное обучение с учителем для начинающих упоминалось, что такое машинное обучение. Здесь я хотел бы поговорить об неконтролируемом машинном обучении . Прежде чем перейти к этой теме, я кратко коснусь статистики. Статистика включает в себя группировку, организацию и осмысление сложных данных в среде, где вам необходимо понимать информацию. Когда дело доходит до проделанной работы, очень важно определить цель, деятельность, необходимую для цели,..

Освоение анализа главных компонентов с помощью геометрической интуиции: пошаговое руководство по…
Если вы занимаетесь анализом данных или энтузиастом машинного обучения, вы, вероятно, когда-то сталкивались с анализом основных компонентов (АПК). Но сталкивались ли вы с трудностями, пытаясь полностью понять концепцию и ее приложения? PCA может быть мощным инструментом для уменьшения размерности, но его сложность часто может быть препятствием для многих людей. С таким количеством ресурсов, доступных в Интернете, может быть сложно найти четкое и краткое руководство по пониманию и..

Измерение и объяснение межкластерной надежности многомерных проекций
Сью Хён Пак Многомерные или многомерные данные содержат подробную информацию о сложных системах. Впечатляющим примером являются данные секвенирования одноклеточной РНК (scRNA-seq) . Он содержит тысячи атрибутов для объяснения фенотипа отдельной клетки, поскольку количество специфичных для типа клеток паттернов экспрессии генов в любой ткани или типе клеток колеблется от 3000 до 5000 . ». Чтобы визуализировать и интерпретировать подобные многомерные данные, широко используемый..

Анализ основных компонентов объясняется на примере
Машинное обучение Анализ основных компонентов объясняется на примере Интуиция, немного математики и кода Всем привет! В этом посте мы увидим, как избавиться от слишком большого количества измерений. В предыдущем посте мы узнали, что слишком много измерений может быть проклятием. Так что в каком-то смысле мы научимся снимать проклятия! Существует множество методов уменьшения размерности, таких как PCA, LDA, t-SNE и так далее. Даже автоэнкодеры используются для преобразования..

Уменьшение размерности: какую проблему оно решает?
Царство действительно больших данных Люди рождаются со способностями к распознаванию образов, которые позволяют нам с первого взгляда различать закономерности в графических изображениях. Однако можем ли мы визуализировать отношения между сотнями переменных в наших огромных наборах данных? Даже самые передовые методы визуализации данных не выходят за пределы пяти измерений. Схема: процесс уменьшения размеров Высокоразмерные данные Уменьшение размерности Методы уменьшения..