Публикации по теме 'dimensionality-reduction'
ISOMAP как метод уменьшения размерности
Автор Бетул Мешиоглу
Необходимость уменьшения размерности и связанные с этим проблемы:
Когда мы имеем дело с данными с многочисленными функциями, мы не можем извлечь значимые релевантные структуры данных, которые скрыты в высоких измерениях. Чтобы решить эту проблему, нам нужно преобразовать данные из более высокого измерения в более низкое измерение, где человеческий разум гораздо лучше понимает структуры с помощью визуализации или с помощью других инструментов. К сожалению, не все..
Buzz: быстрое и интерактивное исследование низкоразмерных пространств.
За последние десятилетия объемы наборов данных значительно выросли. С одной стороны, приобретение стало дешевле и быстрее, что позволяет измерять больше экземпляров. С другой стороны, для каждого экземпляра выполняется больше измерений. Сложность интерпретации таких больших наборов данных подтолкнула вперед разработку методов уменьшения размерности. Алгоритмы, такие как PCA, MDS, T-SNE, UMAP или автоэнкодеры, успешно позволяют нам обрабатывать большие объемы многомерных данных с..
Неконтролируемое машинное обучение для начинающих
В моей предыдущей статье Машинное обучение с учителем для начинающих упоминалось, что такое машинное обучение. Здесь я хотел бы поговорить об неконтролируемом машинном обучении .
Прежде чем перейти к этой теме, я кратко коснусь статистики. Статистика включает в себя группировку, организацию и осмысление сложных данных в среде, где вам необходимо понимать информацию.
Когда дело доходит до проделанной работы, очень важно определить цель, деятельность, необходимую для цели,..
Освоение анализа главных компонентов с помощью геометрической интуиции: пошаговое руководство по…
Если вы занимаетесь анализом данных или энтузиастом машинного обучения, вы, вероятно, когда-то сталкивались с анализом основных компонентов (АПК). Но сталкивались ли вы с трудностями, пытаясь полностью понять концепцию и ее приложения? PCA может быть мощным инструментом для уменьшения размерности, но его сложность часто может быть препятствием для многих людей. С таким количеством ресурсов, доступных в Интернете, может быть сложно найти четкое и краткое руководство по пониманию и..
Измерение и объяснение межкластерной надежности многомерных проекций
Сью Хён Пак
Многомерные или многомерные данные содержат подробную информацию о сложных системах. Впечатляющим примером являются данные секвенирования одноклеточной РНК (scRNA-seq) . Он содержит тысячи атрибутов для объяснения фенотипа отдельной клетки, поскольку количество специфичных для типа клеток паттернов экспрессии генов в любой ткани или типе клеток колеблется от 3000 до 5000 . ».
Чтобы визуализировать и интерпретировать подобные многомерные данные, широко используемый..
Анализ основных компонентов объясняется на примере
Машинное обучение
Анализ основных компонентов объясняется на примере
Интуиция, немного математики и кода
Всем привет! В этом посте мы увидим, как избавиться от слишком большого количества измерений. В предыдущем посте мы узнали, что слишком много измерений может быть проклятием. Так что в каком-то смысле мы научимся снимать проклятия!
Существует множество методов уменьшения размерности, таких как PCA, LDA, t-SNE и так далее. Даже автоэнкодеры используются для преобразования..
Уменьшение размерности: какую проблему оно решает?
Царство действительно больших данных
Люди рождаются со способностями к распознаванию образов, которые позволяют нам с первого взгляда различать закономерности в графических изображениях. Однако можем ли мы визуализировать отношения между сотнями переменных в наших огромных наборах данных? Даже самые передовые методы визуализации данных не выходят за пределы пяти измерений.
Схема: процесс уменьшения размеров
Высокоразмерные данные Уменьшение размерности Методы уменьшения..