Публикации по теме 'spark-mllib'


Набор данных Spark поверх рабочего пространства GoodData
В этом примере показано, как создать набор данных Spark поверх рабочего пространства GoodData. Когда у вас есть данные в наборе данных Spark, вы можете использовать все возможности Spark для обработки данных, включая преобразование данных, машинное обучение и т. д. Набор данных использует рабочую область, созданную в этом руководстве . Настраивать В примере требуется файл конфигурации .gooddata , расположенный в вашем домашнем каталоге. Файл имеет такую ​​структуру: {..

Распараллеливайте свои массивные вычисления SHAP с помощью MLlib и PySpark.
Пошаговое руководство по эффективному объяснению ваших моделей с помощью SHAP. Введение в MLlib Библиотека машинного обучения Apache Spark (MLlib) предназначена в первую очередь для обеспечения масштабируемости и скорости за счет использования среды выполнения Spark для распространенных распределенных случаев использования в обучении с учителем, таком как классификация и регрессия, обучении без учителя, таком как кластеризация и совместная фильтрация, а также в других областях...

Понимание машин опорных векторов
[Предоставлено Raghu из Knoldus, Канада] Одним из важных и популярных методов классификации среди алгоритмов машинного обучения являются машины опорных векторов. Это также называется классификацией с большой маржой. Метод опорных векторов приводит к гиперплоскости, которая разделяет и, следовательно, классифицирует выборки на два разных класса. В результате SVM получается такая плоскость, которая не только разделяет образцы, но и делает это с максимально возможным разделением...