Публикации по теме 'spark-sql'
Практическая реализация машинного обучения с использованием SparkMLlib — Часть 3
Это третья часть серии Apache spark, в которой мы увидим практическую реализацию одной задачи машинного обучения. если вы не читали мои предыдущие посты о искровых сериях, пожалуйста, посетите их, прежде чем читать эту статью.
Введение
Spark ML и Spark MLlib — это библиотеки машинного обучения, созданные на основе Apache Spark, платформы обработки больших данных с открытым исходным кодом. Эти библиотеки предоставляют масштабируемые, распределенные реализации многих..
Проблема SQL решена с помощью Pyspark !!
Spark позволяет сделать это легко, т. Е. Создавать пользовательские функции и использовать их в SQL.
Все еще думаете, позвольте мне научить вас простому и увлекательному способу самостоятельного изучения и создания определяемых пользователем функций.
Проблема: создание функции, которая принимает один ввод и предоставляет квадрат числа, которое передается функции в качестве параметра.
def squared_func(s):
return s * s
spark.udf.register("squaredWithPython", squared_func)..