Публикации по теме 'clickhouse'


Практическое создание конвейера больших данных — часть 1
Эта статья будет долгой, но ее стоит прочитать. Я хотел бы сказать: “Any Machine Learning project is 80% data engineering and 20% Model Engineering”. Следовательно, если вы посмотрите мое портфолио статей, я много раз концентрировался на различных шаблонах конвейеров данных, которые будут способствовать инженерии данных, эта статья также попадает в эту категорию. Мы сосредоточимся на построении конвейера больших данных и увидим практическую реализацию этого E2E. Основные этапы..

Включение предиктивных возможностей в базе данных ClickHouse
Особая благодарность Роберту Ходжесу из Altinity за его вклад в эту статью. В этом сообщении блога мы рассмотрим, как мы можем интегрировать возможности прогнозирования на основе машинного обучения с базой данных ClickHouse. ClickHouse — это быстрая база данных SQL с открытым исходным кодом, ориентированная на столбцы, которая очень полезна для анализа данных и аналитики в реальном времени. Проект поддерживается и поддерживается компанией ClickHouse , Inc. Мы будем изучать его..

Управление наборами данных ClickHouse с помощью ad-cli
Роберт Ходжес Большие наборы данных имеют решающее значение для всех, кто пробует или тестирует ClickHouse. ClickHouse настолько быстр, что вам обычно требуется не менее 100 миллионов строк, чтобы различать различия при настройке запросов. Кроме того, убийственные функции, такие как материализованные представления, намного интереснее при работе с большими объемами разнообразных данных. Несмотря на важность таких наборов данных для пользователей ClickHouse, существует мало..

Работа с ClickHouse из данных Spring с использованием драйвера MySql
Некоторое время назад мне поставили задачу написать сервис, который вставляет данные в ClickHouse. Моя команда использует Kotlin и Spring Framework, поэтому я решил попробовать Spring Data JDBC в качестве инфраструктуры ORM для ClickHouse. После некоторого исследования я обнаружил, что ClickHouse имеет интерфейс MySql . Таким образом, вероятно, Spring Data JDBC может общаться с ClickHouse с помощью драйвера MySql. К сожалению, Spring Data JDBC не работает с ClickHouse из коробки с..

Вопросы по теме 'clickhouse'

Общие словари Clickhouse
Есть ли способ «совместно использовать» или «реплицировать» словарь на нескольких машинах в одном общем и / или кластере с помощью clickhouse. В настоящее время у меня есть ~ 10 файлов для внешних словарей, загружаемых clickhouse (и несколько...
358 просмотров
schedule 21.05.2022

ClickHouse Spark Connector — зависимость от Scala
Я использую https://github.com/DmitryBe/clickhouse-spark-connector . Я создаю свою банку с помощью сборки sbt после того, как клонировал репозиторий, а затем добавляю свои операторы импорта. import...
2535 просмотров

ClickHouse ЗаменаMergeTree
Пытаюсь понять, как работает ReplacingMergeTree движок. У меня есть следующая таблица, настроенная с таким двигателем. ┌─brand─┬─country─┬─id─────┬────updated─┬─version─┐ │ IM │ FR │ 1 │ 2017-09-29 │ 2 │ │ IM │ FR...
2813 просмотров
schedule 13.05.2023

Не удается подключиться к кликхаусу на удаленном сервере со странным адресом
У меня есть сервер clickhouse, работающий в подсистеме Linux для Windows на сервере Windows 2016. Я установил правила брандмауэра как для входящих, так и для исходящих подключений на 9000 и 8123 портах. Я использовал конфигурацию по умолчанию....
3930 просмотров
schedule 28.07.2023

Как установить часовой пояс сеанса для соединения ClickHouse jdbc?
Могу ли я это сделать? Например, так это выглядит в Postgres: set timezone 5;
1790 просмотров
schedule 13.09.2022

Влияние на производительность запросов SELECT при постоянном заполнении таблицы Clickhouse с помощью INSERT INTO
Таблица Clickhouse, MergeTree Engine, постоянно заполняется запросами «INSERT INTO… FORMAT CSV», начиная с пустого. Средняя скорость ввода 7000 строк в секунду. Вставка выполняется партиями по несколько тысяч строк. Это сильно влияет на...
1402 просмотров
schedule 16.06.2022

Java-класс Zookeeper для автозапуска не найден
У меня есть такая конфигурация zookeeper: autopurge.snapRetainCount=10 autopurge.purgeInterval=1 snapCount=3000000 И мой /opt/zookeeper-3.4.11/data каталог становится большим, никакого autopurge не происходит. Я пытаюсь убрать этот...
472 просмотров
schedule 27.08.2022

Получите один байт в Clickhouse. Невозможно получить очень простую работу с запросами
Запрос SELECT splitByChar('x,y', ','); говорит Получено исключение от сервера (версия 1.1.54385): Код: 0. DB :: Exception: Получено от localhost: 9000, :: 1. DB :: Exception: недопустимый разделитель для функции splitByChar. Должен быть...
114 просмотров
schedule 24.12.2022

Как запросить несколько баз данных в одном запросе select в базе данных clickhouse?
У меня есть база данных clickhouse. Он содержит несколько баз данных. Таблицы внутри баз данных идентичны. Например, в DB1 есть таблица «Таблица1», в DB2 также есть таблица «Таблица1» (здесь базы данных разные, таблицы также разные, но имеют...
897 просмотров
schedule 10.07.2022

«Отдельно» - обычная операция для ClickHouse?
Я хочу использовать ClickHouse для маркетинга. В большинстве случаев они хотят знать не просто, КАК многие люди используют ту или иную функцию, но и точные электронные письма, на которые следует рассылать спам. Является ли это хорошим выбором для...
1154 просмотров
schedule 31.03.2023

Реплика лидерства в Clickhouse
Я хотел бы получить более подробную информацию о лидерстве реплики (т.е. system.replicas.is_leader ) в базе данных ClickHouse. В документации указано следующее: is_leader: Whether the replica is the leader. Only one replica can be the...
733 просмотров
schedule 20.12.2022

Как реализовать накопительную сумму без встроенной функции?
Мне нужно проводить кумулятивное суммирование за каждый день. Например, мой набор данных выглядит следующим образом: buyer | bread | date | --------------------------- b1 | 2 | 2018-01-01| b1 | 3 | 2018-01-02| b1 | 1 |...
532 просмотров
schedule 20.06.2023

Необходимы шаги для реализации распределенного запроса clickhouse
Я установил clickhouse на 2 разных машинах A (96 ГБ ОЗУ, 32 ядра) и B (96 ГБ ОЗУ, 32 ядра), а также настроил реплику с помощью zookeeper. Я могу принимать и извлекать данные с обоих компьютеров, и репликация также работает нормально. Теперь я...
582 просмотров
schedule 04.03.2024

Могу ли я использовать clickhouse в качестве хранилища ключей и значений?
Можно ли использовать clickhouse в качестве key-value хранилища, где данные регулярно перезаписываются, но редко читаются? Какой двигатель следует использовать, если это возможно?
1376 просмотров
schedule 11.07.2023

Присоединяйтесь к теме Clickhouse Kafka:
У меня две (и более) темы Kafka, и мне нужно к ним присоединиться. Мой вопрос из того, что я читал в блогах / StackOverflow .... два варианта: 1) передать их оба, движок Clickhouse Kafka / потоковую передачу искры, в таблицы sperate, а затем...
643 просмотров
schedule 28.12.2022

Вставить все строки из одной таблицы в другую идентичной структуры
Я пытаюсь переместить все содержимое таблицы в другую таблицу с той же структурой. Здесь много строк, поэтому, когда я пытаюсь выполнить это так insert into target_table select * from source_table; Я получаю такую ​​ошибку: ClickHouse...
8763 просмотров
schedule 29.04.2023

Как использовать TTL для таблицы clickhouse?
Читая документацию, я обнаружил, что функция TTL очень удобна для меня. Однако я не могу создать действительный SQL, чтобы задействовать его. Как это сделать: CREATE TABLE t1 ( name String, date DateTime default now(), number UInt64...
3748 просмотров
schedule 17.07.2023

Можно ли обновить первичный ключ в кликхаусе с помощью движка MergeTree?
Я пытаюсь обновить первичный ключ в простой таблице. Когда я выполняю такой запрос: alter table test update id = 2 where id = 1; Я вижу сообщение: Cannot UPDATE key column `id` Есть ли какие-нибудь обходные пути по этому поводу?
2235 просмотров
schedule 20.04.2023

Ошибка семейства неизвестных кодеков ClickHouse при обновлении версии
Я работал над кластером ClickHouse с тремя узлами с таблицей, созданной с помощью ReplicatedMergeTree . Недавно я обновил один из его узлов с версии 18.14.2 до 19.3.7 . Однако после обновления мне не удалось установить соединение с обновленным...
905 просмотров
schedule 03.05.2022

Обновите ClickHouse с 1.1.54231 до 19.6.2.11
Наконец, мы решили обновить наш производственный сервер ClickHouse версии 1.1.54231 до новой версии 19.6. Новая версия запустилась, все конфиги подобрал, данные на сервере тоже видит, но на Zookeeper новые данные забрать не может. В журнале ошибок...
389 просмотров
schedule 05.06.2023