Предложения по хранилищу данных NoSQL, чтобы мы могли легко передавать данные и генерировать отчеты Qlikview в реальном времени?
Это просто означает: 1. Поддержка Qlikview для чтения (mongodb доступный коннектор, в противном случае, возможно, можно записать коннектор JDBC, в противном случае, возможно, можно записать пользовательский коннектор QVX в хранилище данных)
- Легко адаптируется к изменениям в схеме или без схемы. Мы довольно часто меняем нашу схему...
- Поддержка Java для записи
- Сверхбыстрое чтение — добавочный доступ в реальном времени, а также пакетный доступ к старым данным в пределах временного диапазона. Я читал, что Cassandra выделяется диапазонами.
- Достаточно быстро пишет
- Хранилище достаточно больших данных — 20 миллионов строк, хранящихся в день, около 200 байт каждая.
- Было бы неплохо, если бы он мог масштабироваться для данных за годы, эластичность не так важна.
- Простота в использовании, установке и запуске. Глядя на минимальное время установки и настройки.
- Поддержка Matlabe для специальных запросов
Первоначально я не думаю, что нам нужна распределенная система, однако возможен кластер.
Я посмотрел на Mongodb, Cassandra и Hbase. Я не думаю, что переход на REST - хорошая идея из-за (теоретически) более низкой производительности.
В настоящее время я склоняюсь к MongoDB из-за простоты использования, поддержки Matlab, отсутствия схемы, поддержки Qlikview (доступен бета-коннектор). Однако, если кто-то может предложить что-то лучше, это было бы здорово!