Я рассматриваю Доказательство концепции для обработки больших объемов данных, таких как> 10 Гб, для чего требуется как минимум 200+ операций записи в секунду и около 50+ операций чтения пространственных данных в секунду. Это тоже растущая система. В настоящее время я рассматриваю возможность переноса данных большого объема в базу данных типа большой таблицы NoSql по соображениям производительности.
Я рассмотрел и внимательно рассмотрел MongoDB и кассандру. Насколько я понимаю,
Mongodb: - похоже, проблема с блокировкой писателя - один из сообщений в stackoverflow предложил эту базу данных, если нет необходимости в нескольких серверах - индексы хранятся в памяти. Таким образом, чем больше рост индекса, тем хуже производительность - преимущество в том, что Mongodb имеет прямую поддержку пространственных данных и индексации наряду с такими функциями, как поиск ближайших местоположений и т. Д. - Я вижу этот пост Cassandra или MongoDB для нашего приложения, основанного на местоположении, предлагая mongodb как лучший выбор
Cassandra:
- Кажется, лучший из связанных БД - Похоже, имеет отличную производительность записи, а также чтения - Не поддерживает изначально пространственное индексирование, но его можно расширить с помощью геохеширования
Мне очень нравится mongodb из-за его хорошей документации и прямой поддержки пространственных данных. Был ли у кого-нибудь плохой опыт использования mongodb для таких больших систем? На самом деле я вижу много сообщений о производительности mongodb iostat.
Если mongodb не подходит, может ли кто-нибудь дать некоторые советы по геохешированию с использованием кассандры? Я увидел ссылку http://code.google.com/p/geospatialweb/ для создания хеши. Но есть вопросы, как делать запросы и т. Д.?