Кассандра выбрасывает память

В нашей тестовой среде у нас есть кластер cassandra с 1 узлом с RF = 1 для всех пространств ключей.

Представляющие интерес аргументы VM перечислены ниже.

-XX: + CMSClassUnloadingEnabled -XX: + UseThreadPriorities -XX: ThreadPriorityPolicy = 42 -Xms2G -Xmx2G -Xmn1G -XX: + HeapDumpOnOutOfMemoryError -Xss256k -XX: StringTableXMemoryError -Xss256k -XX: StringTableXMemorySize = 100000 -XX: Коэффициент выживаемости = 8

Мы заметили, что полный сборщик мусора происходит часто, а кассандра не отвечает во время сборки мусора.

INFO  [Service Thread] 2016-12-29 15:52:40,901 GCInspector.java:252 - ParNew GC in 238ms.  CMS Old Gen: 782576192 -> 802826248; Par Survivor Space: 60068168 -> 32163264

INFO  [Service Thread] 2016-12-29 15:52:40,902 GCInspector.java:252 - ConcurrentMarkSweep GC in 1448ms.  CMS Old Gen: 802826248 -> 393377248; Par Eden Space: 859045888 -> 0; Par Survivor Space: 32163264 -> 0

Мы получаем java.lang.OutOfMemoryError с указанным ниже исключением

ERROR [SharedPool-Worker-5] 2017-01-26 09:23:13,694 JVMStabilityInspector.java:94 - JVM state determined to be unstable.  Exiting forcefully due to:
java.lang.OutOfMemoryError: Java heap space
        at java.nio.HeapByteBuffer.<init>(HeapByteBuffer.java:57) ~[na:1.7.0_80]
        at java.nio.ByteBuffer.allocate(ByteBuffer.java:331) ~[na:1.7.0_80]
        at org.apache.cassandra.utils.memory.SlabAllocator.getRegion(SlabAllocator.java:137) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.utils.memory.SlabAllocator.allocate(SlabAllocator.java:97) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.utils.memory.ContextAllocator.allocate(ContextAllocator.java:57) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.utils.memory.ContextAllocator.clone(ContextAllocator.java:47) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.utils.memory.MemtableBufferAllocator.clone(MemtableBufferAllocator.java:61) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.db.Memtable.put(Memtable.java:192) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.db.ColumnFamilyStore.apply(ColumnFamilyStore.java:1237) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.db.Keyspace.apply(Keyspace.java:400) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.db.Keyspace.apply(Keyspace.java:363) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.db.Mutation.apply(Mutation.java:214) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.service.StorageProxy$7.runMayThrow(StorageProxy.java:1033) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.service.StorageProxy$LocalMutationRunnable.run(StorageProxy.java:2224) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:471) ~[na:1.7.0_80]
        at org.apache.cassandra.concurrent.AbstractTracingAwareExecutorService$FutureTask.run(AbstractTracingAwareExecutorService.java:164) ~[apache-cassandra-2.1.8.jar:2.1.8]
        at org.apache.cassandra.concurrent.SEPWorker.run(SEPWorker.java:105) [apache-cassandra-2.1.8.jar:2.1.8]
        at java.lang.Thread.run(Thread.java:745) [na:1.7.0_80]

Мы смогли восстановить кассандру после выполнения ремонта nodetool.

статус nodetool

Датацентр: DC1

Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address     Load       Tokens  Owns    Host ID                               Rack
UN  10.3.211.3  5.74 GB    256     ?       32251391-5eee-4891-996d-30fb225116a1  RAC1

Примечание: несистемные пространства ключей не имеют одинаковых настроек репликации, эффективная информация о владении бессмысленна.

информация об инструменте

ID                     : 32251391-5eee-4891-996d-30fb225116a1
Gossip active          : true
Thrift active          : true
Native Transport active: true
Load                   : 5.74 GB
Generation No          : 1485526088
Uptime (seconds)       : 330651
Heap Memory (MB)       : 812.72 / 1945.63
Off Heap Memory (MB)   : 7.63
Data Center            : DC1
Rack                   : RAC1
Exceptions             : 0
Key Cache              : entries 68, size 6.61 KB, capacity 97 MB, 1158 hits, 1276 requests, 0.908 recent hit rate, 14400 save period in seconds
Row Cache              : entries 0, size 0 bytes, capacity 0 bytes, 0 hits, 0 requests, NaN recent hit rate, 0 save period in seconds
Counter Cache          : entries 0, size 0 bytes, capacity 48 MB, 0 hits, 0 requests, NaN recent hit rate, 7200 save period in seconds
Token                  : (invoke with -T/--tokens to see all 256 tokens)

Из System.log я вижу много компактных больших разделов

WARN  [CompactionExecutor:33463] 2016-12-24 05:42:29,550 SSTableWriter.java:240 - Compacting large partition mydb/Table_Name:2016-12-23 00:00+0530 (142735455 bytes)
WARN  [CompactionExecutor:33465] 2016-12-24 05:47:57,343 SSTableWriter.java:240 - Compacting large partition mydb/Table_Name_2:22:0c2e6c00-a5a3-11e6-a05e-1f69f32db21c (162203393 bytes)

Для Tombstone я заметил ниже в system.log

nodetool tpstats

Есть ли какая-нибудь конфигурация YAML / другой, которая будет использоваться, чтобы избежать "большого уплотнения"

Pool Name                    Active   Pending      Completed   Blocked  All time blocked
CounterMutationStage              0         0              0         0                 0
ReadStage                        32      4061       50469243         0                 0
RequestResponseStage              0         0              0         0                 0
MutationStage                    32        22       27665114         0                 0
ReadRepairStage                   0         0              0         0                 0
GossipStage                       0         0              0         0                 0
CacheCleanupExecutor              0         0              0         0                 0
AntiEntropyStage                  0         0              0         0                 0
MigrationStage                    0         0              0         0                 0
Sampler                           0         0              0         0                 0
ValidationExecutor                0         0              0         0                 0
CommitLogArchiver                 0         0              0         0                 0
MiscStage                         0         0              0         0                 0
MemtableFlushWriter               0         0           7769         0                 0
MemtableReclaimMemory             1        57          13433         0                 0
PendingRangeCalculator            0         0              1         0                 0
MemtablePostFlush                 0         0           9279         0                 0
CompactionExecutor                3        47         169022         0                 0
InternalResponseStage             0         0              0         0                 0
HintedHandoff                     0         1            148         0                 0

Какую правильную стратегию уплотнения следует использовать? Может OutOfMemory из-за неправильной стратегии сжатия

В одном из пространств ключей мы записываем один раз и читаем несколько раз для каждой строки.

Для другого пространства ключей у нас есть данные типа Timeseries, где они только вставляются и выполняются многократные чтения.

Увидев это: Память кучи (МБ): 812.72 / 1945.63 говорит мне, что ваша 1 машина, вероятно, недостаточно заряжена. Есть хороший шанс, что вы не сможете угнаться за GC.

cassandra garbage-collection cassandra-2.1

Vinod Jayachandran 31.01.2017 источник

comment

Не могли бы вы сообщить мне, как мне получить запрошенную информацию о шаблонах доступа, модели данных и размере полезной нагрузки? Есть ли для этого какие-то специальные команды nodetool? - Aaron 31.01.2017

Ответы (1)

arrow_upward
1
arrow_downward

Хотя в этом случае я думаю, что это, вероятно, связано с недостаточным размером - шаблоны доступа, модель данных и размер полезной нагрузки также могут повлиять на сборщик мусора, поэтому, если вы хотите обновить свое сообщение этой информацией, я могу обновить свой ответ, чтобы отразить это .

ИЗМЕНИТЬ, чтобы отразить новую информацию

Благодарим за добавление дополнительной информации. Основываясь на том, что вы опубликовали, я сразу заметил две вещи, которые могут привести к взрыву вашей кучи:

Большой раздел:

Похоже, что при сжатии пришлось сжать 2 раздела размером более 100 МБ (140 и 160 МБ соответственно). Обычно это все равно нормально (не очень хорошо), но поскольку вы работаете на оборудовании с недостаточным питанием и с такой небольшой кучей, это довольно много.

Дело в уплотнении

При работе он использует здоровый набор ресурсов. Это обычное дело, так что это то, что вам следует проверить и спланировать. В этом случае я уверен, что уплотнение работает тяжелее из-за большого раздела, который использует ресурсы ЦП (необходимые для сборки мусора), кучу и ввод-вывод.

Это подводит меня к другому вопросу:

Обычно это признак того, что вам нужно либо увеличивать, либо уменьшать масштаб. В вашем случае вы можете сделать и то, и другое. Вы можете довольно быстро исчерпать один узел с недостаточным питанием с помощью неоптимизированной модели данных. Вы также не сможете ощутить нюансы распределенной системы при тестировании в среде с одним узлом.

Pool Name                    Active   Pending      Completed   Blocked  All time blocked
CounterMutationStage              0         0              0         0                 0
ReadStage                        32      4061       50469243         0                 0

Итак, TL; DR:

Для тяжелой рабочей нагрузки чтения (которая, похоже, так и есть) вам понадобится куча большего размера. Для полной работоспособности и работоспособности кластера вам необходимо пересмотреть свою модель данных, чтобы убедиться в правильности логики разделения. Если вы не знаете, как и зачем это делать, я предлагаю потратить некоторое время здесь: https://academy.datastax.com/courses

К вашему сведению, запуск

Pool Name                    Active   Pending      Completed   Blocked  All time blocked
CounterMutationStage              0         0              0         0                 0
ReadStage                        32      4061       50469243         0                 0

в кластере с одним узлом вам не поможет, потому что у него нет других узлов для потоковой передачи данных в / из.

MarcintheCloud 31.01.2017

comment

шаблоны доступа и размер полезной нагрузки - это то, о чем должен знать разработчик приложения. Вы можете запустить _1_, чтобы получить схему, и вы также можете посмотреть /var/log/cassandra/system.log, чтобы найти такие вещи, как «большой раздел» и «надгробие». - Vinod Jayachandran; 31.01.2017

comment

Привет! Добавлена дополнительная информация к вопросу в соответствии с вашим предложением. - MarcintheCloud; 31.01.2017

comment

[main] 2016-12-28 18: 23: 06,534 YamlConfigurationLoader.java:135 - Конфигурация узла: [Authenticator = PasswordAuthenticator; authorizer = CassandraAuthorizer; auto_snapshot = true; batch_size_warn_threshold_in_kb = 5; batchlog_replay_throttle_in_kb = 1024; cas_contention_timeout_in_ms = 1000; client_encryption_options =; cluster_name = bankbazaar; column_index_size_in_kb = 64; commit_failure_policy = игнорировать; commitlog_directory = / var / cassandra / журнал / commitlog; commitlog_segment_size_in_mb = 32; commitlog_sync = периодический; commitlog_sync_period_in_ms = 10000; compaction_throughput_mb_per_sec = 16; concurrent_counter_writes = 32; concurrent_reads = 32; concurrent_writes = 32; counter_cache_save_period = 7200; counter_cache_size_in_mb = ноль; counter_write_request_timeout_in_ms = 15000; cross_node_timeout = ложь; каталог_файлов_данных = [/ cryptfs / sdb / cassandra / data, / cryptfs / sdc / cassandra / data, / cryptfs / sdd / cassandra / data]; disk_failure_policy = best_effort; dynamic_snitch_badness_threshold = 0,1; dynamic_snitch_reset_interval_in_ms = 600000; dynamic_snitch_update_interval_in_ms = 100; endpoint_snitch = GossipingPropertyFileSnitch; hinted_handoff_enabled = true; hinted_handoff_throttle_in_kb = 1024; incremental_backups = ложь; index_summary_capacity_in_mb = ноль; index_summary_resize_interval_in_minutes = 60; inter_dc_tcp_nodelay = ложь; internode_compression = все; key_cache_save_period = 14400; key_cache_size_in_mb = ноль; listen_address = 127.0.0.1; max_hint_window_in_ms = 10800000; max_hints_delivery_threads = 2; memtable_allocation_type = heap_buffers; native_transport_port = 9042; num_tokens = 256; partitioner = org.apache.cassandra.dht.Murmur3Partitioner; permissions_validity_in_ms = 2000; range_request_timeout_in_ms = 20000; read_request_timeout_in_ms = 10000; request_scheduler = org.apache.cassandra.scheduler.NoScheduler; request_timeout_in_ms = 20000; row_cache_save_period = 0; row_cache_size_in_mb = 0; rpc_address = 127.0.0.1; rpc_keepalive = правда; rpc_port = 9160; rpc_server_type = синхронизация; saved_caches_directory = / var / cassandra / data / сохраненные_caches; seed_provider = [{имя_класса = org.apache.cassandra.locator.SimpleSeedProvider, параметры = [{семена = 127.0.0.1}]}]; server_encryption_options =; snapshot_before_compaction = false; ssl_storage_port = 9001; sstable_preemptive_open_interval_in_mb = 50; start_native_transport = правда; start_rpc = true; storage_port = 9000; thrift_framed_transport_size_in_mb = 15; tombstone_failure_threshold = 100000; tombstone_warn_threshold = 1000; trickle_fsync = ложь; trickle_fsync_interval_in_kb = 10240; truncate_request_timeout_in_ms = 60000; write_request_timeout_in_ms = 5000] - Vinod Jayachandran; 01.02.2017

Кассандра выбрасывает память

Ответы (1)

Вопросы по теме