Как Apache Cassandra обеспечивает масштабируемость и безопасность данных
Apache Cassandra — это распределенная система управления базами данных, предназначенная для обработки больших объемов данных в нескольких центрах обработки данных и в облаке. Ключевые особенности включают в себя:
- Высокая масштабируемость
- Предлагает высокую доступность
- Не имеет единой точки отказа. Это база данных NoSQL, предлагающая множество вещей, которые не могут предложить другие NoSQL и реляционные базы данных.
- Это база данных NoSQL, предлагающая множество вещей, которые не могут предложить другие NoSQL и реляционные базы данных.
История
Cassandra была разработана в Facebook для функции поиска входящих сообщений. Facebook открыл исходный код в 2008 году, а Cassandra стала частью Apache Incubator в 2009 году. С начала 2010 года это был проект Apache высшего уровня. В настоящее время он является ключевой частью Apache Software Foundation, и его может использовать любой, кто хочет извлечь из этого пользу.
Преимущества Cassandra
Cassandra выделяется среди систем баз данных и предлагает некоторые преимущества по сравнению с другими системами. Его способность обрабатывать большие объемы делает его особенно выгодным для крупных корпораций. В результате в настоящее время он используется многими крупными компаниями, включая Apple, Facebook, Instagram, Uber, Spotify, Twitter, Cisco, Rackspace, eBay и Netflix.
Так что же делает его универсальным и простым в использовании?
- Служба высокой доступности без единой точки отказа
- Обработка огромного объема данныхˀ
- Эффективность в параллельных операциях чтения и записи
- Структурная гибкость (горизонтальное масштабирование)
- Гибкое хранение данных (структурированное, неструктурированное)
- Поддержка свойств ACID
- 7. Простое распределение данных между несколькими центрами обработки данных.
Давайте разберемся, как работает Cassandra, выполнив эти 6 простых шагов:
1. Это одноранговый распределенный режим проектирования на базе DynamoDB. и его модель данных основана на Google Big Data Table
2. одноранговые узлы — это кластер узлов, который принимает запросы на чтение и запись без понятия какого-либо главного узла.
3. Кластеры представляют собой полный набор действующих центров обработки данных, где данные хранятся для обработки, а узлы группируются среди центров обработки данных.
4. Всякий раз, когда требуется дополнительное место. Узлы добавляются в кластер, который. система результатов является расширяемой и может обрабатывать одновременных пользователей среди распределенных. системы.
5. С точки зрения безопасности это помогает обеспечить целостность данных с помощью журнала фиксации. Журналы фиксации предотвращают потерю данных и обеспечивают механизм резервного копирования.
Memtable записывает индексированные данные из журналов коммитов и поддерживает 1 активную memtable/таблицу.
6. Все memtable имеют пороговое значение, когда этот порог достигается, записи сбрасываются на жесткий диск сервера и становятся неизменяемыми SSTable.
Более или менее он обеспечивает 0 отказоустойчивых приложений с высокой доступностью и нулевым временем простоя.