Чем aerospike отличается от других баз данных nosql с ключами и значениями? [закрытый]



Aerospike - это ключ-значение, оперативная база данных NoSQL с кислотными свойствами, которая поддерживает сложные объекты и легко масштабируется. Но я уже использовал нечто, что делает абсолютно то же самое.



Redis также является базой данных NoSQL с ключом-значением в памяти (но сохраняемой на диске). Он также поддерживает различные сложные объекты. Но по сравнению с Aerospike, Redis был в использовании в течение длительного времени, уже есть активное сообщество и много проектов, разработанных в оно.



Так в чем же разница между aerospike и другими базами данных ключей-значений no-sql, такими как redis? Есть ли определенное место, которое лучше подходит для аэросайка?



P.S. Я ищу ответ от людей, которые использовали хотя бы один из этих dbs (предпочтительно оба) в реальном мире и имеют реальный жизненный опыт (не копипасты с официального сайта).
1040   5  

5 ответов:

Если на него нужно ответить одним словом, то его "исполнение". Производительность Aerospike намного лучше, чем у любых кластеризованных решений nosql. Более высокая производительность на узел означает меньший кластер, который является более низкой TCO (общая стоимость владения) и обслуживания. Aerospike выполняет автоматическую кластеризацию, автоматический сегмент, автоматическую перебалансировку (при изменении состояния кластера), большинство из которых требует выполнения ручных действий в других базах данных.

Я сказал "clustered", потому что я не хочу смешивать redis в этой группе (хотя redis кластеризация находится в бета-версии). Чистая производительность в памяти Aerospike и redis будет сопоставима. Но Redis ожидает, что многие вещи будут обрабатываться на уровне приложений, таких как сегментирование, перенаправление запросов и т. д. Несмотря на то, что redis имеет способ сохранения (snapshot или AOF), он имеет свои собственные проблемы, поскольку его дизайн больше похож на аддон. Aerospike разрабатывается изначально с упорством в уме. Кластеризация redis также включает в себя настройку master slave и т. д. Возможно, вы захотите взглянуть на это поговорите сравнивая и противопоставляя redis vs aerospike.

Я использовал Redis в течение многих лет, и только что начал использовать Aerospike в качестве замены для него по многим причинам.

Хотя Redis и Aerospike обладают высокой производительностью, основная проблема Redis заключается в том, что он хранит данные только в памяти и не имеет официально выпущенного решения для кластеризации. Он ограничивает размер вашей базы данных размером ОЗУ вашего сервера, в то время как Aerospike может быть настроен на использование SSD для хранения информации без потери скорости вообще. Задержки кврд невероятно низкая, даже с высокой пропускной способностью чтения / записи.

Aerospike лучше всего подходит мне, потому что он способен масштабироваться с производительностью и без тяжелой работы, и отличается от Redis он также предназначен для сохранения ваших данных полностью, минимизируя потерю данных в любом случае. Они выпустили замечательное видео, показывающее, как легко масштабировать и управлять кластером Aerospike, а также как он автоматически настраивается, даже когда есть "катастрофическая" ситуация.

Удивительно, но Redis одна из самых популярных баз данных в памяти не имела автоматического шардинга 3 месяца назад. Они недавно добавили эту функцию. Redi 3.0 имеет автоматический шардинг.

AS поддерживает автоматическую кластеризацию с помощью функции быстрого перезапуска, где все индексы сохраняются без добавления к пропускной способности, и база данных может быть поднята за пару минут (например, размер БД 50 TBs может быть поднят за пару минут.). Все это может быть достигнуто на товарном оборудовании. Добавление емкость-это не что иное, как добавление нового узла в кластер. Работает в разных центрах обработки данных и облачных средах самое главное, что он работает для любой локальной среды.

Поддерживает создание онлайн-матчей (управление спросом и предложением).

База данных No-SQL должна иметь дело с ситуациями использования в реальном времени для удовлетворения агрессивных SLAs, необходимых сегодняшнему рекламному миру, порталам интернет-магазинов, поставщикам логистических услуг, таким как OLA cab (определение ближайшего такси, которое готово к пикапу и может достичь клиента менее чем за 5 минут вычисляется менее чем за 3 мс), заявки на онлайн-торги(точность 99,7% при завершении AdBid менее чем за 3 мс), системы обнаружения мошенничества и т. д., которые должны идентифицировать вредоносного пользователя менее чем за 5 мс(миллисекунды).

  • Aerospike является кислотой рекордного уровня, что верно для большинства базы данных No-SQL.
  • Aerospike предназначен для кластерной среды,
  • построенный для горизонтального масштабирования,
  • поддержка данных балансировка(автоматическая/ручная),
  • автоматический сегмент-уровень приложения или прозрачный для конечного пользователя.

Aerospike-это хранилище ключей и значений с открытым исходным кодом в реальном времени, без SQL. Встроенный в C с нуля, потому что тогда есть способы, в которых БД пишется, чтобы воспользоваться преимуществами аппаратного обеспечения, сети, SSD, памяти и ядра. Оптимизирован для SSD / флэш-накопителей причина в том, что SSD-это будущее устройств хранения данных, в то же время он работает на жестких дисках (вращающихся дисководах) SSD обеспечивает параллельные каналы в зависимости от поставщика SSD, который может выбрать использование 8,16 32 и так далее. SSD имеют износ, если одно и то же расположение блока записывается и стирается. В случае SSD вы пишете в терминах блоков, SSD используется как файловая система no в качестве хранилища блоков и используется в качестве кольцевого буфера, то есть вы пишете в начале кольцевого буфера и продолжаете добавлять данные в следующий , следующий , следующий до конца диска. Как только Вы дойдете до конца, вы вернетесь в первое место блока. а затем продолжайте в том же духе, который гарантирует, что 1-е место будет использоваться не наибольшее количество раз, но равное количество времени.

Кластеризация или назовем ее автоматической кластеризацией. Добавление узла и привести его в кластер происходит в

Что такое алгоритм Паксоса?

Http://www.quora.com/Distributed-Systems/What-is-a-simple-explanation-of-the-Paxos-algorithm

RIPE160MD#, который предоставляет 20 байт 160bit # гарантированно будет уникальным и

# - нормальное распределение 4K,

Каждое пространство имен поддерживает свои деревья разделов, каждое пространство имен имеет идентификатор раздела, каждый раздел имеет b-дерево.

Модель Хранения

В базе данных памяти: все хранится в DRAM эффективно высокая производительность и высокая стоимость.

Дисковое хранилище: первичный и 2dary индексы хранятся в DRAM, данные идут на SSD или HDD. Что означает оптимальное использование SSD, но немного медленнее, чем DRAM, но по крайней мере ~10 раз дешевле, чем DRAM.

Гибридное хранилище: Все, что хранится в DRAM. Данные сохранялись на SSD или HDD. Производительность DRAM поддерживается сохраняемостью SSD или HDD. Более высокая стоимость драма без потери производительности.

Бенчмарк

1,6 миллиона TPS с YCSB (Yahoo cloud source benchmark) на 4 узлах, в памяти.

Гарантия производительности SSD, предоставленная Aerospike:

ACT (Aerospike Compliance test): Он определен и разработан для тестирования производительности SSD. Сегодня это std или сертификация для SSD. Intel опубликовала в своем блоге сообщение о том, что они являются единственными поставщиками SSD в мире, которые поддерживают 1 миллион TPS с помощью ACT.

Google cloud проделал определенную работу по отображению пропускной способности вычислительного движка google. Google опубликовал в своем блоге, что Cassandra берет 300 узлов, чтобы произвести, что как это делает с 50 узлами.

Кврд сделок с в режиме реального времени проблемы в очень эффективной манере.

Langit Линн только что выпустила очень полная голова к голове эталоном в Кврд и Redis для работы в разных конфигурациях на облаке AWS. Ее резюме: "TL; DR-в масштабе Aerospike выигрывает ".

Очень интересно, как она пришла к такому выводу. Она дает пошаговые инструкции о том, как она добилась своих результатов для других, желающих получить представление о том, как сделать свои собственные критерии эффективности. Тесты должны были быть настроены как для чистого хранилища данных ОЗУ, так и для SSD постоянная база данных.

Ее ключевые наблюдения:

  • Aerospike работает так же быстро, как Redis с частотой около 1 MTPS для 100% рабочих нагрузок чтения на одном узле на AWS R3.8xlarge с отсутствием персистентности.
  • Aerospike немного быстрее Redis для 100/0 и 80/20 рабочих нагрузок чтения/записи против одного узла, поддержанного хранилищем EBS SSD (gp2) для сохранения.

Когда вы учитываете отказоустойчивость и то, как Aerospike self исцеляется, когда вы выдергиваете вилку питания из любой стойки в центре обработки данных, оставаясь производительностью в миллион операций чтения в секунду на узел без координатора трафика, так что вы всегда максимизируетесь на коммутаторе или другом оборудовании (если только вы не уменьшаете агрегаты карт), я имею в виду, что ничто другое не приближается к самобалансированной динамической аналитике в реальном времени с защищенными данными. Все остальные платформы требуют от вас гибридизации, чтобы получить все ваши атрибуты прямо в треугольнике шапки. Без буферизации или очередей, без кэша для данных, призраки больше не являются категорией. Так много преимуществ помимо того, чтобы быть лучшим исполнителем. Нам просто нужно это признать. Кврд восхитительно смешно!

Comments

    Ничего не найдено.