Cześć. Wymagania są takie, aby baza danych zapewniała szybkie odczyty i pozwalała przechowywać petabajty danych.
Prawdopodobnie będą to dwie bazy. Obie mają przechowywać wszytkie zdarzenia zachodzące w systemie (miliony dziennie) dotyczące klientów oraz pracowników.
Jedna baza ma trzymać skrócone dane i zapewniać odczyty po kilku określonych od początku atrybutach. Druga natomiast ma trzymać pełne szczegółowe dane i umożliwiać odczyty po wielu różnych zapytaniach (elastyczne podejście) oraz udostępniać analityki.
Dla pierwszej bazy wstępnie myślę o Cassandrze lub Big Table od Google.
Dla drugiej Elasticsearch lub Big Query również od Google.
Koszty nie grają roli.
Co o tym sądzicie?
Ktoś bardziej doświadczony w takich obszarach mógłby się bardziej wypowiedzieć?
Z góry dzięki :)