Relationale Datenbanken bieten verschiedene Szenarien: Entweder halten Unternehmen ihre Daten an einem einzigen Ort und ihre Kunden müssen längere Wartezeiten in Kauf nehmen oder sie betreiben die Datenbanken doppelt. International tätige Unternehmen benötigen jedoch eine globale Datenverfügbarkeit und die Fähigkeit zu Wachstum, ohne dass zusätzliche Kosten entstehen.
Den Lösungsansatz liefert das Datenbankschema NoSQL, das keine relationale Beschreibung der Daten aufweist. Die spaltenorientierte NoSQL-Datenbank Apache Cassandra basiert auf Java, verfügt anstatt der Master- und Named-Nodes über symmetrische Knoten, die in Clustern organisiert sind. Das System eignet sich als Echtzeit-Datenspeicher für Online-Anwendungen mit vielfältigen Transaktionen. Es lässt sich auch als leseintensive Datenbank für Business-Intelligence-Systeme einsetzen. Die Abfragesprache "Cassandra Query Language" (CQL) erinnert in Syntax und Keywords stark an SQL.
Die Geschichte von Apache Cassandra begann bereits 2007, als die Facebook-Ingenieure Prashant Malik und Avinash Lakshman eine sehr frühe Version für die Inbox-Suche von Facebook entwickelten. Die Herausforderung bestand in den riesigen Datensätzen, die auf Hunderten von Servern lagen. Im nächsten Jahr veröffentlichte Facebook Cassandra auf Google Code und machte es damit zu einem Open-Source-Projekt. 2009 wurde es zu einem Apache-Inkubator-Projekt, was den Weg zu einem Top-Level-Projekt der Apache Foundation ebnete. Mittlerweile haben viele bekannte Unternehmen Cassandra oder dessen kommerzielle Version ("DataStax Enterprise") implementiert. Unter anderen vertrauen Apple, Netflix, Twitter, Sony, eBay, Walmart oder FedEx der Clouddatenbank.
Für die Anwender bildet die NoSQL-Datenbank die Grundlage für extrem skalierbare Echtzeitanwendungen. Zur Erhöhung der
...Der komplette Artikel ist nur für Abonnenten des ADMIN Archiv-Abos verfügbar.