Pure Storage kündigt All-Flash-Plattform für Big Data an
All-Flash-Storage kommt derzeit für die Verarbeitung strukturierter Daten in Datenbanken, Anwendungen und VMs zum Einsatz. Pure Storage, Pionier in dem Segment, hat mit FlashBlade ein Angebot vorgestellt, mit dem sich auch große Mengen unstrukturierter Daten speichern und nahezu latenzfrei zugänglich machen lassen.
Pure Storage hat mit FlashBlade ein außergewöhnlich skalierbares, auf Flash-Speicher basierendes Storage-Produkt für den Einsatz in Cloud- und Big-Data-Szenarien angekündigt. FlashBlade wird derzeit zusammen mit ersten Kunden erprobt und soll Anfang 2017 allgemein verfügbar werden.
FlashBlade ist als Basis für Storage-Lösungen für File-, Objekt- und Container-Daten, etwa zusammen mit Hadoop, Docker oder Spark gedacht mit wird dann das bisherige Appliance-Portfolio von Pure Storage ergänzen. Das bleibt auf Storage für block-basierende Daten und virtuelle Maschinen ausgerichtet. Damit nimmt Pure Storage dann für sich in Anspruch, für seine Kunden als erster Anbieter ein tatsächlich komplett auf Flash-Technologie basierendes Rechenzentrum umsetzen zu können.
Ähnlich wie bisher bei seinen Flash-Arrays stellt Pure Storage auch bei FlashBlade Einfachheit bei Implementierung, Bedienung und Verwaltung, das klare, allerdings nicht endgültig feststehende Preismodell sowie die unkomplizierten Erweiterungsmöglichkeiten in den Vordergrund. Allerdings liegt die Einstiegshürde etwas höher: Das kleinste Modell der FlashBlade-Reihe wird voraussichtlich mit sieben Blades ausgeliefert werden, von denen jedes, je nach gewählter Option, 8 oder 52 TByte Speicher bietet und die zur Skalierung der Rechenleistung erforderliche Computing-Power, für die Pure Storage auf Intel-Xeon-Prozessoren setzt, gleich mitbringt.
Damit richtet sich dann bereits das kleinste FlashBlade, das im Rack vier Höheneinheiten einnimmt, an Unternehmen, die zwischen 74 und 443 TByte „verfügbarem“ Speicherplatz benötigen. Tatsächlich sind zwischen 62 und 372 TByte vorhanden, Pure Storage rechnet aber durch seine Komprimierungstechnologien mit einer Reduzierung des Datenvolumen auf mindestens ein Drittel – und verspricht je nach Anwendung oft sogar deutlich mehr. Voll bestückt mit 15 Blades erreicht eine FlashBlade-Einheit zwischen 132 und 792 TByte Rohdaten-Speicherkapazität, in einem Rack bringt Pure Storage dann bis zu 16 Petabyte an komprimierten Daten unter.
Die namensgebenden Blades enthalten jeweils Flash-Chips, DRAM sowie NV-RAM-Schutz um zu verhindern, dass Schreibvorgänge durch eine Unterbrechung der Stromversorgung gestört werden. Außerdem bringen sie einen Intel-Xeon-SoC und einen FPGA auf ARM-Basis mit, auf dem die Pure-Storage-eigene Software Elasticity läuft. Die Flash-Chips sind per PCIe mit den Prozessoren verbunden.
Die Blades untereinander sind mit 40 Gigabit-Ethernet verbunden und kommunizieren darüber auch mit den Clients. Um geringe Latenz zu gewährleisten, wird intern auf ein proprietäres Protokoll gesetzt, dass den TCP/IP-Stack umgeht und den Datenverkehr des Speichers, der Clients sowie die Übertragung von Metadaten voneinander trennt. Die einzelnen Chassis sind mit acht 40 GBit/s-Ethernet-Ports sowie 30 GBit/s-Ethernet-Ports ausgerüstet, wobei letztere der internen Kommunikation vorbehalten sind.
Die Elasticity-Software sorgt dafür, dass alles mitskaliert: Speicherkapazität, Metadatenverwaltung, Multi-Protokoll-Unterstützung und das integrierte Software-defined-Networking. Datenreduzierung, Snapshots, Replizierung und Verschlüsselung übernimmt die Elastic Core genannte Software-Komponente.
Mit FlashBlade verspricht Pure Storage “ein flexibles Scale-out-System, mit dem Unternehmen All-Flash-Leistung für viele Petabyte an Datensätzen für weniger als 1 US-Dollar pro GB erhalten.” Außerdem will der Hersteller mit der Neuankündigung über die seiner Ansicht nach in vielen Umgebungen inzwischen erreichten Grenzen traditioneller Lösungen für unstrukturierte Daten, etwa NAS-Filer oder Scale-out-NAS-Systeme, hinausgehen. Die würden ab bestimmten Größenordnung zu langsam für Big Data – insbesondere dann, wenn Big Data wie zum Beispiel von SAP mit seiner HANA-Plattform propagiert, als Basis für “Echtzeit-Business” dienen soll.
Um die ungeheuren Mengen an unstrukturierten Daten jederzeit und immer wieder auf andere Weise gewinnbringend zu analysieren, seine die herkömmlichen Systeme in verschiedener Hinsicht im Nachteil, erklärt Purre Storage: “Zum einen wurden sie für Festplatten, also von Grund auf langsame Medien, entwickelt. Darüber hinaus ist der Metadatenumfang begrenzt, was die Performance selbst bei einer Flash-Nachrüstung einschränkt. Ebenso beinhaltet der traditionelle Skalierungsansatz in der Regel eine Partitionierung von Daten auf Nodes. Dadurch entstehen Datensilos, die Performance-Engpässe und viel zu hohen Verwaltungsaufwand mit sich bringen.”
Diese Grenzen sollen mit FlashBlade nun überwunden werden. Allerdings sind natürlich noch nicht alle Firmen, an sie gestoßen. Im ersten Schritt denkt man bei Pure Storage daher an den Einsatz in Unternehmen, in denen Forschung und Entwicklung Mithilfe von Simulationen im Vordergrund stehen, etwa der Chipfertigung, der Luftfahrtbranche und der Automobilentwicklung oder wenn es um Forschung und Nutzbarmachung selbstfahrender Autos geht. Aber auch für besonders umfassende Analyse-Anwendungen, etwa im Bereich IoT, Big Data Analytics oder native Cloud-Anwendungen sieht Pure Storage Einsatzmöglichkeiten.
Wie bisher setzt Pure Storage auch bei der neuen Produktreihe darauf, dass alle System-Upgrades zur Unterstützung eines größeren Adressbereichs von Grund auf so konzipiert sind, dass sie unterbrechungsfrei ablaufen. FlashBlade ist derzeit im Rahmen des Early Access Programm als Directed-Availability-Release für ausgewählte Workloads verfügbar. Anfragen von Interessenten nimmt der Hersteller über seine Vertriebspartner entgegen.