Für Analysen optimierte Architektur

Vor der Implementierung eines Analysesystems müssen IT-Abteilungen diese wichtigen Aspekte in Betracht ziehen.

Auf einen Blick

  • Daten direkt beim System für die Verarbeitung zu speichern, kann Zeit und Übertragungskosten sparen.

  • Echtzeitanalyse stellt andersgeartete Anforderungen, die andere Tools erfordern.

  • Die Zugriffskontrolle sollte auf die Vertraulichkeitsstufe der betroffenen Daten abgestimmt sein.

author-image

Von

IT-Führungskräfte müssen entscheiden, wie weit Daten vor ihrer Optimierung und Analyse übertragen werden sollten. Die zwei praktikabelsten Optionen haben beide Stärken und Schwächen.

Andererseits kann das Durchforsten von Rohdaten die Analyse verlangsamen, und es gilt zu beachten, dass Datenseen zwangsläufig Daten speichern, die letztendlich nicht benötigt werden.

Für Patricia Florissi, Global Chief Technology Officer for Sales und Distinguished Engineer bei EMC, überwiegen die Vorteile.

„Man sollte Analysen durchführen können, ohne die Daten an einen anderen Ort zu verschieben“, sagt sie.

In seinen Datensee-Lösungen speichert EMC Rohdaten aus unterschiedlichen Quellen in verschiedenen Formaten. Durch diesen Ansatz haben Analysten Zugriff auf mehr Informationen, und sie können Aspekte erkennen, die möglicherweise verloren gehen würden, wenn die Daten zuvor bereinigt oder Teile davon ausgesondert worden wären.

Florissi zufolge benötigt man für umfassende Analysevorhaben eventuell mehrere Datenseen.

Auch der Medienkonzern AOL verwendet nach Aussagen seines Chief Information Officers, James LaPlaine, Datenseen. Die Firma ist täglich in Milliarden von Transaktionen involviert und „die Zeit, die für das Kopieren riesiger Datenpools benötigt wird, ist ein Problem“, sagt er. Wenn man Daten in ihrem nativen Format belässt und sie vom Ort ihrer Erfassung direkt in eine Public Cloud verschiebt, vermeidet man die Kosten, die beim Kopieren über das interne Netzwerk entstehen würden.

Wir wollen, dass sich unsere gesamten Daten an einem Ort befinden, damit wir unternehmensweit eine einzige vertrauenswürdige Quelle haben.

Mike Bojdak, leitender Technikdirektor bei AOL

Welche Art von Datenbank sollte verwendet werden

Die Wahl der richtigen Datenbank für Analyseprojekte spielt eine wichtige Rolle, wobei Faktoren wie die Menge und das Format der Daten sowie die Latenz von Bedeutung sind.

Das Projekt, bei dem Intel einen Datenbankumstieg vollzogen hat, beinhaltete komplexe Abfragen „mit Daten aus einer Reihe nicht korrelierter Quellen“, erklärt Safa. Mit einer SQL-Datenbank dauerte die Abfrage vier Stunden. Mit einer In-Memory-Datenbank waren es gerade einmal 10 Minuten. Er gibt jedoch zu bedenken, dass In-Memory-Datenbanken deshalb nicht für jede Anwendung die richtige Wahl sind. Letztendlich kommt es immer auf die Unternehmensziele an, die mit der jeweiligen Aufgabe angestrebt werden.

Zu Beginn sollte man laut Safa prüfen, ob bei einem Projekt nach Mustern gesucht oder äußerste Genauigkeit gefordert wird.

Bei Projekten, in denen es um das Auffinden von Trends geht, sind seiner Meinung nach verteilte Datenbanken wie Hadoop geeignet, welche Daten in unterschiedlichen Formaten speichern. In diesen Anwendungsfällen werden einige ungenaue Datenpunkte das Ergebnis nicht wesentlich verfälschen.

Auf der anderen Seite, so Safa, „benötigt man 100 Prozent Genauigkeit ohne Latenz, wenn man feststellen möchte, wo sich bestimmte Materialien zu einem bestimmten Zeitpunkt im Fertigungsprozess befinden.“

Hierfür braucht man eine Datenbank mit mehr Struktur oder Steuerungsmöglichkeiten, die für Echtzeitergebnisse optimiert ist. Je nach individuellen Anforderungen könnte sich eine Firma für eine In-Memory-Datenverarbeitung oder eine leistungsorientierte NoSQL-Datenbank entscheiden. Auch wenn sich viele Datenbanktypen für Datenanalysen in Bezug auf ihre Funktionalität überlappen, weichen ihre Eigenschaften deutlich voneinander ab.

Die Klassifizierung von Daten ist... arbeitsintensiv, aber ein wichtiger Aspekt, den man richtig hinbekommen sollte.

James LaPlaine, Chief Information Officer bei AOL