Die Cloud – viel mehr als eine Dateiablage

Cloudcomputing wird gerne mit dem Ablegen von Daten im Internet gleichgesetzt, vor allem mit dem Ablegen von Dateien, wie es beispielsweise in Dropbox geschieht. Darauf basieren auch die oft geäußerten Befürchtungen, dass Daten aus der Cloud gestohlen werden oder anderweitig verloren gehen können. Dabei hat Cloudcomputing noch weit wichtigere, interessantere Aspekte. 

RALF STECK, FRIEDRICHSHAFEN 

 

Ein wirklich cloudbasiertes System wie das kürzlich neu vorgestellte CAD-System Onshape arbeitet gar nicht mit Dateien, sondern auf Basis einer Datenbank. Die Software läuft ohne lokale Installation auf den Servern des Anbieters, zwischen diesen Rechnern und dem Internetbrowser des Anwenders werden lediglich Bildschirminhalte beziehungsweise Tastatur- und Mausbefehle übertragen.

 

Aktuellste Informationsschnipsel suchen


Diese Systeme speichern Daten nicht in Dateien, sondern in einer Struktur, in der die aktuellsten Informationen einfach an das Ende der Datenbank angehängt und indexiert werden. Ein CAD-Modell ist also beispielsweise nicht in einem zusammenhängenden Speicherbereich abgelegt, sondern das Datenbanksystem sucht beim Aufruf der Daten die jeweils aktuellsten „Informationsschnipsel“ in seiner Datenbank zusammen und liefert sie aus. Das hat eine ganze Reihe von Vorteilen, die eine dateibasierte Datenhaltung nicht bieten kann.


Dazu muss man sich kurz klarmachen, wie die Arbeit mit Dateien technisch funktioniert. Beim Laden einer Datei wird diese von der Festplatte oder einem Server in den Arbeitsspeicher des Arbeitsplatzrechners des Anwenders kopiert. Nun existieren also zwei Versionen der Datei – auf der Festplatte und im Arbeitsspeicher. Letztere wird nun bearbeitet, indem der Anwender beispielsweise an einem CAD-Modell weiterarbeitet. Erst wenn der Anwender seine Arbeit speichert, wird die Dateiversion auf der Festplatte mit der Dateiversion aus dem Arbeitsspeicher überschrieben. Eine Datei wird also immer im Block gelesen und geschrieben.


Dieses Vorgehen hat zwei gravierende Nachteile, die sich beide aus der Tatsache ergeben, dass die Datei zweimal existiert. Zum einen kann – wenn das Betriebssystem des Servers die Datei nicht sperrt – ein zweiter Anwender die Datei vom Server laden und seinerseits bearbeiten. Am Ende wird der Anwender „gewinnen“, der als letzter speichert. Da die Datei immer im Ganzen geschrieben wird, verschwinden die Speicherstände, die der andere Anwender abgelegt hat, spurlos.


Dies ist natürlich in Umgebungen, in denen parallel gearbeitet werden soll, fatal. Moderne PDM-Systeme schaffen hier zum Teil Abhilfe, indem sie genau steuern, dass die Einzelteile einer Baugruppe immer nur von einem Anwender geöffnet werden können. Trotzdem kann eben ein Bauteil immer nur von einem Anwender bearbeitet werden.


Zum anderen sorgt das Vorgehen dafür, dass beim Absturz eines Rechners die gesamte Arbeit bis zum letzten Speichern vergebens war – die gesamte Bearbeitung im Arbeitsspeicher ist verloren, nur der Zustand auf der Festplatte bleibt erhalten. Die aktuellsten Daten liegen immer nur im Arbeitsspeicher, die auf der Festplatte gespeicherten Daten hinken immer mehr oder weniger lange hinterher.

 

Parallel an einem Projekt arbeiten


Cloudsysteme arbeiten anders: Die Daten werden fortlaufend im Cloudspeicher abgelegt; jede einzelne Bearbeitung erzeugt einen Datenbankeintrag, und aus allen Datenbankeinträgen wird beim Öffnen das Modell erzeugt. Datenbankserver sind darauf ausgelegt, dass viele Menschen gleichzeitig mit einer Datenbank arbeiten. So können zwei Kollegen parallel an einem Bauteil arbeiten, es „gewinnt“ zwar wieder immer derjenige, dessen Änderung als letzte gespeichert wird. Aber in diesem Fall geht es nicht um die gesamte Datei, sondern nur um die einzelne Modellieraktion. Und dass dabei zwei Anwender beispielsweise zur exakt gleichen Mikrosekunde an exakt derselben Stelle eine Bohrung setzen möchten – was eine Inkonsistenz verursachen würde – ist doch eher unwahrscheinlich. Collaboration, Zusammenarbeit ist also in ein datenbankbasierendes System quasi eingebaut.


Stürzt ein Rechner des Cloudrechenzentrums ab, übernimmt sofort ein anderer Rechner dessen Aufgaben. Das einzige was der Anwender davon merken könnte, ist eine kurze Verzögerung der Reaktion des Systems – oder haben Sie schon mal einen Absturz bei Google erlebt? Die bearbeiteten Daten, die ja in der Datenbank – die auf einem anderen Server läuft – gespeichert sind, stehen jedenfalls immer weiter zur Verfügung. Es könnte lediglich ein einzelner Bearbeitungsschritt verloren gehen, doch auch das lässt sich abfangen.

 

Management von Dateiversionen


Ein weiteres Abfallprodukt der „Atomisierung“ der Daten ist das Management von Dateiversionen. In der Datenbank werden vorherige Stände nicht überschrieben, sondern die neuen Daten „hinten“ angehängt – ganz analog, wie historienbasierte CAD-Systeme eine Modellieraktion an die andere hängen. Das bedeutet, dass mit entsprechenden Abfragen jeder beliebige Stand der Bearbeitung wiederhergestellt werden kann. Eine Versionierung wie sie manche CAD-Systeme umsetzen, die beim Speichern den bisherigen Stand mit einem Index wegsichern, ist nicht damit zu vergleichen, weil dabei immer nur bestimmte Zeitabschnitte gesichert werden. In der Datenbank ist jedoch jeder einzelne Schritt rekonstruierbar, was den großen Vorteil hat, dass man jederzeit zu einem älteren Stand zurückgehen und eine Alternative weiterverfolgen kann.


Ein positiver Nebeneffekt, den man schon aus PLM-Systemen kennt, ist der Schutz von externen Referenzen, die schnell unbedacht zerstört werden können – einfach, indem man eine Datei verschiebt oder ein Verzeichnis oder die Datei umbenennt.


Gleichzeitig ist die Art, wie Datenbanken Daten ablegen, der beste Schutz gegen Datendiebe und Neugierige. Es ist schlicht unmöglich, ein bestimmtes Modell aus einer Datenbank zu rekonstruieren, wenn man den Index nicht kennt, der die richtigen Informationsschnipsel zusammenführt. Nur wer die Zugangsdaten eines Accounts hat, kann die Daten zusammensetzen. Solange man nur eine normale Verbindung mit der Datenbank hat, kann man nur auf die eigenen Daten zugreifen, nicht auf fremde. Man müsste schon einen direkten Zugriff auf den Datenbankserver in der Cloud haben, um Daten zu stehlen – und das lässt sich durch den Cloudbetreiber sehr wirkungsvoll verhindern.

 

Datensicherung in der Cloud


Die meisten Datendiebstähle passieren übrigens nicht durch Einbruch von außen, sondern durch eigene Mitarbeiter – sei es der entlassene Vertriebsmitarbeiter, der die Kundendatenbank mitnimmt, sei es der Konstrukteur, der aus Bequemlichkeit die kompletten Konstruktionsdaten auf seinem Laptop dabei hat und diesen verliert. Cloudsoftware verhindert auch dies wirksam, da die Daten nie komplett beziehungsweise in einer speicherfähigen Form auf dem lokalen Rechner liegen – der USB-Stick ist schlicht wirkungslos.


Für den mobilen Arbeiter kommt schließlich die Mobilität hinzu – man kann überall, von wo aus man Internetverbindung hat, auf die Daten zugreifen. Und da sich Cloudsoftware in unterschiedlicher Weise implementieren lässt, können auf derselben Datenbasis ganz unterschiedliche Applikationen realisiert werden. Software besteht aus einer Vielzahl von Komponenten – beispielsweise Speichermodul (Datenhandling), Programmlogik, Grafikmodul, Oberfläche –, die jeweils lokal oder in der Cloud laufen können.


So wird man auf leistungsstärkeren Maschinen möglichst viele Komponenten außer dem Datenhandling lokal installieren und ablaufen lassen – dann kann man auch ohne Netzverbindung arbeiten, die Software speichert dann Zwischenstände lokal und gleicht sie bei wieder bestehender Datenverbindung in die Datenbank ab. Auf einem leistungsschwachen Tablet wiederum lässt man lediglich die Benutzeroberfläche laufen und verlagert den kompletten restlichen Rechenbedarf in die Cloud.


Die extremste Ausprägung ist dann die im Browser laufende Software, bei der alle Komponenten in der Cloud laufen und nur der Bildschirminhalt gestreamt wird. So lassen sich alle Geräteklassen und Anforderungen mit verschiedenen Ausprägungen der Cloudsoftware abdecken.


Die Cloud ist viel mehr als ein Datenablageplatz im Internet – Software, die die Möglichkeiten der Cloud wirklich nutzt, bietet viele Vorteile und große Sicherheit. 

www.engineeringspot.de


Beitrag aus [me] 3/2015

 15_3_ENGI_steck_SEI.jpg

 

15_3_TITEL_188.jpg

Gerne können Sie [me] 3/2015 mit weiteren interessanten Beiträgen bestellen:

E-Mail:  cedra@agt-verlag.de          

oder:      Kontaktformular

AGT Verlag Thum GmbH
Teinacher Straße 34
71634 Ludwigsburg

Vertrieb, Frau Beate Cedra
Tel.: 07141/22 31-56

 

 

 

spacer
Online Werbung @ [me]
spacer