previous next Up Title Contents Index

1.4.2 GIS-Datenmodell


Der Begriff Datenmodell stammt aus der Welt der Datenbankmanagementsysteme (DBMS). Er wird im Kontext Geographischer Informationssysteme sehr uneinheitlich verwendet und insbesondere mit dem Begriff Datenschema vermengt (vgl.[Lee95],[Bar95]).
KEMP stellt den Begriff des Datenmodells dem der Datenstruktur gegenüber, wobei sie eine weitgehende Überlappung zwischen beiden aufzeigt, die in der folgenden Tabelle wiedergegeben ist. Die von ihr lediglich für den zweidimensionalen Raum aufgestellte Einteilung habe ich um eine Spalte für den dreidimensionalen Raum erweitert.

Daten-struktur

Datenmodell


Autokor-
relation



2-D

3-D



Raster

Zellgitter [4]


Zellgitter[5]



konstant
stückweise

Vektor

Polygone

Polyeder

stückweise


Vektor

Triangulated Irregular Network (TIN)

Tetraedical Irregular Network



Oberflächen[6]


Vektor

Isolinien

(Isoflächen)



Vektor oder Raster

Punktgitter

Punktgitter

Stichprobe


Punkte

Vektor

unregelmäßige Punkte

unregelmäßige Punkte



Tab. 1: Vektor- und Rasterbasierte GIS-Datenmodelle (vgl. [Kem93])

Die einzelnen Datenmodelle sind in den folgenden beiden Abschnitten näher beschrieben. Diese Beschreibung folgt im wesentlichen der Beschreibung in[Kem93].
Um die durchaus im GIS-Kontext üblichen Begriffe Vektormodell und Rastermodell zu umgehen, verwende ich die Begriffe vektor- bzw. rasterbasierte GIS-Datenmodelle. Kombiniert ergeben vektor- und rasterbasierte GIS-Datenmodelle die hybriden GIS-Datenmodelle.

Vektorbasiertes GIS-Datenmodell

Der Begriff Vektorbasierte GIS-Datenmodelle leitet sich daher ab, daß der Raumbezug für Objekte durch einen oder mehrere Vektoren - im mathematischen Sinne - im Raum hergestellt wird. Jeder Vektor verfügt im zweidimensionalen Raum über 2 bzw. im dreimdimensionalen Raum über 3 Koordinatenangaben. Wieviele Vektoren zur Bestimmung eines Objekts im Raum benötigt werden, hängt vom Objekt ab: Für Punkt-Objekte wird ein Vektor und für Linien-Objekte werden zwei Vektoren benötigt. Flächen-Objekte werden durch eine Folge von Linien modelliert.
In einem dreidimensionalen Vektorbasierten Datenmodell gibt es auch dreidimensionale Objekte. Sie können durch ihre Kanten, ihre Oberflächen oder ihre Volumina modelliert werden.

Abb. 3: Kantenmodell[7], Oberflächenmodell, Volumenmodell
(aus[Bar95], Abb. 2.7)

Wird von der Geometrie der Objekte, d.h. von ihrer exakten Lage, abstrahiert, so daß nur die relative Lage der Objekte erhalten bleibt, so ergibt sich die Topologie der Objekte. Die Begriffe Punkt, Linie und Fläche haben dann ihre Pendants in den Begriffen Knoten, Kante bzw. Masche. Sind Knoten durch Kanten verbunden, so bilden sie einen Graphen. Ein Graph mit n Knoten ist durch eine n×n-Matrix darstellbar, deren Zeilen- und Spaltennummern als Knotenindices interpretiert werden und deren Elemente angeben, ob eine Kante von Knoteni zu Knotenj existiert.
Reine Linienmodelle sind im wesentlichen zur Modellierung von auf Graphen beruhenden Netzwerken geeignet. Die von ihnen gebildeten Maschen besitzen keine Flächeneigenschaften. Sie können aber zu diesem Zweck mit Polygonmodellen kombiniert werden.
Neben ihren geometrischen und topologischen Eigenschaften besitzen Objekte Attribute, die weitere Eigenschaften beschreiben.
In Polygonmodellen partitionieren Polygone die gesamte betrachtete Fläche in irregulär umrissene Regionen. Der Wert eines betrachteten Phänomens ist innerhalb eines Polygons konstant und ändert sich abrupt an den Polygonkanten (s.[Kem93], S. 109).
Im dreidimensionalen Raum treten Polyeder an die Stelle der Polygone und partitionieren ihn. Der innerhalb eines Polyeders für ein Phänomen konstante Wert ändert sich abrupt an seinen Seitenflächen.
Triangulated Irregular Networks (TINs) partitionieren die gesamte betrachtete Fläche in dreieckige Flächen. Der Wert des betrachteten Phänomens ist nur an den Dreiecksknoten definiert. Dennoch wird dieses Datenmodell oft benutzt, um die Werte zwischen den Knotenpositionen linear zu interpolieren. Wenngleich es keine abrupten Wertänderungen an den Kanten der Flächen gibt, so ändert sich die Neigung, also die erste Ableitung der Flächenfunktion abrupt. Während TINs raumkontinuierliche Oberflächen modellieren, sind sie schlecht geeignet, um kategorische, nicht-numerische Daten zu modellieren.
Partitionierung des Raums in Tetraeder findet Verwendung in Verfahren wie der Finite-Element-Methode, etwa im Bereich der Hydrologischen Modelle. (vgl. [Fre94])
In unregelmäßigen Punktmodellen sind die Werte des betrachteten Phänomens auf Punkte mit unregelmäßig verteilten Positionen beschränkt.
Die Positionen können abhängig (etwa bei repräsentativ ausgewählten Standorten von Meßstationen) oder unabhängig (Wetter-Meßstationen auf Flughäfen) vom betrachteten Phänomen sein. Entsprechend ist die Aussagekraft über die Gebiete zwischen den Punkten durch Interpolation mehr oder minder groß.
Werden unregelmäßige Punkte im dreidimensionalen Raum verwendet, so ist insbesondere die Messung in der Höhe nicht unbedingt im gleichen Maße unabhängig wie über der Fläche. Dies ist etwa bei durch Bohrungen gewonnenen Bodendaten der Fall. Hier liegen die Punkte in Richtung der Höhe auf einer Gerade, während dies entlang der beiden anderen Raumrichtungen nicht der Fall sein muß (Vgl. auch regelmäßige Punktmodelle).
Isolinienmodelle halten im Gegensatz zu den anderen Modellen den Wert des betrachten Phänomens konstant und variieren die Position.
Ein Beispiel für Isolinienmodelle sind Isobaren, also Linien gleichen Luftdrucks.
Das entsprechende dreidimensionale Modell ist das Isoflächenmodell, womit sich etwa der mit der Höhe abnehmende Luftdruck modellieren ließe. So wie Isolinien durch Linienstücke approximiert werden können, so wären Isoflächen durch multiple, TIN-ähnliche Dreiecksflächen approximierbar. Ein Schnitt durch einen durch Isoflächen geteilten Raum liefert eine Ebene mit Isolinien.

Rasterbasiertes GIS-Datenmodell

In Rasterbasierten Modellen beruht der Raumbezug auf einer gleichmäßigen Einteilung des Raumes in gleich große Rasterzellen. Im 2-D-Raum finden in der Regel Rechtecke, häufig sogar Quadrate Verwendung, wenngleich auch Waben oder Dreiecke einsetzbar sind. Im 3-D-Raum werden zumeist Quader mit quadratischen Oberflächen verwendet.
Eine Rasterzelle repräsentiert ein Gebiet mit homogener Bedeutung, d.h. der Wert des betrachteten Phänomens ist innerhalb einer Rasterzelle konstant. Die Größe einer Rasterzelle bestimmt die Auflösung der darstellbaren Objekte. Nach dem SHANNON'schen Abtasttheorem ist die Mindestgröße darstellbarer Objekt begrenzt durch die doppelte Größe einer Rasterzelle.
Eine Variante der Rasterzellen sind regelmäßige Punktgitter. Auch sie beruhen auf einer Einteilung des Raums in gleich große Stücke. Die Punkte sind entweder die Rasterflächenmitten oder die Gitterknoten, entsprechend gibt es für n*m Rasterzellen n*m oder (n+1)*(m+1) Punkte. Die Werte des betrachteten Phänomens sind nur in den Punkten bestimmt, dazwischen jedoch nicht. Punktgitter können auch als vektorbasiertes Modell betrachtet werden. (vgl.[Kem93])

Hybrides GIS-Datenmodell

Vektorbasierte und Rasterbasierte Modelle haben unterschiedliche Stärken und Schwächen. Die Vorteile beider Kategorien können in einem hybriden Modell kombiniert werden. BARTELME teilt hybride Modelle ein in
* "Überlagerung: Hinterlegen von Vektordaten mit Rasterbildern; die Verwaltung bleibt jedoch getrennt;
* Integration: Gemeinsame Verwaltung von Vektor- und Rasterdaten;
* Verzahnung: Grobe und feine Methoden bzw. Organisationsformen."
[Bar95], S. 113)
Vektor- und Rasterdaten können bei Inkaufnahme von Informationsverlust ineinander überführt werden. Der Vorgang der Umwandlung von Vektordaten in Rasterdaten nennt sich Rasterung, der umgekehrte Vorgang Vektorisierung.

Autokorrelation in GIS-Datenmodellen

KEMP beschreibt in[Kem93] die Einteilung der in Tab. 1 (S. 21) genannten Datenmodelle in Bezug auf die Art und Weise, wie die Autokorrelation der Daten ausgedrückt wird.
Stückweise definierende Modelle machen von der Annahme Gebrauch, daß die Werte nahegelegener Orte gleich sind, während Stichprobenmodelle davon ausgehen, daß die Kenntnis des Werts an einer Position die Schätzung des Werts an einer nahegelegenen Position erlaubt.
Stückweise definierende Modelle partitionieren den Raum in aneinandergrenzende Regionen. Ein Wert ist für das betrachtete Phänomen an jeder Position des Raums definiert. Die kontinuierliche Variation des Wertes ist in jeder Region durch eine einfache mathematische Funktion beschrieben: Im Falle der Rasterzellen und Polygone ist diese Funktion eine Konstante, während sie im TIN linear ist.
Werden die zweidimensionalen Modelle in Höhenmodelle umgesetzt, so produzieren sie Treppenstufen, während die Regionen eines TIN geneigte Ebenen sind, deren Kanten mit denen ihrer Nachbarn zusammenfallen. Stückweise definierende Modelle machen die Annahme, daß der einer Region zugewiesene Wert einen Mittelwert oder Trend der Funktion des Wertes des Phänomens darstellt, so daß das Integral über alle durch die Region repräsentierten Punkte dem der Fläche entspricht.
Stichprobenmodelle verfolgen einen gänzlich anderen Ansatz. In diesen Modellen ist der Wert in den einzelnen Punkten bzw. entlang der Isolinien exakt dargestellt. Für dazwischenliegende Punkte muß der Wert interpoliert werden. Dabei ist die Interpolationsfunktion nicht auf Treppen- oder lineare Funktionen beschränkt, sondern es können auch Funktionen höheren Grades zur Interpolation herangezogen werden.


[4] aus der Bildverarbeitung stammt der Begriff Pixel
[5] Auch Voxel genannt in Anlehnung an Volume und Pixel
[6] Oberflächen gilt nur für den zweidimensionalen Raum zur Modellierung des dreidimensionalen. Im dreidimensionalen Raum gibt es keine anschauliche Entsprechung.
[7] auch Drahtmodell genannt


previous next Up Title Contents Index