Der Begriff Datenmodell stammt aus der Welt der
Datenbankmanagementsysteme (DBMS). Er wird im Kontext Geographischer
Informationssysteme sehr uneinheitlich verwendet und insbesondere mit dem
Begriff Datenschema vermengt (vgl.[Lee95],[Bar95]).
KEMP stellt den Begriff des Datenmodells dem der Datenstruktur
gegenüber, wobei sie eine weitgehende Überlappung zwischen beiden
aufzeigt, die in der folgenden Tabelle wiedergegeben ist. Die von ihr lediglich
für den zweidimensionalen Raum aufgestellte Einteilung habe ich um eine
Spalte für den dreidimensionalen Raum erweitert.
Daten-struktur |
Datenmodell |
Autokor- |
||
2-D |
3-D |
|||
Raster |
Zellgitter [4] |
Zellgitter[5] |
konstant | ||||
Vektor |
Polygone |
Polyeder |
stückweise |
|
Vektor |
Triangulated Irregular Network (TIN) |
Tetraedical Irregular Network |
|
Vektor |
Isolinien |
(Isoflächen) |
||
Vektor oder Raster |
Punktgitter |
Punktgitter |
Stichprobe |
|
Vektor |
unregelmäßige Punkte |
unregelmäßige Punkte |
Die einzelnen Datenmodelle sind in den folgenden beiden Abschnitten
näher beschrieben. Diese Beschreibung folgt im wesentlichen der
Beschreibung in[Kem93].
Um die durchaus im GIS-Kontext üblichen Begriffe Vektormodell und
Rastermodell zu umgehen, verwende ich die Begriffe vektor- bzw.
rasterbasierte GIS-Datenmodelle. Kombiniert ergeben vektor- und
rasterbasierte GIS-Datenmodelle die hybriden GIS-Datenmodelle.
Der
Begriff Vektorbasierte GIS-Datenmodelle leitet sich daher ab, daß
der Raumbezug für Objekte durch einen oder mehrere Vektoren - im
mathematischen Sinne - im Raum hergestellt wird. Jeder Vektor
verfügt im zweidimensionalen Raum über 2 bzw. im dreimdimensionalen
Raum über 3 Koordinatenangaben. Wieviele Vektoren zur Bestimmung eines
Objekts im Raum benötigt werden, hängt vom Objekt ab: Für
Punkt-Objekte wird ein Vektor und für Linien-Objekte werden zwei Vektoren
benötigt. Flächen-Objekte werden durch eine Folge von Linien
modelliert.
In einem dreidimensionalen Vektorbasierten Datenmodell gibt es auch
dreidimensionale Objekte. Sie können durch ihre Kanten, ihre
Oberflächen oder ihre Volumina modelliert werden.

Wird von der Geometrie der Objekte, d.h. von ihrer exakten Lage,
abstrahiert, so daß nur die relative Lage der Objekte erhalten bleibt, so
ergibt sich die Topologie der Objekte. Die Begriffe Punkt,
Linie und Fläche haben dann ihre Pendants in den Begriffen
Knoten, Kante bzw. Masche. Sind Knoten durch Kanten
verbunden, so bilden sie einen Graphen. Ein Graph mit n Knoten ist durch
eine n×n-Matrix darstellbar, deren Zeilen- und Spaltennummern als
Knotenindices interpretiert werden und deren Elemente angeben, ob eine Kante
von Knoteni zu Knotenj existiert.
Reine Linienmodelle sind im wesentlichen zur Modellierung von auf
Graphen beruhenden Netzwerken geeignet. Die von ihnen gebildeten Maschen
besitzen keine Flächeneigenschaften. Sie können aber zu diesem Zweck
mit Polygonmodellen kombiniert werden.
Neben ihren geometrischen und topologischen Eigenschaften besitzen Objekte
Attribute, die weitere Eigenschaften beschreiben.
In Polygonmodellen partitionieren Polygone die gesamte
betrachtete Fläche in irregulär umrissene Regionen. Der Wert eines
betrachteten Phänomens ist innerhalb eines Polygons konstant und
ändert sich abrupt an den Polygonkanten (s.[Kem93], S. 109).
Im dreidimensionalen Raum treten Polyeder an die Stelle der Polygone und
partitionieren ihn. Der innerhalb eines Polyeders für ein Phänomen
konstante Wert ändert sich abrupt an seinen Seitenflächen.
Triangulated Irregular Networks (TINs) partitionieren die gesamte
betrachtete Fläche in dreieckige Flächen. Der Wert des betrachteten
Phänomens ist nur an den Dreiecksknoten definiert. Dennoch wird dieses
Datenmodell oft benutzt, um die Werte zwischen den Knotenpositionen linear zu
interpolieren. Wenngleich es keine abrupten Wertänderungen an den Kanten
der Flächen gibt, so ändert sich die Neigung, also die erste
Ableitung der Flächenfunktion abrupt. Während TINs
raumkontinuierliche Oberflächen modellieren, sind sie schlecht geeignet,
um kategorische, nicht-numerische Daten zu modellieren.
Partitionierung des Raums in Tetraeder findet Verwendung in Verfahren wie der
Finite-Element-Methode, etwa im Bereich der Hydrologischen Modelle. (vgl.
[Fre94])
In unregelmäßigen Punktmodellen sind die Werte des
betrachteten Phänomens auf Punkte mit unregelmäßig verteilten
Positionen beschränkt.
Die Positionen können abhängig (etwa bei repräsentativ
ausgewählten Standorten von Meßstationen) oder unabhängig
(Wetter-Meßstationen auf Flughäfen) vom betrachteten Phänomen
sein. Entsprechend ist die Aussagekraft über die Gebiete zwischen den
Punkten durch Interpolation mehr oder minder groß.
Werden unregelmäßige Punkte im dreidimensionalen Raum verwendet, so
ist insbesondere die Messung in der Höhe nicht unbedingt im gleichen
Maße unabhängig wie über der Fläche. Dies ist etwa bei
durch Bohrungen gewonnenen Bodendaten der Fall. Hier liegen die Punkte in
Richtung der Höhe auf einer Gerade, während dies entlang der beiden
anderen Raumrichtungen nicht der Fall sein muß (Vgl. auch
regelmäßige Punktmodelle).
Isolinienmodelle halten im Gegensatz zu den anderen Modellen den Wert
des betrachten Phänomens konstant und variieren die Position.
Ein Beispiel für Isolinienmodelle sind Isobaren, also Linien gleichen
Luftdrucks.
Das entsprechende dreidimensionale Modell ist das Isoflächenmodell, womit
sich etwa der mit der Höhe abnehmende Luftdruck modellieren ließe.
So wie Isolinien durch Linienstücke approximiert werden können, so
wären Isoflächen durch multiple, TIN-ähnliche
Dreiecksflächen approximierbar. Ein Schnitt durch einen durch
Isoflächen geteilten Raum liefert eine Ebene mit Isolinien.
In
Rasterbasierten Modellen beruht der Raumbezug auf einer
gleichmäßigen Einteilung des Raumes in gleich große
Rasterzellen. Im 2-D-Raum finden in der Regel Rechtecke, häufig
sogar Quadrate Verwendung, wenngleich auch Waben oder Dreiecke einsetzbar sind.
Im 3-D-Raum werden zumeist Quader mit quadratischen Oberflächen
verwendet.
Eine Rasterzelle repräsentiert ein Gebiet mit homogener Bedeutung,
d.h. der Wert des betrachteten Phänomens ist innerhalb einer Rasterzelle
konstant. Die Größe einer Rasterzelle bestimmt die Auflösung
der darstellbaren Objekte. Nach dem SHANNON'schen Abtasttheorem ist die
Mindestgröße darstellbarer Objekt begrenzt durch die doppelte
Größe einer Rasterzelle.
Eine Variante der Rasterzellen sind regelmäßige Punktgitter.
Auch sie beruhen auf einer Einteilung des Raums in gleich große
Stücke. Die Punkte sind entweder die Rasterflächenmitten oder die
Gitterknoten, entsprechend gibt es für n*m Rasterzellen n*m oder
(n+1)*(m+1) Punkte. Die Werte des betrachteten Phänomens sind nur in den
Punkten bestimmt, dazwischen jedoch nicht. Punktgitter können auch als
vektorbasiertes Modell betrachtet werden. (vgl.[Kem93])
Vektorbasierte
und Rasterbasierte Modelle haben unterschiedliche Stärken und
Schwächen. Die Vorteile beider Kategorien können in einem hybriden
Modell kombiniert werden. BARTELME teilt hybride Modelle ein in
* "Überlagerung: Hinterlegen von Vektordaten mit Rasterbildern; die
Verwaltung bleibt jedoch getrennt;
* Integration: Gemeinsame Verwaltung von Vektor- und Rasterdaten;
* Verzahnung: Grobe und feine Methoden bzw. Organisationsformen."
[Bar95], S. 113)
Vektor- und Rasterdaten können bei Inkaufnahme von Informationsverlust
ineinander überführt werden. Der Vorgang der Umwandlung von
Vektordaten in Rasterdaten nennt sich Rasterung, der umgekehrte Vorgang
Vektorisierung.
KEMP
beschreibt in[Kem93] die Einteilung der in Tab. 1 (S. 21) genannten
Datenmodelle in Bezug auf die Art und Weise, wie die Autokorrelation der Daten
ausgedrückt wird.
Stückweise definierende Modelle machen von der Annahme Gebrauch,
daß die Werte nahegelegener Orte gleich sind, während
Stichprobenmodelle davon ausgehen, daß die Kenntnis des Werts an
einer Position die Schätzung des Werts an einer nahegelegenen Position
erlaubt.
Stückweise definierende Modelle partitionieren den Raum in
aneinandergrenzende Regionen. Ein Wert ist für das betrachtete
Phänomen an jeder Position des Raums definiert. Die kontinuierliche
Variation des Wertes ist in jeder Region durch eine einfache mathematische
Funktion beschrieben: Im Falle der Rasterzellen und Polygone ist diese Funktion
eine Konstante, während sie im TIN linear ist.
Werden die zweidimensionalen Modelle in Höhenmodelle umgesetzt, so
produzieren sie Treppenstufen, während die Regionen eines TIN geneigte
Ebenen sind, deren Kanten mit denen ihrer Nachbarn zusammenfallen.
Stückweise definierende Modelle machen die Annahme, daß der einer
Region zugewiesene Wert einen Mittelwert oder Trend der Funktion des Wertes des
Phänomens darstellt, so daß das Integral über alle durch die
Region repräsentierten Punkte dem der Fläche entspricht.
Stichprobenmodelle verfolgen einen gänzlich anderen Ansatz. In
diesen Modellen ist der Wert in den einzelnen Punkten bzw. entlang der
Isolinien exakt dargestellt. Für dazwischenliegende Punkte muß der
Wert interpoliert werden. Dabei ist die Interpolationsfunktion nicht auf
Treppen- oder lineare Funktionen beschränkt, sondern es können auch
Funktionen höheren Grades zur Interpolation herangezogen werden.
[4] aus der Bildverarbeitung stammt der Begriff
Pixel
[5] Auch Voxel genannt in Anlehnung an
Volume und Pixel
[6] Oberflächen gilt nur für
den zweidimensionalen Raum zur Modellierung des dreidimensionalen. Im
dreidimensionalen Raum gibt es keine anschauliche Entsprechung.
[7] auch Drahtmodell genannt