Kategorie: Big Data


Strukturierte, semistrukturierte und unstrukturierte Daten


Daten werden von ihrem Strukturierungsgrad her in drei Klassen untergliedert:

  • - Strukturierte Daten
  • - Semistrukturierte Daten 
  • - Unstruktierte Daten

Strukturierte Daten sind Daten mit einem vorgegebenen Format. In einer relationalen Datenbank haben diese Daten klare Bezeichnungen für die jeweiligen Spalten. Dieser Datentyp kann leicht bearbeitet werden.

Die semistrukturierten Daten sind nicht fest typisiert, sondern haben eine “versteckte” Struktur, die sie mit sich tragen. Bei der Struktur dieser Daten spricht man von einer impliziten, irregulären oder partiellen Struktur. Wenn man unterschiedliche Objekte in einem Softwareprogramm zusammenfügt ergeben sich zum Beispiel semistrukturierte Datensätze.

Unter unstrukturierten Daten versteht man Daten, die keine formalisierte Struktur besitzen. Dadurch können Softwareprogramme nicht über eine einzelne Schnittstelle auf diese Daten zugreifen. Geschriebene Sprache (z.B. E-mail) oder Bilder fallen in diese Kategorie. Man weiß zwar den Dateityp einer E-Mail, doch weiß man anhand dieses Dateitypes nicht, welchen Inhalt diese hat. Im Gegensatz dazu kann man bei einer relationalen Datenbank genau sagen, welche Inhalte in welchem Feld zu finden sind.

Lernen Sie uns kennen


Nachricht senden
Projektanfrage