Grundsätzlich werden sowohl Datensätze (z.B. Dokumente) wie auch die Blöcke (selbst ein Datensatz) der Blockchain gehasht.
Ein Hash ist eine unveränderliche kryptographischen Signatur. Er wird durch eine Hashfunktion erzeugt.
Dieser Hashwert wird in der Blockchain abgespeichert. Er ist also selbst wiederum ein Datensatz.
Im Bereich HR und im Bildungssektor werden oft nicht die Dokumente als Dateien in die Blockchain geschrieben, sondern deren Hashwerte abgespeichert.
In diesem Fall ist ein Hashwert eine digitale Repräsentation, ein digitaler Zwilling eines Datensatzes (Dokument).
Die gleichen Eingangsdaten ergeben immer den gleichen Hashwert. Umgekehrt lässt sich aus einem Hashwert nicht auf die Ausgangsdaten eines Dokuments schliessen.
Die Einträge dieser Hashwerte in das Blockchain-Register erfolgen zeitlich gestaffelt. Daraus ergibt sich eine Hashwert-Historie. Diese Reihenfolge ist unveränderlich.
Würde ein Block in einer Kette geändert, wäre es sofort offensichtlich, dass er manipuliert wurde. Auch auf der Ebene von Dokumenten würden Fälschungen sofort auffliegen.
Dadurch baut sich ein Hash-Baum auf, mit einem Wurzelknoten und einer Knotenverästelung (Merkle-Tree)
Eine Hash-Funktion ist ein Programmcode, welcher Datensätze und Daten (Bitfolge) in eine Ziffern-/Zeichenkette (Bitfolge) umwandelt. Durch diese Verschlüsselung ergibt sich eine kryptographische Prüfsumme, der Hashwert.
Die Bitfolge des Datensatzes (z.B. Bitfolge eines Dokuments) und die Bitfolge dessen Hashwertes, beide eine Folge von Ziffern (0, 1), sind nicht gleich.
Wird ein Dokument gefälscht oder dessen Daten manipuliert, ändert sich unausweichlich der Hashwert des Dokuments.
Der originale Hashwert weicht so vom neu errechneten Hashwert ab: Der Beleg, dass das Original-Dokument nicht mit dem abgeänderten Dokument übereinstimmt.
Dank Hashwert lassen sich Dokumente
Um festzustellen, ob Datensätze und Daten von Dateien, Dokumenten, Transaktionen, Belegen identisch sind, müssen die Daten und Datensätze weder bekannt sein noch miteinander verglichen werden. Der Vergleich des Hash-Wertes reicht aus. Werden die Daten beziehungsweise wird der Datensatz geändert, ändert sich der Hashwert.
Da Hashwerte im Vergleich zu einem Dokument eine kleinere Speichergrösse aufweisen, nehmen sie auch weniger Speicherplatz der Datenbank in Anspruch.
Insgesamt bildet sich durch das Hashing der Datensätze und aller Blöcke ein Hash-Baum (Merkle-Tree).
Aus dem Hashwert eines aktuellen Blockes und des Hashwerts der Referenzen in diesem aktuellen Block ergibt sich ein neuer Hashwert.
Dieser Hashwert des Nachfolgerblocks ist der Hashwert des vorherigen, d.h. aktuellen Blocks.