Aktivität 3 – Textkomprimierung

Kannst du das nochmal sagen! – Textkomprimierung

Da Computer nur einen begrenzten Speicherplatz haben, um Informationen zu halten, müssen sie Informationen so effizient wie möglich ablegen. Dies wird als ‚Kompression’ bezeichnet. Durch das Codieren von Daten bevor sie gespeichert werden, und dekodieren, wenn sie abgerufen werden, kann der Computer mehr Daten schneller speichern oder durch das Internet senden.

Worum geht es in dieser Aktivität?

Die Speicherkapazität von Computern wächst in einem unglaublichen Tempo - in den letzten 25 Jahren ist der Speicherbereich auf einem typischen Computer millionenfach gewachsen - aber wir brauchen ständig noch mehr Speicher auf unseren Computern. Auf Computern können ganze Bücher oder sogar Bibliotheken und jetzt auch Musik und Filme gespeichert werden, wenn es genug ‚Platz’ gibt. Große Dateien sind auch ein Problem im Internet, weil sie eine lange Zeit zum Download benötigen. Wir versuchen auch, Computer kleiner zu machen - sogar auf einem Handy oder einer Armbanduhr kann erwartet werden, dass dort viele Informationen gespeichert werden können!

Es gibt indessen eine Lösung für dieses Problem. Anstatt mehr Speicherplatz oder eine schnellere Netzwerkverbindung zu kaufen, können wir die Daten komprimieren, sodass weniger Platz benötigt wird. Dieser Vorgang der Komprimierung und Dekomprimierung der Daten erfolgt normalerweise automatisch auf dem Computer. Alles was wir vielleicht dabei bemerken ist, dass die Festplatte mehr beinhalten kann, oder dass Websites schneller angezeigt werden. Tatsächlich aber kann der Computer mehr verarbeiten.

Viele Methoden der Kompression wurden entwickelt. Die Methode, die in dieser Aktivität verwendet wird – mit dem Prinzip auf frühere Vorkommen von Textstücken zu verweisen – wird oft als „Ziv-Lempel-Codierung“ oder „LZ-Codierung“ bezeichnet und wurde von zwei israelischen Professoren in den 1970er Jahren entwickelt. Die Codierung kann für jede Sprache verwendet werden und kann leicht die Menge der Daten halbieren. Es wird manchmal auch als ‘Zip’ auf Personalcomputern bezeichnet, als ‘GIF’ und ‘PNG’ für Bilder verwendet und in High-Speed Modems eingesetzt. Bezüglich Modems reduziert es die Datenmenge, die über die Telefonleitung übertragen werden muss, sodass sie viel schneller übertragen wird.

Einige andere Methoden basieren auf der Idee, dass Buchstaben, die häufiger verwendet werden, kürzere Codes als die anderen haben sollten. Der Morsecode verwendet diese Idee.

Übungen und Materialien

Materialien