nasauber.de

Blog: Einträge 23.02–23.04.2007

b8-0.4 out soon

Die neue Version meines Spam-Filters b8 steht in den Startlöchern. Mein Part (der Großteil ;-) ist schon fertig, ich warte jetzt nur noch darauf, daß Laurent Goussard mir seine angepaßte Speicherklasse für SQLite schickt. Dann gibt's das neue Release 0.4!

Geändert hat sich einiges.

Für MySQL-Nutzer hat sich auch einiges geändert:

So, das waren mal die groben Änderungen. jedenfalls alle, die mir gerade einfallen ;-) Sobald die SQLite-Speicherklasse da ist, gibt's das Release. Bis dahin: noch viel Spaß ;-)


Sichere Datensicherung

Vor kurzem habe ich mal meine sämtlichen alten, gebrannten CDs durchgeschaut, um mal zu sichten, was sich da alles angesammelt hat im laufe der Jahre. Waren ein paar interessante Sachen dabei, wie z. B. meine allererste Homepage, die ich für die JU Konradsreuth Anno 1999 online gestellt habe ;-)

Die Misere mit optischen Datenträgern

Bei einigen CDs gab es allerdings Probleme beim Auslesen und ein paar Dateien waren einfach weg. Unwiederbringlich. Zum Glück keine wichtigen. Aber bei dieser Gelegenheit habe ich erstmals am eigenen Leib erfahren, daß Datensicherung auf optischen Medien im Prinzip keine Datensicherung ist, sondern eher Datenroulette – „Werd ich das in zehn Jahren auch noch auslesen können?“ – wahrscheinlich nicht. Jedenfalls nicht ohne Fehler.

Da ich Backup-technisch ziemlich aktiv bin (zum Glück habe ich noch nie eines gebraucht!), hab ich mir schon länger überlegt, meine ganzen Fotos, etc. auch mal einfach auf CDs zu brennen und z. B. bei meinen Eltern einzulagern. Oder auch die DVD mit den Konzertmitschnitten meiner Band. Aber was hat man davon, wenn die Rohlinge vor sich hingammeln und früher oder später eh nicht mehr lesbar sind? Nichts. Richtig. Aber es gibt Abhilfe.

Die Rettung: Redundanz

Zerkratzte CD Über dieses Problem haben sich zum Glück schon Leute Gedanken gemacht, die was von Mathematik verstehen. Und das, was die sich ausgedacht haben, macht sich (unter anderem) das Projekt dvdisaster zu nutze. Mit diesem Programm kann man Reed-Solomon-codierte redundante Datensätze für ein ISO-Image einer CD oder DVD erstellen. Im Klartext heißt das folgendes:
Wenn man eine CD mit unkorrigierbaren Lesefehlern hat, hat aber eine solche Rettungsdatei mit z. B. 20 % Redundanz erzeugt (die dann entsprechend 20 % so groß ist, wie der Quell-Datensatz), dann kann man damit 100 % der ursprünglichen Daten wiederherstellen, sofern 80 % der CD noch lesbar sind. Irgendwelche 80 % wohlgemerkt.
Um das ganze mal anschaulich zu machen: Ich hab einen Test durchgeführt. Eine CD gebrannt, eine Korrekturdatei mit 20 % Redundanz erzeugt; dann zwei mal mit dem Bürostuhl drübergefahren, mit dem Tapetenmesser fiese Kratzer reingemacht und an ein paar Stellen die Datenschicht komplett weggekratzt. Auf dem Foto sieht die CD etwas schlimmer aus, als es tatsächlich war, aber die CD hat schlimm ausgesehen.

Ergebnis der Wiederherstellungsaktion: dvdisaster konnte tatsächlich 100 % dieser arg geschundenen CD mittels der 20 % redundanten Daten wiederherstellen. Respekt.

Datensicherung

Konsequenzen daraus? Ich archiviere wieder ruhigen Gewissens Daten auf CDs. Nach dem Brennen werden Rettungsdateien mit 14 % Redundanz erzeugt (weil so schlimm wie im Beispiel richte ich meine Datenträger für gewöhnlich nicht zu ;-) Von fünf dieser Rettungsdateien wird ein ISO-Image gemacht, was seinerseits um redundante Daten erweitert wird (reicht noch für ~ 37 %) und auf eine Rettungs-CD gebrannt.
Einmal im Jahr werden alle Archiv-CDs und -DVDs auf Lesefehler geprüft. Auch das kann dvdisaster. Fällt dabei auf, daß ein Datenträger Daten verloren hat, ist ja auch davon auszugehen, daß auf der CD oder DVD, die die Rettungsdaten enthält, Lesefehler sind. Die wird man aber aufgrund der hohen Redundanz innerhalb der CD oder DVD selber sehr wahrscheinlich korrigieren können. Mit der so wiederhergestellten Rettungs-Datei kann man dann die beschädigte CD oder DVD retten und eine neue brennen.

Wenn man das so durchzieht, dann braucht man sich eigentlich keine Sorgen darüber machen, ob die Urlaubsbilder auch in zehn Jahren noch lesbar sein werden. Jedenfalls dann, wenn man handelt, bevor das Kind in den Brunnen gefallen ist!


www oder nicht www?

Darüber habe ich mir bisher noch nie Gedanken gemacht. Bis ich auf irgendeiner Seite einen Link auf http://no-www.org/ gefunden habe. Das ist eine Kampagne gegen das „www.“ vor Domainnamen.

Worum geht's da? Im Prinzip braucht man kein www. vor der Domain. Scheint ein Relikt aus vergangenen Zeiten zu sein. Argument: wenn man eine E-Mail an jemanden schreibt, muß man ja auch nicht an adresse@mail.server.de schreiben. Warum sollten dann Inhalte für einen Browser über die www-Subdomain laufen? Der Browser weiß doch ohnehin, daß er den Port 80 benutzen soll. Leuchtet irgendwie ein.
Meine Homepage ist (wie die meisten anderen wohl auch) sowohl unter http://nasauber.de/ als auch unter http://www.nasauber.de/ erreichbar. Wozu sollte man folglich dieses www. da hinschreiben? Bei Subdomains schreibt man das ja auch nicht hin.
Außer bei der Uni Erlangen, die höchst nervige www-Sub-Subdomains benutzt, wobei dann sowas rauskommt wie http://www.dekanat.med.uni-erlangen.de/. Wobei die Variante ohne www. übrigens nicht erreichbar ist.

Je länger ich darüber nachdenke, desto weniger Sinn sehe ich hinter diesen in den allermeisten Fällen redundanten vier Buchstaben. Also habe ich konsequenterweise den .htaccess-Rewrite, der bisher http://nasauber.de/ auf http://www.nasauber.de/ weitergeleitet hat, rausgeschmissen. Und die Links in meinen Atom-Feeds zeigen jetzt auch auf http://nasauber.de/.

Im Prinzip ist's ja eigentlich egal. Aber ohne www. sieht's irgendwie moderner aus ;-)


Kostspieliges MP3

Was les ich da im tagesschau-Newsticker? „Microsoft zu Milliardenstrafe verurteilt“. Schön! Aber warum? Weil wohl das MP3-Format nicht allein vom Fraunhofer-Institut entwickelt wurde, sondern wohl auch patentierte (!) Datenkompressionsverfahren der Bell Labs benutzt wurden, die später von Lucent gekauft wurden, die später von Alcatel gekauft wurden. Oder so. Und Alcatel fand's nicht lustig. Wie das genau zusammenhängt, weiß ich nicht. Und wer jetzt warum welche Ansprüche auf was hat, weiß ich auch nicht.
Aber ich kann mich eines leicht diabolischen Grinsens einfach nicht erwehren, wenn ich lese, daß Micro$oft wegen eines Softwarepatents mal so richtig in Schwierigkeiten kommt und jetzt eventuell einen riesen Haufen Geld zahlen muß. Hallo, Herr Ballmer (*wink*). Aber wie sieht's dann mit allen anderen aus, die MP3 benutzen? Wird jetzt jeder verklagt, der MP3 benutzt? Warum muß gerade Microsoft zahlen?

Egal wie: auch, wenn das jetzt vielleicht klingt wie im Heise-Forum: Mit Ogg Vorbis wär das nicht passiert!

Ich predige ja schon immer jedem, daß Vorbis einfach der bessere Audiocodec ist. Macht kleinere Dateien bei besserer Qualität und das auch noch schneller (zumindest als LAME). Und: Vorbis ist komplett patentfrei. Die Spezifikation ist „public domain“, die Bibliotheken, die die Vorbis-Entwickler geschrieben haben, stehen unter einer BSD-artigen Lizenz.
Und das heißt: jeder, der will, kann Vorbis benutzen, ohne etwas dafür zahlen zu müssen. Jeder Hersteller kann es in seine Software stecken oder in seinen MP3-Player einbauen. Oder damit machen, was er will.
Aber die wenigten tun das. Warum auch immer. DRM-WMA kann jeder. Na toll. Wie konnte ich nur bisher ohne leben?! Aber Vorbis spielen die wenigsten Autoradios und MP3-Player ab. Grausam eigentlich, daß sich „MP3-Player“ tesafilmartig für alle tragbaren Geräte durchgesetzt hat, die komprimierte Audiodateien abspielen können. Ich nenne aus Prinzip das meiner Freundin, den Trekstor i.Beat organix, eine lobenswerte Ausnahme der obigen Regel, „Vorbis-Player“.

Ist vielleicht etwas illusorisch, aber vielleicht findet ja, wenn das Urteil so durchgeht, doch ein kleines Bißchen Umdenken bei den Herstellern statt …