Datenaustausch
Wie können heutzutage Dokumente und Daten platformunabhänig ausgetauscht werden?
das Monopol
Werden heutzutage Daten in Form von Text-, Tabellen- oder Präsantationsdokumenten ausgetauscht, sind es zu 95 % die Versionen der MS-Office-Familie. Aber warum eigentlich?
Nun, aufgrund Erpressungs-ähnlichen Marketings hat Microsoft bei den Desktop-Betriebssystem, Browsern und den Office-Pakten die Martkführung inne. Das zwingt vor allem Unternehmen und öffentliche Einrichtungen zu kostenspieligen Lizenz-Verträgen mit Microsoft. Privatanwender können dem entgehen, indem sie Raubkopien installieren und sich hiermit strafbar machen. Diese Raubkopien hat Microsoft solange geduldet, bis eine entsprechende Etablierung der eigenen Produkte erreicht war und zieht jetzt die Preise an.
der Wechsel
Es ist also kein Wunder, wenn sich immer mehr Unternehmen, öffentliche Einrichtungen und Privatenwender nach Alternativen umschauen und zu anderen Programmen wechseln. Ich hatte auf der CeBIT 2002 [de|en] die Möglichkeit als Vertreter von OpenOffice.org mit diesen zu reden und sie zu beraten.
Ist dieser Wechsel vollzogen, gibt es aber das Problem mit dem Datenaustausch mit den MS-Office-Benutzern, wofür Filter benötigt werden. Diese Filter sind jedoch nur solange brauchbar, bis Microsoft die Dateistruktur ändert; die ganzen Mühen der Entwickler wären dann umsonst gewesen. Diese Filter für das Importieren und Exportieren von MS-Dokumenten sind also nur eine Zwischenlösung auch weil sie nie perfekt sein können und es immer einen Informationsverlust geben wird.
Dies liegt daran, dass Microsoft die Spezifikationen für die Struktur seiner Datei-Formate nur sehr rudimentär veröffentlicht. Diese sind somit nur mit dem gleichen Programm lesbar, mit dem es auch erstellt wurde (und sie werden nur gleich angezeigt, wenn die gleichen Schriften und Standarddrucker installiert sind). Leider ist MS-Office nur für MS-Windows und Apple Mac OS erhältlich, was ich beides aus verschiedenen Gründen nicht nutze. Außerdem ist für die legale Nutzung der Standardversion von MS-Office eine Gebühr von ca. 600 Euro erhoben; ein Betrag, den ich nicht bereit bin zu zahlen.
Die Interessen von Microsoft sind klar: Mit der Geheimhaltung seiner Dateiformate werden die Verkaufszahlen der Programme gesichert, denn wären sie offen, könnten mit wenig Aufwand entsprechende Im- und Export-Filter für andere Programme geschrieben werden, so dass ein uneingeschränkter Informationsfluss zwischen allen Anwendern - unabhängig welches Betriebssystem und Programm sie nutzen - gesichert wäre. Es wird also eine Konkurrenz verhindert und das Monopol besteht weiterhin:
- Microsoft bestimmt alleine die Preise für sein Office-Paket
- Anwender sind gezwungen MS-Office zu benutzen, eben weil eine Vielzahl anderer Benutzer es auch tun - ein verehrender Teufelskreis!
- Anwender können nicht überprüfen, was für Daten in ihren Dokumenten gespeichert werden, sei es der Name, die E-Mail-Adresse oder die Änderungen der einzelnen Personen
- Auf der andere Seite könne sie nicht überprüfen, was empfangene Dokumente enthalten, sei es ein Virus oder ein Wurm
- Anwender müssen ihre stunden- oder tagelange Arbeit in einem Format sichern, von dem sie nicht wissen, ob sie es in zehn Jahren noch wiederbenutzen können
eine Lösung
Was kann man also tun, wenn man diesem Teufelskreis Einhalt gebieten will?
Man kann die Dokumente in offenen Formaten speichern, wie es bei Bildern der gängige Fall ist. Jeder kennt JPG, GIF oder PNG. Eben weil sie offen sind, kann jeder sie betrachten und wiederbearbeiten. Es ist egal, mit welchen Programm sie erstellt wurden, sei es ein Paint Shop Pro unter Windows in 2002, Photoshop auf dem Mac OS in 1999 oder Gimp unter Linux in 1997.
Ebenso ist es mit dem Internet, das auf offenen Protokollen (TCP/IP, HTTP, FTP, POP3, SMTP, IMAP usw.) und Formaten (HTML, SGML, XML usw) gründet. Sie machten es erst möglich diese Technologie so erfolgreich zu machen wie sie heute ist.
Für Textdokumente ist dies das RTF, das normale TXT-Format oder HTML. Bei diesen Formaten besteht nun aber das Problem, dass sie zwar die Informationen nicht aber die Formatierung vollständig speichern können. Ein interessante Alternative ist LaTeX, das auf einfachen Textdateien basiert. Sind diese Textdateien sinnvoll kodiert (zum Beispiel in ISO-8859-1 oder UTF), können die Dateien ohne Probleme über Betriebsystemgrenzen auch in nicht-Englischen Sprachen ausgetausch werden.
Zum reinen und exakten Austausch von Dokumenten - es können auch Tabellen sein - hat Adobe das PDF geschaffen, dessen Spezifikationen offen liegen und Programme zum Erstellen und Betrachten vielfach für die verschiedenen Betriebssysteme verfügbar sind. Unter diesen finden sich natürlich auch kostenlose und diese Anleitung [de] beschreibt die Installation ein solchen PDF-Ersteller unter Windows.
Will man Dokumente austauschen, die noch bearbeitet werden müssen, benötigt man nun ein Programm, dessen Datei-Spezifikation [en] offen ist und das für viele Betriebssystem verfügbar ist. OpenOffice.org ist so eins, das eine Textverarbeitung, eine Tabellenkalkulation, ein Präsentations-Programm und vieles mehr beinhaltet und nebenbei noch kostenlos ist. Im Funktionsumfang entspricht es MS-Office und bekommt in Fachzeitschriften häufig gleiche Bewertungen und vor allem bei der Textverarbeitung bessere.
OpenOffice.org hat hervorragende Im- und Export-Filter, was denn Dateiaustausch mit nichtumsteigwilligen MS-Office-Anwendern vereinfacht.
Inzwischen wurde auf Basis des OpenOffice.org1-Dateiformates von einer Standardisierungsgruppe mit Unterstützung von verschiedenen Firmen wie Sun Microsystems, Boing, Corel und IBM im Mai 2005 der OpenDocument-Standard [en] verabschiedet. Dieser Standard umfasst die Speicherung von Text-, Tabellen- und Präsentations-Programmen. Er wird von der Europäischen Komssion unterstützt und ist im Mai 2006 als ISO-Standard anerkannt worden. Er wird von Office-Programmen wie OpenOffice.org2 und KOffice 1.5 als Standard-Format benutzt. Auf den Seiten des Open Document Fellowship [en] ist eine Übersicht über andere Programme zu finden, die dieses Format unterstützen.