Schlagwort-Archive: Linux

Mit aspell eigene Wörterbücher erstellen und automatisch nutzen

Wenn man über ein Fachthema schreiben will, so fehlen in Wörterbüchern der Programme die notwendigen Fachbegriffe. Diese Fachbegriffe wollte ich zentral sammeln und in allen Programmen benutzen, die auch aspell verwenden. Darunter zählt z.B. OpenOffice, Kile, Eclipse Latex Plugin Texlipse, Evolution und viele andere.

Das erstellen eigener Wörterbücher ist in der Zimbra Wiki gut beschrieben. Ich habe den Aufruf etwas angepasst, da ich die Wörterbücher bei mir im Home-Verzeichnis haben wollte und damit auf andere Systeme leicht übertragbar. Auch habe ich mir das Erstellen neuer Wörterbücher etwas vereinfacht, wie es im Folgenden erklärt wird.

Zuerst habe ich mir einen Ordner für die Wörterbücher angelegt:

mkdir ~/documents/dicitonaries

Dieser Ordner soll alle meine angepassten Wörterbücher enthalten und sehr einfach eingebunden werden können.

Um neue Wörterbücher ohne Administratorrechte hinzufügen zu können, habe ich eine multi-Datei ( eine Art include-Datei) „~/documents/dicitonaries/my-de.multi“ mit dem folgenden Inhalt angelegt:

# Dateiname: ~/documents/dicitonaries/my-de.multi
include /home/myuser/documents/dicitonaries/informatik.rws

Damit meine multi-Datei auch vom aspell ohne Parameter benutzt wird, musste ich sie im Systemordner in eine passende multi-Datei eintragen. Da mein Wörterbuch für Deutsch gedacht ist, habe ich den folgenden Eintrag in die Datei „/usr/lib/aspell/de.multi“ unter Linux und auf dem Mac (installiert mit MacPorts) „/opt/local/share/aspell/de.multi“ gemacht:

include /home/myuser/documents/dicitonaries/my-de.multi

Wenn „include“ nicht funktioniert, dann einfach „add“ probieren:

add /home/myuser/documents/dicitonaries/my-de.multi

Damit die Wörterbücher sehr einfach zu editieren sind, habe ich für jedes Wörterbuch eine Textdatei mit eigenem Namen angelegt im dictionaries-Ordner angelegt. Hier ist ein Beispiel für Informatik (Dateiname informatik.txt):

# ~/documents/dicitonaries/informatik.txt
Informationssicherheit
schützenswert

Der folgende Befehl macht aus der Textdatei ein Wörterbuch-Datei:

aspell --encoding=UTF-8 --lang=de create master ./masterarbeit.rws < masterarbeit.txt

Achtung: Es ist wichtig bei dem Aufruf einen Pfad für die rws-Datei anzugeben, sonst wird der Aufruf nicht funktionieren.

Hinweis: Wer wie ich UTF-8 benutzt, sollte das Encoding beim Aufruf setzen. Aspell verwendet nicht die Systemkodierung und deswegen kommt es zu Problemen mit Umlauten. Ohne das Encoding kommen folgende Fehler bei Verwendung von Umlauten in der Textdabei beim Aufruf der Umwandlung:

Warning: The word "schützenswert" is invalid. The character '¼' (U+BC) may not appear in the middle of a word. Skipping word.

PS: Danke an Matthias für den Tipp mit den eigenen Wörterbüchern

Hoffe damit auch jemanden geholfen zu habe und freue mich über Kommentare.