Wie funktioniert die Technik der plattdeutschen Rechtschreibprüfung?
Die Technik der plattdeutschen Rechtschreibprüfung ist einfach erklärt. Sie basiert auf einer Liste von möglichst vielen richtig geschriebenen Wörtern, und das in allen Konjugations- und Deklinationsformen. Dadrin enthalten sind also z.B. Verbformen wie
ik maak, du maakst, he maakt
aber auch Adjektive in allen möglichen Formen wie
goot, gode, goden
hunspell braucht diese Liste in der Form eine Zeile ein Wort. Zum Bearbeiten ist es aber sinnvoll, wenn zusammengehörende Formen auf einer Zeile stehen. Also bearbeitet man die hunspell-Datei nicht direkt. In der Quelldatei ist vielmehr zeilenweise das nebeneinander, was nebeneinander gehört. Auch Kommentare (z.B. zu offenen Fragen) sind dabei.
hunspell selbst kann noch ein paar Tricks, die es ermöglichen, die Wortliste etwas einzudampfen. Hierzu kann man Suffixe und Präfixe definieren und Substitutionslisten hinterlegen. Damit kann hunspell sogar die Vokalverdoppelung richtig interpretieren. z.B. steht in der Wortliste einfach nur
deep/en deper/en deepst/en
Und in der Steuerdatei sind die Kürzel /e und /n so definiert, dass sie nach vorangehendem Doppelvokal suchen und das korrekt zu
depe, depen, depere, deperen, deepste, deepsten
auswerten. Auch die Konjugation eines regelmäßigen plattdeutschen Verbs (in der Grammatik ist der korrekte Fachbegriff dazu „schwaches Verb“) lässt sich damit abbilden, so dass man einfach
maak/s
schreiben kann. Und /s ist so definiert, dass dabei maak, maakst, maakt und auch die Vergangenheitsform „wi maken“ abfallen.
Auch häufige Präfixe wie af-maken, af-delen etc. lassen sich in Kurzschreibweise hinterlegen.
Man muss also nicht alle Formen einzeln aufführen, man kann sie sich ausrechnen lassen. Andererseits heißt das natürlich auch aufzupassen, dass das auch immer stimmt. Und für denjenigen, der da nicht drinsteckt, sieht die Wortliste durchaus etwas merkwürdig aus. Was die Präfixe angeht, so habe ich mich manchmal gefragt, ob wir uns damit wirklich einen Gefallen getan haben. Lesbarer wäre die Wortliste schon, wenn afmaken, afdelen etc. einzeln aufgeführt wären. Zumindest wäre ein Hilfsprogramm nützlich, das diese Kurzschreibweisen analyisert, um sie wenigstens einfach korrekturlesen zu können. Vielleicht baue ich mir das irgendwann nochmal.
Mit Hilfe eines kleinen Programms namens „make“ wird dann aus den Quelldateien das Rechtschreibmodul für LibreOffice erzeugt. Es hat die Endung „.oxp“, damit fühlt LibreOffice sich dann auch angesprochen, wenn man diese oxp-Datei doppelklickt, um sie zu öffnen.
Und diese Datei stellen wir dann zum Download bereit. (Siehe Installation). Wenn die Wortliste hinreichend vollständig ist und wir auch noch ein paar Bugs ausgebaut haben, wird das Sprachmodul dann sicherlich direkt bei LibreOffice zum Download erhältlich sein.