So funktioniert’s: Smarte Analysen

Alle Translation Memory-Systeme analysieren Ihre Texte und berechnen eine sogenannte „gewichtete Wortanzahl“ (Weighted Word Count, WWC). Wie kommt sie zustande?

Basis ist ein Translation Memory (TM). Das ist eine Datenbank, in der frühere Übersetzungen gespeichert sind. Sie wird im Laufe einer Übersetzung aktualisiert und ergänzt.

Ein Text besteht aus sogenannten „Segmenten“. Das sind im einfachsten Fall Sätze. Sie können aber auch Überschriften, Tabellenzellen, Menüeinträge bei Software usw. sein.

Bei der Analyse werden nun die Segmente im neuen Text mit Segmenten im TM verglichen und die Ähnlichkeit berechnet. Hier sehen Sie ein Beispiel:

Analyse mit Trados Studio

Insgesamt enthält der zu übersetzende Text 28.164 Wörter. Sie müssen jedoch nur 15.248 bezahlen. Wie kommt dieser Wert zustande?

In der Tabelle sehen Sie verschiedene Kategorien für Übereinstimmungen („Matchrate“):

Context Match: Ein Kontextmatch wird gezählt, wenn vor einem Segment im neuen Text mindestens ein Segment davor und danach schon im alten Text und im TM vorkam. Man kann also davon ausgehen, dass an diesen Übersetzungen nichts mehr zu ändern ist. Die darin enthaltenen Wörter werden deshalb nicht berechnet (Percent = 0).

Repetitions: Das sind Wörter in noch nicht übersetzten Segmenten, die sich wiederholen. Wenn also zum Beispiel in einem Text zwanzigmal „Wir freuen uns auf Sie“ vorkommt, werden einmal fünf Wörter als neu gezählt und 19 × 5 Wörter nur zu 33 %. Warum wird hier überhaupt etwas berechnet, obwohl die Segmente identisch sind? Ganz einfach: Je nach Kontext kann es sein, dass die Übersetzung anders lauten muss.

Cross-file Repetitions: Das sind Wiederholungen zwischen Dateien. Wenn also dasselbe Segment in mehreren zu übersetzenden Dateien vorkommt, fällt es in diese Kategorie. Sie werden genau wie normale Wiederholungen behandelt. Der Wert hat rein statistische Bedeutung.

100 %: Segmente, deren Übersetzung bereits im TM vorhanden ist. Sie müssen allerdings geprüft werden, weil die Übersetzung im jeweiligen Kontext nicht garantiert werden kann.

Ein Beispiel (rein fiktiv): Im englischen Text heißt es in einer Überschrift und in einer Aufzählung: „Switching on the machine“. Im Deutschen muss es in der Überschrift „Einschalten der Maschine“ und in der Aufzählung „Maschine einschalten“ heißen.

Die grauen Kategorien zwischen 99 % und 75 % beziehen sich auf Segmente, die ähnlich wie bereits übersetzte Segmente sind. Für sie gilt ein reduzierter Preis.

Die letzte Kategorie umfasst alle Segmente, die stark von Übersetzungen im TM abweichen oder völlig neu sind (no Match). Für sie wird der volle Wortpreis berechnet.