Warum Verständlichkeitsformeln wenig taugen

Eine kurze Kritik der rein computergestützten Verständlichkeitsratings

Viele Unternehmen versehen ihre Produkte gern mit Zertifikaten oder Siegeln unabhängiger Institute. Dies soll dem Kunden signalisieren, dass eine neutrale Instanz das Produkt geprüft und für gut befunden hat. Wenn diese unabhängige Prüfung von Seiten des Unternehmens tatsächlich ernsthaft gewollt wird, und nicht nur eine Marketingstrategie darstellt, dann gewinnen Beide – Unternehmen und Kunde.

Was aber, wenn das zertifizierende Institut als Grundlage für das Gütesiegel eine Bewertungsmethode verwendet, deren Aussagekraft eher gering ist?
Genau dieser Fall liegt vor bei den computergestützten Verständlichkeitsratings, die ausschließlich auf Grundlage einer oder mehrerer der populären “Verständlichkeitsformeln” erstellt werden.

 

Schaubild Verständlichkeitsformeln

Schaubild der Ratingerstellung mittels Verständlichkeitsformeln

Was sind und was können Verständlichkeitsformeln?

Verständlichkeitsformeln sind nichts Neues. Die Ersten tauchten bereits in den 20er Jahren des 20 Jhd. auf. In dem Standardwerk zur Lesbarkeitsforschung “The Measurement of Readability” aus dem Jahre 1963 von George R. Klare wurden bereits über 30 Formeln genannt.
Texte, die mit einer Verständlichkeitsformel analysiert wurden, erhalten als Ergebnis einen numerischen Wert. Je nach Formel sagt die Höhe dieses Werts dann beispielsweise aus,
– wie viele Jahre Schulbildung nötig sind, um den Text zu verstehen oder
– welcher Textgattung er entspricht (von Kinderbuch bis Fachliteratur).

Alle Verständlichkeitsformeln haben gemeinsam, dass sie die Wörter eines Satzes zählen und diesen Wert in Beziehung zur Länge der einzelnen Wörter des Satzes setzen*. Die Gedanken, die dahinter stehen, sind einfach:
1. Kurze Sätze sind verständlicher als lange Sätze
2. Lange Wörter 
sind schwerer verständlich als kurze Wörter.

Das ist auch schon alles.

Als Beispiel kann die wohl bekannteste Verständlichkeitsformel – die Flesch Reading Ease – Formel – dienen. Sie lautet:

RE = 206.835 – (1.015 x ASL) – (84.6 x ASW)

Was nach komplexer Mathematik aussieht, besagt im Grunde nichts anderes als:

RE = Readability Ease (Leseleichtigkeit; ein Wert zwischen 0 und 100, bei dem 100 “äußerst leicht” und 0 “äußerst schwer” bedeutet)
ASL = Average Sentence Length (durchschnittliche Satzlänge; die Anzahl der Wörter geteilt durch die Anzahl der Sätze)
ASW = Average number of syllables per word (durchschnittliche Silbenzahl per Wort; die Anzahl der Silben geteilt durch die Anzahl der Wörter).

 

Was können Verständlichkeitsformeln nicht?

Wenn man wohlwollend ist, dann kann man sagen, dass die Verständlichkeitsformeln bestenfalls zwei der für die Verständlichkeit von Texten wichtigen Themenkomplexe betrachten. Und diese auch nur ziemlich grob, nämlich

  • den Wortschatz (lediglich gemessen durch die Länge der Wörter)
  • und den Satzbau (lediglich gemessen durch die Anzahl der Wörter im Satz).

Überhaupt nicht betrachtet werden hingegen

  • Semantik (Wortbedeutung, Abstraktionsgrad, Ambiguitäten usw.),
  • Textstruktur (transphrastische Relationen – satzübergreifende Beziehungen – der rote Faden zwischen den Sätzen und Absätzen usw.),
  • Leserorientierung (affektive Ansprache des Lesers, verdeutlichende Erläuterungen usw. )
  • und nicht zuletzt Layout (Schriftgröße, Seitennutzung, Farbgestaltung usw.)

Warum werden Verständlichkeitsformeln überhaupt benutzt?

Was die Verständlichkeitsformeln so populär macht, ist, dass man sie einfach programmieren kann. So erhält man ohne großen zeitlichen und finanziellen Aufwand eine Methode, große Mengen an Text zu “analysieren”. Ein digital vorliegender Text wird vorn in eine “Verständlichkeitssoftware” gepumpt und ohne nennenswerten Aufwand und Zeitverlust fällt hinten ein Rating heraus. Das muss dann nur noch verpackt und ausgeliefert werden. Die Algorithmen und „weiteren Kriterien“, die die jeweiligen Anbieter von computergestützten Verständlichkeitsratings benutzen, werden zuweilen ähnlich geheim behandelt wie die Rezeptur von Coca Cola. Ein Schelm, wer Arges dabei denkt….

Uwe Kalinowski

*Je nach Formel wird dies durch Zählen der Buchstaben oder Silben eines Wortes bestimmt. Einige computergestützte Ratings greifen auch auf Datenbanken zu. In diesen Datenbanken werden Wörter abgespeichert und mit einem numerischen Wert versehen. Dieser numerische Wert soll etwas über die Verständlichkeit des Wortes aussagen. Wird nun der zu untersuchende Text von der „Verständlichkeitssoftware“ abgearbeitet, dann fließen die den einzelnen Wörtern zugeordneten Werte aus der Datenbank in die Berechnung ein.

 

 

 

Weiterführende Links

Ein Überblick über die im deutschen Sprachraum bekanntesten Lesbarkeitsindexe
http://de.wikipedia.org/wiki/Lesbarkeitsindex