Die gefühlte Lesbarkeit

die gefühlte Lesbarkeit von Schriften

Serife gegen Groteske: die Lehrbuch-Meinung unterstellt beharrlich Qualitätsunterschiede, die offenkundig nicht existieren. Eine neue Studie zeigt: Viel wichtiger als die oft beschworene “objektive” Lesbarkeit ist, was eine Schriftart ausstrahlt – ihr „Look and Feelâ€.

Starten wir banal: Schrift muss gut lesbar sein. Höre ich Widerspruch? Fehlanzeige, selbstredend.

Schrift darf natürlich gerne auch ein bisschen gut aussehen. Den thematischen Kontext betonen. In ihrer visuellen Tonalität Wertigkeit ausstrahlen. Freundlichst zum Lesen einladen. Aber: Sie muss immer noch und zuallererst gut lesbar sein. Unbedingt gut lesbar sein. Gute Lesbarkeit ist das Wichtigste überhaupt. Höre ich Widerspruch?

Wahrscheinlich nicht. Und das ist schade. Denn die Typografie, vor allem die Web-Typografie, sie droht unter die Räder zu geraten von Technokraten, von selbsterkorenen Lesbarkeits-Optimierern, von halbinformierten Systemadministratoren, von lehrbuchtreuen Mediengestaltern, die uns seit Jahren eine Web-Welt voller â€Nur-Verdanaâ€-Seiten bescheren. Sachbearbeiter mit Zuständigkeitsrandgebiet Optik sind dies oft, die den Reiz guter Typografie auf den Faktor “Lesegeschwindigkeitâ€ reduzieren, weil man Ästhetik und Themenadäquatheit leider nicht in Sekunden messen kann. Jene Menschen sind es, die uns gerne sagen: Serifen sind schlecht lesbar auf dem Monitor, das weiß doch inzwischen jeder, nimm lieber “Verdanaâ€. Gerne folgt der Zusatz: Macht Spiegel Online doch auch. Spiegel Online kommt irgendwann immer.

Lesbarkeit: ein gefährliches Totschlagargument

Ich möchte das Design Tagebuch nutzen, um diesen Kontoristen der Gestaltung zu entgegnen: Lesbar sind sie ohnehin, die erbärmlich wenigen Schriftarten, die wir im HTML-basierten Webdesign einsetzen können. Vielleicht nicht so gut wie ihre Äquivalente auf Papier, aber im wechselseitigen Vergleich annähernd gleich gut, ob mit oder ohne Serifen, ob kräftig im Stamm oder fein ziseliert, ob großzügig im Innenraum oder drangvoll.

Bevor wir also – immer selbstredend wegen der Lesbarkeit – die nächste Seite wieder nur aus “Verdanaâ€-Variationen zusammenbauen, geben wir der typografischen Ästhetik eine neue Chance, dem harmonischen Schriftbild, der spannungsreichen Mischung vor allem, und der themenangemessenen Optik. Selten war die Gelegenheit günstiger: Mit der absehbaren Verbreitung der neuen Vista-Schriftenreihe werden die typografischen Potenziale im Web immens wachsen.

Nutzen wir also die Chance, nehmen wir wieder stärker in den Fokus, was zu Unrecht immer mehr zum Randaspekt der Web-Typografie zu verkommen droht: das “Look-and-Feelâ€ von Schrift. Den Schriftcharakter. Das, was eine Schrift repräsentiert und ausstrahlt: ihr Wesen. Entdecken wir auch im Web neu, was gute Typografie seit einem halben Jahrtausend adelt: kreativer, inhaltsorientierter, fantasievoller Umgang mit Zeichen, ihre Kombination, ihre wechselseitige Spannung, ihr visuelles Mantra. Gebrauchen wir auch im Browser das Medium Schrift, um Individualität und Qualität nachzuweisen. Kurzum: Es ist an der Zeit, auch online die “weichenâ€ Schriftfaktoren den vermeintlich “hartenâ€ vorzuziehen. Und zwar eindeutiger denn je.

Ein Experiment mit mehr als 3000 Teilnehmern

Eine gewagte These? Ich glaube nicht. Ich habe die Ehre, hier im Design Tagebuch berichten zu dürfen von einem Online-Experiment, das die Fachhochschule Gelsenkirchen Ende 2008, Anfang 2009 unter meiner Leitung durchgeführt hat. Über 3000 Menschen nahmen teil an diesem Experiment, das groß angelegt war: Gemessen wurden die Lesezeiten von 12 verschiedenen Schriftarten, wir testeten verschiedene Schriftgrößen und Zeilenabstände, variierten die Zeilenbreiten gezielt – und kombinierten all diese Faktoren miteinander, was 1440 typografische Test-Konstellationen ergab.

Ganz zum Schluss fragten wir dann noch Sympathienoten für verschiedene Fonts ab – und stellten etwas überrascht fest, dass damit des Pudels Kern getroffen war. Denn außer der Schriftgröße gibt es augenscheinlich keinen “hartenâ€ typografischen Aspekt, der in seiner Bedeutung die schlicht ästhetische Wirkung des Schriftbildes überragt.

Dieses Experiment war damit in Aufgabenstellung und Teilnehmerzahl – nach meiner Kenntnis – das ambitionierteste, das bislang gestartet wurde. Weltweit, wohlgemerkt. Doch nun genug geprahlt.

Wie misst man “Lesbarkeit”?

“Gut lesbar” – an welchen Indizien macht sich dieses typografische Kompliment eigentlich fest? Und wenn die Anhaltspunkte für die Güte einer typografischen Anordnung existieren und benannt sind: wie überführt man diese dann, im Folgeschritt, in eine Vergleichs-Einheit, macht sie empirisch messbar? Ein Blick in frühere Studien zeigt: Die Schimäre “Lesbarkeitâ€ ist auf unterschiedliche Weise dingfest zu machen.

Ganz vorweg: Im hier beschriebenen Experiment wurde “Lesbarkeitâ€ mit “Lesegeschwindigkeitâ€ gleichgesetzt. Das heißt: Es wurde unterstellt, dass “guteâ€ Typografie schneller lesbar ist als “schlechteâ€. Das ist eine durchaus gängige, wenn auch nicht unumstrittene Methode: Man könnte alternativ beispielsweise auch den sogenannten “Wissenszuwachsâ€ als Maßstab für “gute Lesbarkeitâ€ nehmen, gemessen an der Frage: Hat der Leser die Informationen des Textes überhaupt aufgenommen, verarbeitet und verstanden? Nur: wie will man “Wissenszuwachsâ€ messen, ohne den vorigen Wissensstand abzufragen? Und wie kann man vor Test-Beginn das Wissen eines Teilnehmers abfragen, ohne dass er ahnte, worauf er im folgenden Text zu achten hätte?

Einige Forscher haben auch schon versucht, die “Ermüdungâ€ eines Lesers als Indiz für gute oder schlechte Typografie heranzuziehen. Messen kann man diese Ermüdung beispielsweise am Puls oder an der Anzahl der Augenzwinkerer beim Lesen. Beides ist in einem Online-Experiment allerdings reichlich schwer zu verwirklichen.

Das Prinzip “Stolperwort”

Wie aber misst man online Lesezeiten? Unser Experiment war folgendermaßen konzipiert: Alle Teilnehmenden bekamen nacheinander 4 Texte vorgesetzt, in denen jeweils zwei Wörter versteckt waren, die eindeutig den Lesefluss störten, aber durchaus zum Thema passten. Auf diese “Stolperwörterâ€ sollten die Leser klicken. Sobald das zweite Stolperwort entdeckt war, hielt die Zeit an. Aus der Zeit bis zum Entdecken des jeweils zweiten Stolperwortes schlossen wir auf die “Lesbarkeitâ€.

Noch ein ganz wichtiger Hinweis

Alle Texte im Experiment umfassten um die 110 Wörter. Das bedeutet: Gemessen wurde unter den Bedingungen von klassisch-linearen Lesetexten. Insofern ist zumindest Vorsicht geboten, was das Übertragen unserer Messdaten auf andere Textsorten angeht: Es ist zwar nicht ausgeschlossen, dass die Resultate beispielsweise auch anwendbar sind auf Navigationsleisten-Schriften oder Mini-Teaser, deren Größen ja gerne eher unterdurchschnittlich ausfallen. Es kann genauso gut sein, dass einige unserer Ergebnisse auch auf den stolzen Akzidenz-Typus “Überschrift” anwendbar sind. Sicher ist das allerdings nicht.

SCHRIFTARTEN

Die Fraktur ist fast ausgestorben

Leidenschaftliche Typografen werden aufheulen ob des Grobschnitts dieser Feststellung – aber Fakt ist: wir leben in einer Antiqua-dominierten Schriftkultur. In einer Welt, die dominiert wird von Zeichen, die im Wesen auf die Capitalis der römischen Antike zurückgehen. Und schon folgt der nächste Grobschnitt: Im Kern sind diese modernen Antiqua zwei Großklassen zuzuordnen – nämlich der der serifentragenden und der der serifenlosen Antiqua. Dass die reiche Sphäre der Typografie deutlich feinere Differenzierungen verdient (und auch kennt), sei erwähnt und im folgenden schlicht ignoriert.

Denn Serife gegen Groteske: im Mikrokosmos der Typografen war diese Debatte die prägende des 20. Jahrhunderts. Mit dem Vormarsch der Bildschirmmedien hat sich die Diskussion zwar ein wenig verlagert in der Argumentation, geht aber weiter.

Serife vs. Groteske – hundert Jahre Glaubenskrieg

Wobei man konstatieren muss, dass wir heute – glücklicherweise! – weit entfernt sind von der Unerbittlichkeit, der ideologischen Aufladung, ja der Militanz, mit der die Schrift-Debatte in den zwanziger und dreißiger Jahren geführt wurde. Da verunglimpften die Nazis serifenlose Schöpfungen als “undeutschâ€, als “jüdisch-bolschewistischâ€, als “volksfeindlichâ€.

Wobei sie weniger der Schriftformen als solche meinten als jene Menschen, die diese Schriften schufen und einsetzten: die Modernisten, die Vertreter der “neuen Sachlichkeitâ€, die Gegner des wilhelminischen Pomps in Architektur, Möbelbau und Kunsthandwerk. Wer fürs Dessauer Bauhaus und „De Stijlâ€ war, war für Rationalisierung, für die kompromisslose Versachlichung der Welt, also auch der Schriftzeichen – folglich mussten die Serifen weichen.

Diese Haltung brachte naturgemäß jene auf den Plan, denen die radikale Ausmerzung allen Ornaments zu weit ging. Das mussten, wohlgemerkt, nicht gleich Nazis sein, Protest äußerten auch wertkonservative Ästheten, die sich – durchaus zu Recht – dagegen sträubten, aus ideologischer Kompromisslosigkeit alles über Bord zu werfen, was in vier Jahrhunderten Typografie gereift war und sich bewährt hatte. Serifenlose Schriften empfanden diese Menschen als “groteskâ€. Ein Name war geschaffen für den Schrifttypus, der heute geschätzte 90 Prozent aller Webseiten prägt.

Serife vs. Groteske – objektiv steht es unentschieden

Vor allem in den dreißiger und vierziger Jahren machten sich meist angelsächsische Forscher daran, der ideologischen Debatte eine wissenschaftliche Grundierung zu schaffen. Die Ergebnisse sind rasch zusammengefasst: Praktisch keine Studie dieser Zeit (und auch kaum eine spätere) ergab nennenswerte Unterschiede zwischen Serife und Serifenlosen in der objektiven Lesbarkeit.

In der herrschenden Meinung freilich behielten die Serifen tendenziell das Zepter in der Hand: Hilfsweise wurde nun argumentiert, die Serifen betonten und erleichterten die horizontale Leseführung (wie oft lesen Sie vertikal?), die Oberhälften serifentragender Schriften seien eindeutiger zu identifizieren (ich persönlich lese nur ganze Buchstaben) und die Leser mögten keine Experimente, läsen am besten gewohnte Schriftbilder (durchaus ein gutes Argument). Auch die Zeitungen blieben überwältigend mehrheitlich beim Gewohnten, bei der Serife. Half aber alles nichts: Objektiv stand es unentschieden zwischen Serife und Grotesker.

Bildschirm-Typografie: Das Runde muss leider ins Eckige

Und dann kamen die Bildschirmmedien mit ihren eckigen Pixel-Rastern. Und warfen neue, diesmal eher unideologische Fragen auf. Denn die Digital-Prozessoren konstruierten tendenziell grauenhafte Figuren auf die Monitore. Womit wir bei der Bildschirm-Debatte angelangt wären, bei der Monitor-Typografie.

Um es gleich vorwegzunehmen: Ich finde die “Timesâ€ am Bildschirm grässlich. Das eckige Monitor-Raster vergewaltigt – vor allem in kleineren Schriftgrößen – diese an sich ja zu Recht populäre Schriftart in die Würdelosigkeit, degradiert feine Serifen zu Klumpfüßen, lässt Rundungen zu abknickenden Vorfahrten degenerieren, Diagonalen zu Steiltreppen und Schwünge zu Sägezähnen. Im Grunde ist es eine Beleidigung der Schriftart “Timesâ€, fein geschöpft Ende der zwanziger Jahre, dass man ihren Wechselbalg am Bildschirm überhaupt beim selben Namen ruft.

Da hilft auch das Prinzip der Schriftglättung nur ein bisschen weiter – jenes Simulieren von Rundungen und Feinstrichen also mittels Grauabstufungen. ClearType heißt diese Technologie, die zumindest in Windows Vista inzwischen Standard ist bei der Schriftdarstellung. Der Original-Times allerdings nähert man sich auch mit diesem Verfahren nur teilweise.

Verpixelt = unlesbar?

Was aber folgt aus dieser Feststellung? Wer sich umhört und ein bisschen liest, wird oft auf einen Kausalschluss treffen: Weil die Times im besonderen, serifentragende Schriften im allgemeinen so schwere Verwüstungen erführen am Monitor, seien sie schlecht lesbar, behaupten viele Autoren. Und sollten daher nicht verwendet werden. Zumindest nicht in Lese-Schriftgrößen. Empfehlenswert seien vielmehr serifenlose Schriften: also “Groteskeâ€ wie “Arialâ€ oder “Verdanaâ€, weil sich deren Vergewaltigungen am Monitor vergleichsweise in Grenzen hielten. Und diese These hält sich inzwischen genauso hartnäckig wie die von der Serifen-Überlegenheit auf Papier. Der Einschub sei gestattet: Ich halte beide für falsch.

12 Schriftarten im Vergleich

Welche Schriftarten sollten wir nun ins Rennen schicken für die Vermessung der Browser-Welt? Klar war früh in der Konzeptionsphase des Experiments: Es mussten zumindest die sechs “klassischenâ€ Web-Schriftarten dabei sein – jene sechs also, die vermutet auf nahezu jedem Empfangsrechner weltweit installiert sind und auf deren Verwendung genau wegen dieser Massenverbreitung geschätzte 98 Prozent aller seriösen Webseiten des Jahres 2009 anno domini aufbauen: “Times”, “Arialâ€, “Verdanaâ€, “Georgiaâ€, “Tahomaâ€ und “Trebuchetâ€.

Hinzu nahmen wir die “Câ€-Reihe aus Windows Vista. Denn auch wenn’s mit der Marktdurchdringung des Betriebssystems bisher nicht wie am Microsoft-Stammsitz Redmond gewohnt klappen wollte – es ist wohl davon auszugehen, dass die XP-Nachfolger Vista und 7 sich in den kommenden zwei, drei Jahren auf den PCs weltweit durchsetzen werden. Und mit ihnen die Schriftarten “Calibriâ€, “Cambriaâ€, “Candaraâ€, “Constantiaâ€ und “Corbelâ€.

Nicht einbezogen aus der “C-Reiheâ€ haben wir lediglich die “Consolasâ€, ebenso wenig übrigens wie die deutlich ältere “Courierâ€ – diese beiden Monotype-Fonts, deren Buchstaben alle exakt gleich breit geschnitten sind, bewegen sich im Web zumindest derzeit so abseits der Mode, dass uns eine Untersuchung den Aufwand nicht wert schien.

Als zwölfte Schriftart schließlich trat die “Segoeâ€ hinzu – die neue Systemschrift von “Vistaâ€, der nicht ganz zu Unrecht eine staunenswerte Ähnlichkeit mit einer der größten Typo-Schöpfungen der vergangenen 100 Jahre unterstellt wird: der Schriftart “Frutigerâ€. Unterschätzt hatten wir bei der Konzeption des Experiments allerdings das Potenzial der “Lucida Grande”, die nicht zuletzt durch Twitter einen gewaltigen Popularitätsschub erfahren hat und in den vergangenen Monaten auf immer mehr Webseiten Verwendung findet. Deswegen fehlte sie leider im Experiment. Niemand ärgert sich darüber mehr als ich selbst.

Differenzen, die kaum der Rede wert sind

Das wichtigste Ergebnis des Schriftart-Vergleichs gleich vorweg: Der erwähnte Kausalschluss “Schrift verunstaltet = Schrift schlecht lesbarâ€ scheint schlichtweg nicht haltbar. Betrachtet man die Ergebnisse der Studie, so zeigt sich, dass Vorhandensein oder die Abwesenheit von Serifen für die objektive Lesegeschwindigkeit keine Rolle spielt. Mehr noch: Aus Lesbarkeits-Sicht unterscheiden sich zumindest die 12 getesteten Schriftarten so gut wie gar nicht.

Zwar lasen die Teilnehmer Texte in der Schriftart “Arialâ€ (einer Grotesken) in der Tat am schnellsten. Die schlechtesten Zeiten allerdings kamen ebenfalls bei einer Serifenlosen zustande (“Corbelâ€). Und was noch viel wichtiger ist: Die Differenz zwischen vermeintlich “besterâ€ und vermeintlich “schlechtesterâ€ Schriftart betrug gerade mal 3,9 Prozent in der Lesegeschwindigkeit. Hochgerechnet bedeutet das: Wer einen Text in der Schriftart “Arialâ€ in zehn Minuten durchliest, braucht für den selben Text in “Corbelâ€ zehn Minuten und dreiundzwanzig Sekunden. Darf man aus solchen Werten allen Ernstes verbindliche Empfehlungen ableiten?

Ergebnisse früherer Studien: durchaus bestätigt

Wer forscht, sucht nach Gesetzmäßigkeiten. Wer empirisch erhebt, will aus Daten Prognosen ableiten. Die Frage ist also: Inwiefern sind diese ersten Resultate unseres Experiments generalisierbar? Sind die Ergebnisse anwendbar auf alle Antiqua, die im Web Verwendung finden, also auch auf jene, die wir nicht getestet haben? Sind sie, vor allem, auf jene Schriftarten anwendbar, die noch zu schöpfen sein werden in den kommenden Jahren? An dieser Stelle betreten wir die Sphäre des Spekulativen. Für mich spricht allerdings einiges dafür, die Schriftart-Ergebnisse unserer Studie zu verallgemeinern. Zumal sie hochsignifikant ausfielen in stochastischer Hinsicht und auf Basis einer großen Teilnehmerzahl – und zusätzlich alles andere als isoliert dastehen in der Gesamtschau bisheriger Studien.

Die Varianzanalyse der Daten ergab denn auch: der Faktor “Schriftartâ€ im Ganzen übt keinen so genannten “statistischen Haupteinflussâ€ auf die Leseleistung aus. Fürs Lesetempo ist die Wahl der Schriftart also statistisch nicht signifikant als Einflussfaktor. Damit deckten sich unsere Ergebnisse mit diversen früheren Studien, in denen samt und sonders zwar hier mal die “Georgiaâ€ “gewannâ€, mal die “Arialâ€ und mal die “Timesâ€ – in denen aber nie ein wirklich statistisch bedeutsamer Unterschied zwischen den verglichenen Schriftarten festgestellt wurde (Weisenmiller; Bernard et al.; Boyarski et al; Hill/Scharff; Redelius; Bernard/Mills; Bernard et al.; Tullis et al.; Liebig).

Nicht unterschlagen werden soll allerdings die Studie von Bernard et al., die immerhin ergab, dass die dortigen Testsieger “Timesâ€ und “Arialâ€ (die “Times” gewann!) signifikant besser lesbar waren als “Century Schoolbookâ€, “Courierâ€ und “Verdanaâ€. Allerdings ist festzuhalten, dass insgesamt sieben Schriftarten genauso gut abschnitten wie die Sieger-Lettern – und diese Untersuchung insgesamt sehr vereinzelt dasteht in ihren Resultaten.

1 2 3