Beitrag von Martin Liebig
Serife gegen Groteske: die Lehrbuch-Meinung unterstellt beharrlich Qualitätsunterschiede, die offenkundig nicht existieren. Eine neue Studie zeigt: Viel wichtiger als die oft beschworene “objektive” Lesbarkeit ist, was eine Schriftart ausstrahlt – ihr „Look and Feel.
Starten wir banal: Schrift muss gut lesbar sein. Höre ich Widerspruch? Fehlanzeige, selbstredend.
Schrift darf natürlich gerne auch ein bisschen gut aussehen. Den thematischen Kontext betonen. In ihrer visuellen Tonalität Wertigkeit ausstrahlen. Freundlichst zum Lesen einladen. Aber: Sie muss immer noch und zuallererst gut lesbar sein. Unbedingt gut lesbar sein. Gute Lesbarkeit ist das Wichtigste überhaupt. Höre ich Widerspruch?
Wahrscheinlich nicht. Und das ist schade. Denn die Typografie, vor allem die Web-Typografie, sie droht unter die Räder zu geraten von Technokraten, von selbsterkorenen Lesbarkeits-Optimierern, von halbinformierten Systemadministratoren, von lehrbuchtreuen Mediengestaltern, die uns seit Jahren eine Web-Welt voller Nur-Verdana-Seiten bescheren. Sachbearbeiter mit Zuständigkeitsrandgebiet Optik sind dies oft, die den Reiz guter Typografie auf den Faktor Lesegeschwindigkeit reduzieren, weil man Ästhetik und Themenadäquatheit leider nicht in Sekunden messen kann. Jene Menschen sind es, die uns gerne sagen: Serifen sind schlecht lesbar auf dem Monitor, das weiß doch inzwischen jeder, nimm lieber Verdana. Gerne folgt der Zusatz: Macht Spiegel Online doch auch. Spiegel Online kommt irgendwann immer.
Lesbarkeit: ein gefährliches Totschlagargument
Ich möchte das Design Tagebuch nutzen, um diesen Kontoristen der Gestaltung zu entgegnen: Lesbar sind sie ohnehin, die erbärmlich wenigen Schriftarten, die wir im HTML-basierten Webdesign einsetzen können. Vielleicht nicht so gut wie ihre Äquivalente auf Papier, aber im wechselseitigen Vergleich annähernd gleich gut, ob mit oder ohne Serifen, ob kräftig im Stamm oder fein ziseliert, ob großzügig im Innenraum oder drangvoll.
Bevor wir also – immer selbstredend wegen der Lesbarkeit – die nächste Seite wieder nur aus Verdana-Variationen zusammenbauen, geben wir der typografischen Ästhetik eine neue Chance, dem harmonischen Schriftbild, der spannungsreichen Mischung vor allem, und der themenangemessenen Optik. Selten war die Gelegenheit günstiger: Mit der absehbaren Verbreitung der neuen Vista-Schriftenreihe werden die typografischen Potenziale im Web immens wachsen.
Nutzen wir also die Chance, nehmen wir wieder stärker in den Fokus, was zu Unrecht immer mehr zum Randaspekt der Web-Typografie zu verkommen droht: das Look-and-Feel von Schrift. Den Schriftcharakter. Das, was eine Schrift repräsentiert und ausstrahlt: ihr Wesen. Entdecken wir auch im Web neu, was gute Typografie seit einem halben Jahrtausend adelt: kreativer, inhaltsorientierter, fantasievoller Umgang mit Zeichen, ihre Kombination, ihre wechselseitige Spannung, ihr visuelles Mantra. Gebrauchen wir auch im Browser das Medium Schrift, um Individualität und Qualität nachzuweisen. Kurzum: Es ist an der Zeit, auch online die weichen Schriftfaktoren den vermeintlich harten vorzuziehen. Und zwar eindeutiger denn je.
Ein Experiment mit mehr als 3000 Teilnehmern
Eine gewagte These? Ich glaube nicht. Ich habe die Ehre, hier im Design Tagebuch berichten zu dürfen von einem Online-Experiment, das die Fachhochschule Gelsenkirchen Ende 2008, Anfang 2009 unter meiner Leitung durchgeführt hat. Über 3000 Menschen nahmen teil an diesem Experiment, das groß angelegt war: Gemessen wurden die Lesezeiten von 12 verschiedenen Schriftarten, wir testeten verschiedene Schriftgrößen und Zeilenabstände, variierten die Zeilenbreiten gezielt – und kombinierten all diese Faktoren miteinander, was 1440 typografische Test-Konstellationen ergab.
Ganz zum Schluss fragten wir dann noch Sympathienoten für verschiedene Fonts ab – und stellten etwas überrascht fest, dass damit des Pudels Kern getroffen war. Denn außer der Schriftgröße gibt es augenscheinlich keinen harten typografischen Aspekt, der in seiner Bedeutung die schlicht ästhetische Wirkung des Schriftbildes überragt.
Dieses Experiment war damit in Aufgabenstellung und Teilnehmerzahl – nach meiner Kenntnis – das ambitionierteste, das bislang gestartet wurde. Weltweit, wohlgemerkt. Doch nun genug geprahlt.
Wie misst man “Lesbarkeit”?
“Gut lesbar” – an welchen Indizien macht sich dieses typografische Kompliment eigentlich fest? Und wenn die Anhaltspunkte für die Güte einer typografischen Anordnung existieren und benannt sind: wie überführt man diese dann, im Folgeschritt, in eine Vergleichs-Einheit, macht sie empirisch messbar? Ein Blick in frühere Studien zeigt: Die Schimäre Lesbarkeit ist auf unterschiedliche Weise dingfest zu machen.
Ganz vorweg: Im hier beschriebenen Experiment wurde Lesbarkeit mit Lesegeschwindigkeit gleichgesetzt. Das heißt: Es wurde unterstellt, dass gute Typografie schneller lesbar ist als schlechte. Das ist eine durchaus gängige, wenn auch nicht unumstrittene Methode: Man könnte alternativ beispielsweise auch den sogenannten Wissenszuwachs als Maßstab für gute Lesbarkeit nehmen, gemessen an der Frage: Hat der Leser die Informationen des Textes überhaupt aufgenommen, verarbeitet und verstanden? Nur: wie will man Wissenszuwachs messen, ohne den vorigen Wissensstand abzufragen? Und wie kann man vor Test-Beginn das Wissen eines Teilnehmers abfragen, ohne dass er ahnte, worauf er im folgenden Text zu achten hätte?
Einige Forscher haben auch schon versucht, die Ermüdung eines Lesers als Indiz für gute oder schlechte Typografie heranzuziehen. Messen kann man diese Ermüdung beispielsweise am Puls oder an der Anzahl der Augenzwinkerer beim Lesen. Beides ist in einem Online-Experiment allerdings reichlich schwer zu verwirklichen.
Das Prinzip “Stolperwort”
Wie aber misst man online Lesezeiten? Unser Experiment war folgendermaßen konzipiert: Alle Teilnehmenden bekamen nacheinander 4 Texte vorgesetzt, in denen jeweils zwei Wörter versteckt waren, die eindeutig den Lesefluss störten, aber durchaus zum Thema passten. Auf diese Stolperwörter sollten die Leser klicken. Sobald das zweite Stolperwort entdeckt war, hielt die Zeit an. Aus der Zeit bis zum Entdecken des jeweils zweiten Stolperwortes schlossen wir auf die Lesbarkeit.
Noch ein ganz wichtiger Hinweis
Alle Texte im Experiment umfassten um die 110 Wörter. Das bedeutet: Gemessen wurde unter den Bedingungen von klassisch-linearen Lesetexten. Insofern ist zumindest Vorsicht geboten, was das Übertragen unserer Messdaten auf andere Textsorten angeht: Es ist zwar nicht ausgeschlossen, dass die Resultate beispielsweise auch anwendbar sind auf Navigationsleisten-Schriften oder Mini-Teaser, deren Größen ja gerne eher unterdurchschnittlich ausfallen. Es kann genauso gut sein, dass einige unserer Ergebnisse auch auf den stolzen Akzidenz-Typus “Überschrift” anwendbar sind. Sicher ist das allerdings nicht.
SCHRIFTARTEN
Die Fraktur ist fast ausgestorben
Leidenschaftliche Typografen werden aufheulen ob des Grobschnitts dieser Feststellung – aber Fakt ist: wir leben in einer Antiqua-dominierten Schriftkultur. In einer Welt, die dominiert wird von Zeichen, die im Wesen auf die Capitalis der römischen Antike zurückgehen. Und schon folgt der nächste Grobschnitt: Im Kern sind diese modernen Antiqua zwei Großklassen zuzuordnen – nämlich der der serifentragenden und der der serifenlosen Antiqua. Dass die reiche Sphäre der Typografie deutlich feinere Differenzierungen verdient (und auch kennt), sei erwähnt und im folgenden schlicht ignoriert.
Denn Serife gegen Groteske: im Mikrokosmos der Typografen war diese Debatte die prägende des 20. Jahrhunderts. Mit dem Vormarsch der Bildschirmmedien hat sich die Diskussion zwar ein wenig verlagert in der Argumentation, geht aber weiter.
Serife vs. Groteske – hundert Jahre Glaubenskrieg
Wobei man konstatieren muss, dass wir heute – glücklicherweise! – weit entfernt sind von der Unerbittlichkeit, der ideologischen Aufladung, ja der Militanz, mit der die Schrift-Debatte in den zwanziger und dreißiger Jahren geführt wurde. Da verunglimpften die Nazis serifenlose Schöpfungen als undeutsch, als jüdisch-bolschewistisch, als volksfeindlich.
Wobei sie weniger der Schriftformen als solche meinten als jene Menschen, die diese Schriften schufen und einsetzten: die Modernisten, die Vertreter der neuen Sachlichkeit, die Gegner des wilhelminischen Pomps in Architektur, Möbelbau und Kunsthandwerk. Wer fürs Dessauer Bauhaus und „De Stijl war, war für Rationalisierung, für die kompromisslose Versachlichung der Welt, also auch der Schriftzeichen – folglich mussten die Serifen weichen.
Diese Haltung brachte naturgemäß jene auf den Plan, denen die radikale Ausmerzung allen Ornaments zu weit ging. Das mussten, wohlgemerkt, nicht gleich Nazis sein, Protest äußerten auch wertkonservative Ästheten, die sich – durchaus zu Recht – dagegen sträubten, aus ideologischer Kompromisslosigkeit alles über Bord zu werfen, was in vier Jahrhunderten Typografie gereift war und sich bewährt hatte. Serifenlose Schriften empfanden diese Menschen als grotesk. Ein Name war geschaffen für den Schrifttypus, der heute geschätzte 90 Prozent aller Webseiten prägt.
Serife vs. Groteske – objektiv steht es unentschieden
Vor allem in den dreißiger und vierziger Jahren machten sich meist angelsächsische Forscher daran, der ideologischen Debatte eine wissenschaftliche Grundierung zu schaffen. Die Ergebnisse sind rasch zusammengefasst: Praktisch keine Studie dieser Zeit (und auch kaum eine spätere) ergab nennenswerte Unterschiede zwischen Serife und Serifenlosen in der objektiven Lesbarkeit.
In der herrschenden Meinung freilich behielten die Serifen tendenziell das Zepter in der Hand: Hilfsweise wurde nun argumentiert, die Serifen betonten und erleichterten die horizontale Leseführung (wie oft lesen Sie vertikal?), die Oberhälften serifentragender Schriften seien eindeutiger zu identifizieren (ich persönlich lese nur ganze Buchstaben) und die Leser mögten keine Experimente, läsen am besten gewohnte Schriftbilder (durchaus ein gutes Argument). Auch die Zeitungen blieben überwältigend mehrheitlich beim Gewohnten, bei der Serife. Half aber alles nichts: Objektiv stand es unentschieden zwischen Serife und Grotesker.
Bildschirm-Typografie: Das Runde muss leider ins Eckige
Und dann kamen die Bildschirmmedien mit ihren eckigen Pixel-Rastern. Und warfen neue, diesmal eher unideologische Fragen auf. Denn die Digital-Prozessoren konstruierten tendenziell grauenhafte Figuren auf die Monitore. Womit wir bei der Bildschirm-Debatte angelangt wären, bei der Monitor-Typografie.
Um es gleich vorwegzunehmen: Ich finde die Times am Bildschirm grässlich. Das eckige Monitor-Raster vergewaltigt – vor allem in kleineren Schriftgrößen – diese an sich ja zu Recht populäre Schriftart in die Würdelosigkeit, degradiert feine Serifen zu Klumpfüßen, lässt Rundungen zu abknickenden Vorfahrten degenerieren, Diagonalen zu Steiltreppen und Schwünge zu Sägezähnen. Im Grunde ist es eine Beleidigung der Schriftart Times, fein geschöpft Ende der zwanziger Jahre, dass man ihren Wechselbalg am Bildschirm überhaupt beim selben Namen ruft.
Da hilft auch das Prinzip der Schriftglättung nur ein bisschen weiter – jenes Simulieren von Rundungen und Feinstrichen also mittels Grauabstufungen. ClearType heißt diese Technologie, die zumindest in Windows Vista inzwischen Standard ist bei der Schriftdarstellung. Der Original-Times allerdings nähert man sich auch mit diesem Verfahren nur teilweise.
Verpixelt = unlesbar?
Was aber folgt aus dieser Feststellung? Wer sich umhört und ein bisschen liest, wird oft auf einen Kausalschluss treffen: Weil die Times im besonderen, serifentragende Schriften im allgemeinen so schwere Verwüstungen erführen am Monitor, seien sie schlecht lesbar, behaupten viele Autoren. Und sollten daher nicht verwendet werden. Zumindest nicht in Lese-Schriftgrößen. Empfehlenswert seien vielmehr serifenlose Schriften: also Groteske wie Arial oder Verdana, weil sich deren Vergewaltigungen am Monitor vergleichsweise in Grenzen hielten. Und diese These hält sich inzwischen genauso hartnäckig wie die von der Serifen-Überlegenheit auf Papier. Der Einschub sei gestattet: Ich halte beide für falsch.
12 Schriftarten im Vergleich
Welche Schriftarten sollten wir nun ins Rennen schicken für die Vermessung der Browser-Welt? Klar war früh in der Konzeptionsphase des Experiments: Es mussten zumindest die sechs klassischen Web-Schriftarten dabei sein – jene sechs also, die vermutet auf nahezu jedem Empfangsrechner weltweit installiert sind und auf deren Verwendung genau wegen dieser Massenverbreitung geschätzte 98 Prozent aller seriösen Webseiten des Jahres 2009 anno domini aufbauen: Times, Arial, Verdana, Georgia, Tahoma und Trebuchet.
Hinzu nahmen wir die C-Reihe aus Windows Vista. Denn auch wenn’s mit der Marktdurchdringung des Betriebssystems bisher nicht wie am Microsoft-Stammsitz Redmond gewohnt klappen wollte – es ist wohl davon auszugehen, dass die XP-Nachfolger Vista und 7 sich in den kommenden zwei, drei Jahren auf den PCs weltweit durchsetzen werden. Und mit ihnen die Schriftarten Calibri, Cambria, Candara, Constantia und Corbel.
Nicht einbezogen aus der C-Reihe haben wir lediglich die Consolas, ebenso wenig übrigens wie die deutlich ältere Courier – diese beiden Monotype-Fonts, deren Buchstaben alle exakt gleich breit geschnitten sind, bewegen sich im Web zumindest derzeit so abseits der Mode, dass uns eine Untersuchung den Aufwand nicht wert schien.
Als zwölfte Schriftart schließlich trat die Segoe hinzu – die neue Systemschrift von Vista, der nicht ganz zu Unrecht eine staunenswerte Ähnlichkeit mit einer der größten Typo-Schöpfungen der vergangenen 100 Jahre unterstellt wird: der Schriftart Frutiger. Unterschätzt hatten wir bei der Konzeption des Experiments allerdings das Potenzial der “Lucida Grande”, die nicht zuletzt durch Twitter einen gewaltigen Popularitätsschub erfahren hat und in den vergangenen Monaten auf immer mehr Webseiten Verwendung findet. Deswegen fehlte sie leider im Experiment. Niemand ärgert sich darüber mehr als ich selbst.
Differenzen, die kaum der Rede wert sind
Das wichtigste Ergebnis des Schriftart-Vergleichs gleich vorweg: Der erwähnte Kausalschluss Schrift verunstaltet = Schrift schlecht lesbar scheint schlichtweg nicht haltbar. Betrachtet man die Ergebnisse der Studie, so zeigt sich, dass Vorhandensein oder die Abwesenheit von Serifen für die objektive Lesegeschwindigkeit keine Rolle spielt. Mehr noch: Aus Lesbarkeits-Sicht unterscheiden sich zumindest die 12 getesteten Schriftarten so gut wie gar nicht.
Zwar lasen die Teilnehmer Texte in der Schriftart Arial (einer Grotesken) in der Tat am schnellsten. Die schlechtesten Zeiten allerdings kamen ebenfalls bei einer Serifenlosen zustande (Corbel). Und was noch viel wichtiger ist: Die Differenz zwischen vermeintlich bester und vermeintlich schlechtester Schriftart betrug gerade mal 3,9 Prozent in der Lesegeschwindigkeit. Hochgerechnet bedeutet das: Wer einen Text in der Schriftart Arial in zehn Minuten durchliest, braucht für den selben Text in Corbel zehn Minuten und dreiundzwanzig Sekunden. Darf man aus solchen Werten allen Ernstes verbindliche Empfehlungen ableiten?

Ergebnisse früherer Studien: durchaus bestätigt
Wer forscht, sucht nach Gesetzmäßigkeiten. Wer empirisch erhebt, will aus Daten Prognosen ableiten. Die Frage ist also: Inwiefern sind diese ersten Resultate unseres Experiments generalisierbar? Sind die Ergebnisse anwendbar auf alle Antiqua, die im Web Verwendung finden, also auch auf jene, die wir nicht getestet haben? Sind sie, vor allem, auf jene Schriftarten anwendbar, die noch zu schöpfen sein werden in den kommenden Jahren? An dieser Stelle betreten wir die Sphäre des Spekulativen. Für mich spricht allerdings einiges dafür, die Schriftart-Ergebnisse unserer Studie zu verallgemeinern. Zumal sie hochsignifikant ausfielen in stochastischer Hinsicht und auf Basis einer großen Teilnehmerzahl – und zusätzlich alles andere als isoliert dastehen in der Gesamtschau bisheriger Studien.
Die Varianzanalyse der Daten ergab denn auch: der Faktor Schriftart im Ganzen übt keinen so genannten statistischen Haupteinfluss auf die Leseleistung aus. Fürs Lesetempo ist die Wahl der Schriftart also statistisch nicht signifikant als Einflussfaktor. Damit deckten sich unsere Ergebnisse mit diversen früheren Studien, in denen samt und sonders zwar hier mal die Georgia gewann, mal die Arial und mal die Times – in denen aber nie ein wirklich statistisch bedeutsamer Unterschied zwischen den verglichenen Schriftarten festgestellt wurde (Weisenmiller; Bernard et al.; Boyarski et al; Hill/Scharff; Redelius; Bernard/Mills; Bernard et al.; Tullis et al.; Liebig).
Nicht unterschlagen werden soll allerdings die Studie von Bernard et al., die immerhin ergab, dass die dortigen Testsieger Times und Arial (die “Times” gewann!) signifikant besser lesbar waren als Century Schoolbook, Courier und Verdana. Allerdings ist festzuhalten, dass insgesamt sieben Schriftarten genauso gut abschnitten wie die Sieger-Lettern – und diese Untersuchung insgesamt sehr vereinzelt dasteht in ihren Resultaten.
Zwischenfazit Schriftarten: Es gibt Wichtigeres zu diskutieren
Anstelle eines ausufernden Fazits sei an dieser Stelle eine kleine These zum Weiterdiskutieren platziert. Sie lautet: Die Welt der Schriftzeichen ist so spannend, so reizvoll, aber auch so polarisierend, dass es Typografen seit Jahrzehnten offenbar schwer fällt anzuerkennen, dass Gebrauchsschriften kaum wissenschaftlich objektivierbar sind. Darum halten sich Legenden wie “Auf dem Papier serif, auf dem Monitor sans serif” auch so hartnäckig – weil sie kurz sind, gut zu merken, und weil sie Halt geben in jenen Debatten mit Kunden, denen Meta-Diskussionen über Strichstärken, Themenadäquatheit und Gestehungsepochen nichts gelten. Aus dem selben Grund, so behaupte ich ferner, wird besagte Legende auch vermeintlich immer wahrer, nur weil sie ständig ein Autor vom anderen abschreibt. Denn wer verfasst schon gerne ein Lehrbuch, am besten eines für “Dummies”, und entwertet sein Dozententum durch die windelweiche Aussage: “Nehmt einfach die Schrift, die ihr für die angemessenste haltet”? Lehrbuch-Leser wünschen Kochrezepte. Und keine Aufforderung, sich näher mit Typografie zu befassen.
SCHRIFTARTEN – IM URTEIL DER LESER
Was also folgern wir aus diesem ersten Datensatz? Ist es am Ende tatsächlich unerheblich, welche Schriftarten wir verwenden im Web? Durchaus nicht – wenn man als Maßstab nicht „physische Textqualitäten anlegt, sondern die Subjektivität des Betrachter-Urteils. Und dies taten wir: Wir legten den Teilnehmern des Experiments, nachdem diese ihre acht Stolperwörter gefunden hatten, jeweils zwei identische Texte in unterschiedlichen Schriftarten vor, und fragten: Welche dieser beiden Schriftarten halten Sie für besser lesbar?
Jeder elfte hält zur “Times”
Und an dieser Stelle war’s vorbei mit den Minimal-Unterschieden aus der Geschwindigkeits-Messung. 91 % der Probanden entschieden beispielsweise: die Verdana ist im direkten Vergleich mit der Times die besser lesbare Type (die Times – Mathematiker ahnen es bereits – hielten nur 9 % für besser lesbar in diesem spezifischen Duell).
Insgesamt kombinierten wir im Experiment jede Schriftart mit jeder der elf anderen 57 Mal, schickten also jede Schriftart in insgesamt 627 Vergleiche und fragten immer nach der jeweils besseren der beiden dargebotenen Schriftarten (Empiriker nennen so etwas Dominanzpaarvergleich). Es würde den Rahmen dieses Beitrags sprengen, jede einzelne diese Gegenüberstellungen im Detail nachzuzeichnen. Ich werde mich auf die Gesamt-Voten pro Schriftart beschränken – und allein diese Daten sind interessant genug. Zumal im übrigen keine Divergenzen festzustellen waren zwischen Frauen und Männern, Alten und Jungen: Was die Geschmacks-Fragen im Experiment anging, stellten wir weder einen Generationen- noch einen Geschlechterkonflikt fest. Vor der Typografie sind tatsächlich alle gleich, so scheint es.
Welche Schriftart ist besser lesbar?
Auf die Frage, welche Schriftart sie für die besser lesbare hielten, votierten 80 Prozent der Teilnehmer – egal, mit welcher anderen Schriftart gerade verglichen wurde – für die Verdana. In 74 Prozent der Fälle hatte die Trebuchet die Nase vorn und landete damit auf Platz zwei der subjektiven Lesbarkeits-Skala.
Schon auf den ersten Blick ist dieses Ergebnis interessant. Denn Verdana-dominierte Seiten finden sich im Web zwar wie Sand am Meer, die Trebuchet allerdings hat nach meiner Beobachtung erheblich an Präsenz verloren in den vergangenen Jahren im deutschsprachigen Web. Nur teilweise zutreffend scheint mithin die verbreitete These, dass Leser vor allem Gewohntes mögten, dass sie auch im Schriftbild Bewährtes vorzögen. Zumal auf Platz drei der vermeintlich bestlesbaren Schriftarten die Segoe landete, ein völlig neuer Font also, der im massenhaften Webgebrauch des Jahres 2009 so gut wie keine Rolle spielen und den meisten Teilnehmern unbekannt gewesen sein dürfte – angesichts der Marktdurchdringung von dünnen 4 %, die Windows Vista zum Zeitpunkt der Studie erreicht hatte.

Was schließen wir aus diesen Daten? Zunächst vor allem: die objektive, physisch messbare Lesbarkeit einer Schriftart muss keineswegs korrespondieren mit ihrer subjektiven Lesbarkeit, der Qualität also, die Leser dieser Schriftart zuerkennen. Im Gegenteil.
Die hochspannende Frage, die sich aus diesen Daten ergibt: Wieviele Sympathien, ja Vorschusslorbeeren ernten wir potenziell, wenn wir unsere Seiten gemäß dieser Erkenntnisse ausstatten? Oder, anders herum gefragt: Verlieren wir Leser, wenn wir eine – offenkundig – schlecht beleumundete Georgia verwenden, jene Schriftart also, die ja objektiv keineswegs schlechter lesbar ist als die elf anderen? Wieviel Wert sollten wir also der gefühlten Lesbarkeit zumessen?
Ich möchte empfehlen: sehr viel. Denn was wir kommunizieren auf einer Website, ist zuallererst das Bildmaterial – und dann das Schriftbild. Diese Ersteindrücke wirken in der Regel, bevor das erste Wort gelesen ist. Genauer gesagt: Die Schriftform ist ein Initial-Impuls jedes Mediums, sie formt das allererste Konzept entscheidend mit, das sich Betrachter von einer Gestaltung bilden – und damit potenziell von der Wertigkeit des Auftritts insgesamt. Wie wichtig dieser erste Impuls ist für Leseerfolg und Lesertreue, ist sicherlich schwer einzuschätzen und mindestens ebenso schwer empirisch greifbar – und deswegen in seiner Relevanz kaum einzustufen. Dass er aber Bedeutung besitzt, dieser Primär-Stimulus des Schriftbildes, steht für mich außer Frage. Er gehört auf die Agenda jedes Gestaltungsprozesses.
Welche Schriftart ist attraktiver?
Dem Paarvergleich zur Lesbarkeit schlossen sich noch elf weitere an im Experiment. Frage 2 lautete dabei: Welche Schriftart halten Sie für attraktiver?
Insgesamt fielen die Ergebnisse weniger eindeutig aus als die zur Ausgangsfrage. Ganz großzügig formuliert: es war in der Spitze ein totes Rennen. Denn im Urteil der Versuchsteilnehmer lagen fünf Schriftarten praktisch auf Augenhöhe, was das Werturteil über ihre Attraktivität anging: Arial vorneweg, Cambria knapp dahinter, Verdana, Trebuchet und Segoe wiederum um eine Maul-Länge zurück. Es ist bemerkenswert, dass unter diesen Top 5 zwei völlig neue, damit uneingeführte, und eine zwar ältere, aber aktuell wenig benutzte Schriftart landeten. Ein weiteres Argument gegen den Leser als visuelles Gewohnheitstier! Dass die Times wiederum ziemlich weit hinten landete, bestätigt ebenfalls die These: ordentliche objektive Lesbarkeit muss offenkundig keinen Einsatz rechtfertigen.

Welche Schriftart wirkt seriöser?
Auf diese Frage fielen die Urteile wieder erheblich eindeutiger aus. Und auch die Ergebnisse dieser Frage sprechen recht eindeutig gegen die Gewohnheits-These. Denn auf die etablierte Web-Type Arial (68 %) folgten in dieser Frage-Runde die Vista-Fonts Cambria (63 %) und Segoe (60 %).

Welche Schriftart wirkt moderner?
Diese Runde ging zum Teil an die Vista-Schöpfer: als modernste Schrift betrachteten unsere Teilnehmer die Vista-Systemschriftart Segoe (65 %). Ein später Erfolg für Adrian Frutiger, sollte man meinen, jenen genialen Schweizer Schriftschöpfer, der die “Frutiger” immerhin vor über 30 Jahren zeichnete! Es folgen allerdings vier sehr etablierte Web-Schriftarten – und die (vermeintlich moderne) C-Reihe bekleckerte sich in dieser Frage durchweg nicht mit Ruhm.

Welche Schriftart ist eleganter?
Bis auf den Spitzenreiter waren sich die Versuchsteilnehmer in dieser Frage recht uneins. Die Runde ging ziemlich eindeutig an die Serifenschriftart Cambria (63 %); dahinter waren allerdings keine klaren Favoriten auszumachen.

Welche Schriftart ist dynamischer?
Hier hatten die eingeführten Web-Schriftarten klar die Nase vorn: Arial (62 %) vor Verdana (57 %) und Trebuchet (56 %). Allerdings fiel auch dieser Vergleich relativ knapp aus: Ein klares Publikumsvotum ist – abgesehen von Spitzenreiter Arial und den abgeschlagenen Serifenvertretern “Georgia”, “Times” und “Contantia” – nicht erkennbar.

Welche Schriftart passt besser zum Thema …
Abschließend fragten wir unsere Versuchsteilnehmer, welche Schriftarten besonders gut zu bestimmten klassischen Berichtsressorts passten. Ich will die Ergebnisse hier nicht in Gänze breit treten, zumal sich längst nicht in allen Vergleichen eindeutige Ressort-Favoriten herauskristallisierten.
Interessant aber ist durchaus, dass die “ernsten” Themenkomplexe “Politik” und “Kultur” anscheinend immer noch sehr stark mit klassisch geschnittener Typografie in Verbindung gebracht werden auf Konsumentenseite – bei keiner anderen Frage belegten serifentragende Schriftarten alle drei “Stockerl-Plätze”. Ich räume ein, dass diese Ergebnisse die Gewohnheits-Theorie durchaus stützen – Lesende erwarten in bestimmten Ressorts offenbar durchaus bestimmte Typen. Oder halten sie zumindest für themenadäquater.






Zwischenfazit Schriftarten, Teil 2
Vielleicht ist es geboten, dass ich mich bei den Serifen-Gegnern entschuldige. Zumindest teilweise. Denn, jawohl: Serifentragende Schriften sollte man im Web offenkundig wirklich zumindest mit ein wenig mehr Bedacht einsetzen als Groteske. Aber nicht, weil sie “schlechter lesbar” wären, wie die Ratgeber sagen. Oder, weil ihre Serifen so verkrüppelten am Monitor. Sondern schlicht und ergreifend, weil sie tendenziell eher unbeliebt sind in der Leserschaft. Weil die Konsumenten zumindest aufs Ganze betrachtet anscheinend eher Groteske vorziehen.
Dies freilich ändert nichts an meiner Ausgangsthese. Denn: Aus der Unbeliebtheits-Erkenntnis heraus doch wieder flächendeckend auf “Verdana” zu setzen, führt zu nichts. Beziehungsweise: zu nichts Gutem. Gerade im Bereich der schwereren Kost – Politik und Kultur – genießen Serifen augenscheinlich ungebrochene Akzeptanz, auch im Web, sie vermitteln Seriosität und Glaubwürdigkeit. Nehmen wir dann noch meinen Ausgangs-Appell hinzu, dass Web-Typografie endlich auch auf jene typografische Vielfalt hinstreben sollte, die gute Print-Typografie seit Jahrhunderten auszeichnet – so sind wir wieder bei meiner bescheidenen Start-Bitte angelangt: Schöpfen wir die dürre Vielfalt der Web-Schriftarten besser aus, als dies bislang geschieht! Und Vielfalt definiert sich über Kontrast. Zum Beispiel und vor allem: zwischen Groteske und Serife.
SCHRIFTGRÖßEN
Schriftgrößen im Web: Kann man die überhaupt messen?
Man kann trefflich streiten, ob es überhaupt Sinn ergibt, optimale Schriftgrößen für Webseiten zu ermitteln. Schließlich sind in puncto Letter-Höhe grundsätzlich die Webnutzer Herren des Verfahrens: Da kann Frau Webdesignerin noch so eindringlich 12 Punkt als Schriftgröße anweisen im CSS-Bereich – der Browser gehorcht in aller Regel nur bei Schriftgröße mittel wie aufgetragen. Mit einem ebenso schlichten wie beherzten Steuerung plus aber enthebt jeder Normal-Nutzer die Gestalterin ihres Einflusses und setzt die Schriftgröße rauf. Anweisung im Quellcode hin oder her.
Warum ich trotzdem aufs Thema Schriftgröße drängte in der Entstehungsphase der Studie? Ich kenne zwar keine Statistiken zu diesem Thema, aber ich vermute fest, dass eine übergroße Mehrheit der Web-Nutzer entweder gar nicht weiß, dass sie zur eigenverantwortlichen Größen-Manipulation imstande sind – oder, dass sie um ihre Macht durchaus wissen, aber in der überwältigenden Mehrheit brav bei der Standard-Einstellung bleiben, aus welchen Gründen auch immer.
Wenn man diese These als stichhaltig unterstellt, hat es schon Sinn, sich mit dem Komplex Größe im Web zu befassen. Zumal die bereits erwähnten Print-Studien aus dem vergangenen Jahrhundert hier die wichtigste Stellschraube der Lesbarkeit ausmachten: eben bei der Schriftgröße.
12 Punkt sind selten 12 Punkt
Bevor wir allerdings messen konnten, mussten wir die Schriftarten erst einmal auf Vergleichbarkeit trimmen. Es macht schließlich einen Unterschied, ob man einer Verdana eine Schriftgröße von 12 Pixeln verpasst oder einer Times. Denn diese 12 Pixel bezeichnen entgegen landläufiger Meinung nicht, wie hoch die Großbuchstaben auf dem Bildschirm aufscheinen sollen. Es ist genausowenig eine Angabe darüber, wie groß der Abstand zwischen großem A oben und kleinem g unten ist. Es bezeichnet nur die Gesamthöhe des (gedachten) Kegels, auf den ein Schriftgestalter seine Lettern aufgebracht hat.
Übertragen gesagt: Ich kann auf ein A4-Blatt ein B zeichnen, das die ganze Höhe der Seite ausnutzt – oder ein B, das nur halb so hoch ist wie das Blatt und viel Luft nach oben und unten lässt. In der Logik des typografischen Maßsystems wären aber beide Buchstaben eine A4-Seite hoch. Dass die Buchstaben an sich ganz unterschiedliche vertikale Ausdehnungen haben, spielt keine Rolle.
Im Vergleich: Mittellängen statt nummerischer Größen
Wir haben im Experiment deswegen nicht nummerische Schriftgrößen verglichen, sondern für jede Schrift in jeder Größe die Höhe des kleinen x bestimmt – die Mittelhöhen also, die nach verbreiteter Meinung entscheidend sind für die so genannte optische Größe einer Schriftanordnung.
Die eindeutige x-Höhe 7 Pixel wurde zunächst für jede Schriftart als Schrftgröße 2 definiert. Von da aus wurde in jeweils zwei Abstufungen nach oben und unten immer ein Pixel nummerische Schriftgröße hinzugezählt oder abgezogen. Was bei dieser Detail-Arbeit herauskam, zeigt die folgende Abbildung.

Ergebnis Schriftgrößen: Ein Pils braucht 7 Minuten, ein “x” braucht 7 Pixel
Richtig weit muss ich an dieser Stelle gar nicht ausholen, denn die Ergebnisse der Größenmessung waren ebenso schlicht wie klar. Alle Texte in Schriftanordnungen mit einer x-Höhe von weniger als 7 Pixeln wurden laut Statistik erheblich, statistisch signifikant langsamer gelesen als Texte in größerer Ausprägung. In der Varianzanalyse erwies sich der Faktor Größe als hoch signifikant – die Schriftgröße ist also einer, wenn nicht der Haupteinfluss auf die Lesbarkeit schlechthin.
Dabei scheint die Schriftgröße 2 über fast alle Schriftarten hinweg Minimum und Optimum zugleich: weitere Vergrößerungen beschleunigten die Leseprozesse in den seltensten Fällen.
Auch diese Ergebnisse decken sich übrigens im wesentlichen mit denen anderer Untersuchungen zur Schriftgröße – unter anderem in der Feststellung, dass Schrift wohl durchaus zu klein sein ausfallen kann im Sinne der Lesbarkeit, dass aber ab einem bestimmten Level eine Vergrößerung der Schrift keine besonderen Effekte auf die Leseleistung mehr zeitigt (z.B. Bernard/Mills; Bernard et al.; Liebig).
Zwischenfazit Schriftgrößen: Trau keinem unter 7 Pixeln
In Lesetexten sollten Schriften so definiert sein, dass das kleine x mindestens 7 Pixel hoch ist. Da dies oft auf mehrere Größenvarianten einer Schriftart zutrifft, sollte man nicht unbedingt auf die kleinste Variante zugegreifen, auf die diese Eigenschaft noch zutrifft. Eine Erhöhung auf 8 Pixel bringt aber offenbar kaum Verbesserungen. Per Screenshot sind die Mittellängen der jeweiligen Schriftart der Wahl leicht ermittelbar.
Zur Erinnerung: auf Navigationsleisten-Schriften und Headlines ist diese Erkenntnis eventuell nur bedingt anwendbar. Es macht sicherlich einen Unterschied, ob man nur das Wörtchen “Kontakt” zu lesen hat – oder einen 110-Wort-Text. Diese Aussage ist weder bewiesen noch widerlegt – ich persönlich werde aber in Navigationsbereichen weiterhin mit Schriftgrößen experimentieren, die unter der Mittellänge “7” liegen.
SCHRIFTART UND SCHRIFTGRÖSSE IN KOMBINATION
Wer sich Tabelle 1 genauer anschaut, wird womöglich stutzen. Denn wenn beispielsweise die Cambria in 16 Pixel Größe 23,36 Sekunden Lesezeit beanspruchte, die Constantia in 11 Pixel Größe aber 26,93 Sekunden – sind dies nicht Differenzen, die eine durchaus eindeutige Aussage nahelegen? Und Konsequenzen?
Die Antwort lautet: jein. Denn nach eingeführten Regeln der Statistik lässt sich durchaus überprüfen, ob die Kombination Schriftart-Schriftgröße wirklich bedeutsam war für die Leseleistung. Und da sagt das Statistik-Programm in der Varianzanalyse: diese Kombination von Typo-Faktoren nimmt definitiv keinen Haupteinfluss auf die Leseleistung. Qualitätsurteil: eindeutig nicht signifikant.
Die Frage ist, ob wir damit die Tabelle als Ganze gleich in die Rundablage befördern müssen. Ich meine: nein. Denn wenn wir uns hüten, die Ergebnisse als Evangelium zu überhöhen, können wir sie immerhin als Fingerzeige nutzen, als Anregungen und Diskussionsgrundlagen bei der Suche nach geeigneten typografischen Konstellationen.
ZEILENABSTAND
Die ewigen 120 %
Das größte Problem ist immer noch die Standard-Einstellung. Sofern nicht explizit angegeben in Quellcode oder CSS-Datei, setzen die gängigen und marktführenden Browser Schriftanordnungen fast durchweg und quasi als default mit einem Zeilenabstand, der etwa 120 % der jeweiligen Schriftgröße entspricht. Nach meinen Erkenntnissen ist das in fast allen denkbaren Fällen zu wenig.
Diese Zeilenabstände wurden verglichen
Soviel war klar: Wenn wir schon die Schriftgrößen auf die Eigenheiten der verschiedenen Schriftgestalten angepasst hatten, mussten wir es bei den Zeilenabständen genauso halten. Wir beschlossen also, auch die Zeilenabstände an die Mittellängen, die x-Höhen der Schriften, zu koppeln. Jede der fünf Schriftgrößen kombinierten wir mit vier verschiedenen Zeilenabständen: der 2,1-fachen x-Höhe, der 2,5-fachen x-Höhe, der 2,9-fachen x-Höhe und der 3,3-fachen x-Höhe. Die 14-Pixel-Cambria gab es also mit den Zeilenabständen 15,4 Pixel (gerundet 15, halbe Pixel gibt’s bekanntlich nicht), 17,5 Pixel (gerundet 18), 20,3 Pixel (gerundet 20) und 23,1 Pixel (gerundet 23).
Die Ergebnisse im Detail
Die Varianzanalyse der Daten ergab: der Zeilenabstand ist, wie die Schriftgröße (und anders als die Schriftart), einer der Haupt-Einflussfaktoren auf die Lesbarkeit. Wobei man hier, bevor die Euphorie überbordert, sinnvollerweise die statistische durch eine praktische Signifikanz ergänzen sollte (manche nennen letztere auch gesunden Menschenverstand): So erheblich waren die Differenzen zwischen den Durchschüssen dann doch nicht, dass man ihre Unterschiedlichkeit in Verfassungsrang heben müsste. Signifikant hin oder her.
Dennoch, hilfreiche Fingerzeige liefern die Daten: Sie legen nahe, dass der Zeilenabstand mindestens das 2,5-fache der x-Höhe der jeweiligen Schrift betragen sollte. Das wäre, im Falle der 12-Pixel-Verdana beispielsweise, erheblich mehr als die Browser-Standardeinstellung von 14 Pixeln – nämlich satte 17 bis 18 Pixel (x-Höhe 7 Pixel mal 2,5 = 17,5 Pixel). Auch zeigte sich: eine weitere Vergrößerung des Zeilenabstands auf das 3-fache der x-Höhe bringt noch marginale Verbesserungen, aber keine bedeutsamen Steigerungen mehr mit sich.
ZEILENBREITE
Das Ergebnis: kein Ergebnis
Es scheint wenig Unwichtigeres zu geben als die Breite der Zeilen. Dieser Befund unserer Studie überraschte niemanden mehr als mich selbst – denn in einem Vorgängerexperiment hatten sich klare Hinweise ergeben, dass Zeilenbreiten unter 40 Anschlägen zu einer gewaltigen Verlangsamung des Lesetempos führen (Liebig). Interessant war, dass die alte Setzerregel “Alphabet mal 2” in unseren Ergebnissen gar nicht griff: die doppelte Buchstabenanzahl (52 Anschläge) zeitigte gar die schlechtesten Lesezeiten. Aber überbewerten sollte man auch dieses Teilresultat nicht – statistisch gab’s jedenfalls keinerlei Signifikanzen im Messbereich “Zeilenbreite”.
ZEILENBREITE UND ZEILENABSTAND IN KOMBINATION
Eine weitere Setzerregel besagt, dass mit wachsender Zeilenlänge auch der Zeilenabstand großzügiger bemessen werden sollte. Einen Beleg für diese Annahme blieb uns die Datenauswertung schuldig: keine Signifikanz, kein Haupteinfluss.
ANDERE KONSTELLATIONEN
Der Vollständigkeit halber testeten wir auch alle übrigen Zweier-, Dreier- und Vierer-Konstellationen, die sich aus den Daten ergaben, auf ihre statistischen Signifikanzen. Wiederum, ohne Zählbares herauszufinden: Weder die Kombination Schriftart-Zeilenabstand entpuppte sich statistisch als Haupteinfluss noch die Verbindung Schriftgröße-Zeilenbreite – oder irgendeine andere Konstellation.
ZUM SCHLUSS
Betrachten wir die Ergebnisse einmal unter Worst-Case-Annahmen: Wer richtig schlecht lesbare Typografie konstruieren möchte, hat’s ziemlich schwer im Web. Gut, man kann Schriftgrößen unter 11 Pixel definieren, vielleicht noch Kompress-Zeilenabstände vorgeben – dann geht’s mit der Lesbarkeit schon befriedigend bergab. Darüberhinaus allerdings muss man sich schon tüchtig ins Zeug legen, um es der Leserschaft so richtig schwer zu machen.
Anders herum formuliert: Die vermeintlich “harten” typografischen Stellschrauben sind rarer als vermutet. Typografie funktioniert offenbar weit weniger nach Rezept als oft behauptet.
Was ausdrücklich nicht bedeutet, dass Typografie im Web beliebig werden dürfte. Im Gegenteil. “Gute” Typografie beweist sich ganz offensichtlich im gekonnten Umgang mit dem Originärsten: dem schwer erforschbaren Wesen ihrer Schriftgestalt nämlich. Typografie ist weit mehr Emotion als schierer Bedeutungsträger. Gute Typografie unterstreicht den thematischen Kontext, gute Typografie schmeichelt dem Inhalt wie dem Auge, gute Typografie vermittelt Individualität und Wert, Spannung und Seele.
Leider, ich erwähnte es, kann man all diese Faktoren ziemlich schwer messen. Typografie bewegt sich auf Meta-Ebenen, die keine Stoppuhr zu fassen bekommt. Darum, meine Damen und Herren Gestalter: Übernehmen Sie! Das Web hat’s verdient.
–
Der Artikel liegt als PDF zum Download bereit:
Die gefühlte Lesbarkeit | Martin Liebig | PDF 750KB
Quellen
Bernard, Michael/Mills, Melissa/Peterson, Michelle/Storrer, Kelsey (2001): A Comparison of Popular Online Fonts: Which is Best and When? https://www.surl.org/usabilitynews/32/font.asp” https://www.surl.org/usabilitynews/32/font.aspBernard, Michael/Mills, Melissa (2000): So, What Size and Type of Font Should I Use on My Website? https://www.surl.org/usabilitynews/22/font.asp
Bernard, Michael/Lida, Bonnie/Riley, Shannon/Hackler, Telia/Janzen, Karen (2002): A Comparison of Popular Online Fonts: Which Size and Type is Best? https://www.surl.org/usabilitynews/41/onlinetext.asp
Bernard, Michael/Liao, Corrina/Mills, Melissa (2001): Determining the Best Online Font for Older Adults. https://www.surl.org/usabilitynews/31/fontSR.asp
Boyarski, Dan/Neuwirth, Christine/Forlizzi, Jodi/Harkness Regli, Susan (1998): A Study of Fonts Designed for Screen Display. In: Proceedings of the SIGCHI conference on Human factors in computing systems 1998. S. 87ff. https://portal.acm.org/citation.cfm?id=274644.274658
Hill/Scharff (Hill, Alyson L./Scharff, Lauren F. V. (1997): Readability of Websites With Various Foreground/Background Color Combinations, Font Types and Word Styles. https://www.laurenscharff.com/research/AHNCUR.html
Liebig, Martin (2008): Browser-Typografie. Untersuchungen zur Lesbarkeit von Schrift im World Wide Web. Boizenburg. https://eldorado.tu-dortmund.de/dspace/bitstream/2003/24419/2/dissertation_liebig.pdf
Redelius, Jürgen (1998): Der „digitale Gutenberg. Dissertation zur Erlangung des Grades eines Doktors der Erziehungswissenschaften der Pädagogischen Hochschule Ludwigsburg. Ludwigsburg
Tullis, Thomas S./Boynton, Jennifer L./Hersh, Harry (1995): Readability of Fonts in the Windows Environment. https://sigchi.org/chi95/Electronic/documnts/intpost/tst_bdy.htm
Weisenmiller, Eric Michael (1999): A Study of the Readability of On-Screen Text. Dissertation, Virginia Polytechnic Institute and State University. Blackburg (Virginia). https://scholar.lib.vt.edu/theses/available/etd-102999-110544/unrestricted/WeisenmillerDissertation.pdf