Android Tablet-Computer im Pilottest mit Senioren

[toc]

Mit dem elderly interaction & service assitent (elisa) entsteht im EU-Forschungsprojekt SI-Screen ein Tablet-Computer, der für die individuellen Bedürfnisse von älteren Menschen zugeschnitten ist. Um die Touch-Genauigkeit der älteren Generation auf Tablets zu messen, wurde eine Testapplikation für einen Multi-Directional Tapping Task nach ISO 9241-9 Standard angefertigt und in einem Pilottest mit vier Senioren evaluiert. In diesem Beitrag stellen wir die Testapplikation und erste Ergebnisse aus dem Pilottest mit vier verschiedenen Android Tablet-Computern vor. Über begleitende Interviews wurden die technische Vorkenntnisse der Teilnehmer und der Anspruch an Displaygröße, Formgebung und Material-Eigenschaften in Fragebögen festgehalten.

Motivation

Im Projekt SI-Screen besteht eine Herausforderung in der Wahl der optimalen Displaygröße, Gewicht, Form, Materialen und technischen Merkmale von Tablet-Computer für ältere Menschen. Darüber hinaus muss die Mindestgröße von berührbaren grafischen Elementen auf dem Multi-Touch-Display bestimmt werden, bei denen ältere Nutzer eine hohe Erkennungsrate (über 70 Prozent) erzielen. Um neben den subjektiven Eindrücken der Probanden die Genauigkeit der Touch-Bedienung zu messen und die Mindestgröße der Element auf Tablets mit unterschiedlicher Displaygröße zu bestimmen, wurde eine eigene Android Test-Applikation entwickelt. In den nachfolgenden Abschnitten wird der implementierte Multi-Directional Tapping Task (MDTT) nach ISO 9241-9 Standard vorgestellt und die Ergebnisse aus dem Pilottest präsentiert.

Evaluationsdurchführung

Ziel des Pilottests war die Test-Anwendung und den zugehörigen Fragebogen auf deren Korrektheit und Vollständigkeit zu prüfen. Infolgedessen beschränkte sich der Test auf vier Probanden. In den folgenden Abschnitten stellen wir die Teilnehmer, die Wahl der Tablet-Computer und den MDDT-Ergnomie-Test nach ISO 9241 Standard Teil 9 vor.

Teilnehmer des Pilottests

Am Pilottest nahmen insgesamt zwei ältere Damen und zwei ältere Herren aus Deutschland teil. Das durchschnittliche Alter der vier Teilnehmer Betrug 63,5 Jahre. Nach Überarbeitung der Test-Software und der Fragen wird der Tablet-Test im Rahmen des SI-Screen-Projektes mit 15 älteren Menschen in Deutschland, sowie 15 älteren Probanden in Spanien wiederholt und die Ergebnisse gegenübergestellt.

[singlepic id=1325 w=290 float=left]

[singlepic id=1326 w=290 float=left]

Tablet-Computer im Pilottest

Bei der Vorauswahl der Tablet-Computer für den Pilottest wurde darauf geachtet, Endgeräte mit möglichst großen Unterschieden im Hinblick auf ihre physikalischen Merkmale zu wählen. Dabei kamen ausschließlich Android Tablets zum Einsatz, da der spätere Prototyp des elisa Tablets ebenfalls aus Tablet-Komponenten auf Android-Basis (Android Tablet Kits) gefertigt wird. Der Vorteil gegenüber einer Software-Lösung ist, dass die Anforderungen älterer Menschen auch gegenüber der Hardware-Benutzerschnittstelle berücksichtigen werden können.

[nggtags Gallery=Testgerät]

Nach eingehender Analyse der auf dem Markt verfügbaren Tablet-Computer (Stand 08.12.2011) fiel die Wahl auf das Motorola Xoom, Sony Tablet S, Sony Tablet P und das HTC Flyer. Diese unterscheiden sich in ihrer physischen Gesamtgröße, Displaygröße, Gewicht, Verarbeitung und Formgebung. Weiterführende Informationen zur Analyse der Tablet-Devices sind im Artikel Moderne Android Tablet-Devices im Vergleich einsehbar.

ISO 9241-9: Multi-Directional Tapping Task

Um die Ergebnisse der Touch-Eingabe auf unterschiedlichen Tablet-Computern testen zu können wurde der MDTT-Test herangezogen, der als Ergonomie-Test im „ISO 9241 Standard Teil 9: Anforderungen an Eingabegeräte – außer Tastaturen“ beschrieben ist. Eine detaillierte Übersicht zur Evaluation nach ISO 9241-9 bietet der Artikel Evaluation von Zeigegeräten nach ISO 9241-9.

[singlepic id=1307 w=618 float=left]

Wie die Abbildung zeigt, mussten die Probanden im MDTT-Test mehrere auf einem Kreis angeordnete Elemente in einer vorbestimmten Reihenfolge anwählen. Wurde ein Element erfolgreich angewählt, ist anschließend das gegenüberliegende Element anzuwählen. Während des Tests wurde die Genauigkeit bei der Berührung der Elemente sowie die Zeit für das Zurücklegen der Wegstrecke zwischen zwei Elementen gemessen. Die Größe der Elemente (W) wird durch den Schwierigkeitsindex (ID) und den Durchmesser des äußeren Kreises (D) nach Fitt’s law berechnet:

ID = \log_2 \left(\frac{D}{W}+1\right).

Nachdem für das Android-Betriebssystem bislang keine Software verfügbar ist, die den MDTT durchführen kann, wurde eine eigene Test-Anwendung für Android Tablet-Computer angefertigt. Die Test-Applikation bestimmt den Durchmesser des äußeren Kreises (D) über die kürzere Seite des jeweiligen Tablet-Displays mit Abstand zum Display-Rand.

Für jedes Tablet wurden insgesamt 12 MDTT-Tests aus einer Kombination von 4 Schwierigkeitsindizes (2.5 = sehr leicht, 3.0 = leicht, 3.5 = schwer,  4.0 = sehr schwer) und drei Wiederholungen nach Zufallsprinzip ausgewählt. In jedem Test wurden 11 Kreis-Elemente dargestellt, deren Größe (W) nach Fitts‘ law über den Durchmesser (D) und dem zufällig gewählten Schwierigkeitsindex (ID) berechnet wurden. Die Tests waren zufällig verteilt, um einen Lerneffekt bei den Probanden zu vermeiden. Der Test begann stets an einer festen Position und endet nach 11 Zügen mit dem letzten Kreis-Element.

Die Schwierigkeitsindex in den vier Schwierigkeitsstufen von 2.5 bis 4.0 entspricht auf einem 7″-Touchscreen einer Element-Größe von ~13,6 mm (ID=2.5) bis ~4,2 mm (ID=4.0). Auf einem Tablet von 10,1″ beträgt die Element-Größe jeweils ~21,7 mm (ID=2.5) bis ~6,6 mm (ID=4.0). Mit dem Grenzwerttest der Schwierigkeitsstufe 4.o konnte festgestellt werden, ob ältere Teilnehmer in der Lage sind, sehr kleine Größen anzuwählen und welche Genauigkeit dabei erzielt wird. Die Liste aller Element-Größen sind der nachfolgenden Tabelle zu entnehmen.

Tablet Computer Bildschirmdiagonale (in Zoll) Schwierigkeitsindex
ISO ID
Elementbreite
ISO W
(in mm)
Durchmesser
Aussenkreis
ISO D
(in mm)
Motorola Xoom 10.1 2.5 ~21,7 ~101,4
3.0 ~14,4
3.5 ~9,8
4.0 ~6,6
Sony Tablet P 2 x 5.5 2.5 ~18,6 ~86,6
3.0 ~12,3
3.5 ~8,4
4.0 ~5,7
HTC Flyer 7 2.5 ~13,6 ~63,6
3.0 ~9,1
3.5 ~6,1
4.0 ~4,2
Sony Tablet S 9.4 2.5 ~19,8 ~92,3
3.0 ~13,1
3.5 ~8,8
4.0 ~6,1

Ermittlung der Fehlerrate

Jede Berührung des Display durch den Probanden wurde von der MDTT-Test-Anwendung aufgezeichnet. Neben der Position auf dem Bildschirm wurde insbesondere der Zeitpunkt der Berührung, die Abweichung vom Mittelpunkt des anzuwählenden Kreis-Elements und der Schwierigkeitsindex festgehalten. Eine Berührung außerhalb des anzuwählenden Elements führte zu einer Wiederholung an der selben Position.

Die Fehlerrate (Error Rate, ER) wurde anschließend aus der Anzahl der Berührungen pro Test (N) und der Anzahl der anzuwählenden Kreis-Elemente geteilt durch die Anzahl der Kreise-Elemente ermittelt.

Fragebogen

Zu Beginn des Pilottests wurde mit Hilfe von sechs Fragen die Technikaffinität der Probanden festgestellt, um später die Interview- und Messergebnisse von Personen mit unterschiedlichem Erfahrungsgrad vergleichen zu können. Hierzu kamen Fragen zur Erfahrungen mit Touchscreen-Geräten, wie zum Beispiel Navigationsgeräte in Autos, Fahrkartenautomaten, oder auch Tablet-Computer zum Einsatz.

Anschließend wurden die Teilnehmer gebeten, die Tests auf einem der vier verschiedenen Android-Tablets durchzuführen und direkt im Anschluss die subjektiven Eindrücke vom jeweiligen Gerät nach den Tests im Fragebogen festzuhalten. Zu jedem Gerät waren die nachfolgenden neun Aussagen auf einer 5er-Likert-Skala zu bewerten:

  1. Die Bedienung macht Spaß.
  2. Die Bedienung ist sehr genau.
  3. Die Bedienung hat mich körperlich ermüdet.
  4. Die Bildschirmgröße ist zu klein.
  5. Das Gehäuse hat eine sehr hohe Qualität.
  6. Das Bedienen mit dem Finger war sehr angenehm.
  7. Ich musste mich beim Bedienen sehr konzentrieren.
  8. Das Gewicht des Tablets ist zu schwer.
  9. Das Tablet war insgesamt sehr leicht zu bedienen.

Nach Durchführung der Tests auf allen vier Geräten bildeten die Teilnehmer zusätzlich eine Rangreihe der bevorzugten drei Geräte entsprechend ihres Gesamteindrucks bei der Bedienung. Abschließend durfte jeder Proband ergänzende Kommentare im Fragebogen abgeben.

Diskussion der Ergebnisse

In der Evaluation der Testergebnisse wurden die aufgezeichneten Daten der Test-Applikation, die zugehörigen Fragebögen der Probanden sowie eigene Beobachtungsnotizen und Videoaufzeichnungen herangezogen. Die Ergebnisse der Tests können den nachfolgenden Abschnitten entnommen werden.

Messungen zur Touch-Genauigkeit

Die nachfolgende Tabelle zeigt für den jeweiligen Schwierigkeitsindex die durchschnittliche Trefferquote aller vier Tablet-Computer, welche durch die vier Probanden in jeweils 48 Tests mit drei Wiederholungen ermittelt wurden. Die Ergebnisse zeigen, dass mit der logarithmisch ermittelten Element-Größe die Fehlerquote mit steigendem Schwierigkeitsgrad exponentiell abnimmt. Weiterer Einflussfaktor ist die Berührungsempfindlichkeit der kapazitiven oder resistiven Touchscreens, insbesondere bei sehr kleinen Elementen.

Schwierigkeitsindex (ID) Fehlerquote
2.5 1,68 %
3.0 6,71 %
3.5 45,68 %
4.0 66,15 %

Wie die zweite Tabelle zeigt, muss bei der Trefferquote pro Schwierigkeitsindex berücksichtigt werden, dass die älteren Teilnehmer auf dem HTC Flyer eine signifikant hohe Fehlerquote erzielt haben, was den Gesamtwert zusätzlich beeinflusst. Dem gegenüber haben die anderen Tablet-Geräte eine durchschnittliche Fehlerquote von ca. 24 %.

Tablet-Computer Fehlerquote
Motorola Xoom 18,52 %
Sony Tablet P 29,41 %
HTC Flyer 65,51 %
Sony Tablet S 25,42 %
Durchschnitt 46,29 %

Weibliche Probanden hatten mit durchschnittlich ca. 15 % eine niedrigere Fehlerquote als männliche Probanden mit ca. 41 %. Die Abweichung von ca. 25 % ist vermutlich auf die unterschiedlichen Fingerlängen-Verhältnisse, Trockenheit und faltige Fingerkuppen zurückzuführen.

Erkenntnisse aus den Fragebögen

Die folgenden Abschnitte fassen die Erkennisse zusammen, die auf Basis der subjektiven Meinungen der älteren Teilnehmer nach den Tests abgeleitet werden konnten. Über Netzdiagramme werden ausgewählte Antworten zu den jeweiligen Tablet-Computer im Test gegenübergestellt. Die Antworten sind im Uhrzeigersinn nach Displaygröße angeordnet. Aus Vergleichbarkeitsgründen wurden die bereits oben vorgestellten Statements dabei so umcodiert, dass ein höherer Skalenwert einer besseren Eigenschaft entspricht.

Technikaffinität

Während eine Dame und ein Herr fast keine Erfahrung im Umgang mit Computern oder Geräten mit Touch-Oberfläche angaben, erwies sich eine Dame fortgeschrittene Computer-Nutzerin und ein Herr berichtete von Erfahrung mit verschiedenen Tablet-Computern.

Spaß bei der Bedienung

[singlepic id=1469 w=618 float=center]

Das Diagramm zeigt, dass für die vier Testteilnehmer bei zunehmender Bildschirmgröße, der Spaß bei der Bedienung ansteigt. Dieses Ergebnis scheint nachvollziehbar, da  bei kleinen Display-Größen eine hohe Fehlerquote aufgezeichnet wurde, die bei zunehmender Display-Größe exponentiell gesunken ist. Eine bereits angedeutete Ursache dürfte die Berührungsempfindlichkeit und Technologie der Touchscreens sein. Je kleiner der Bildschirm ist, desto weniger genau kann die exakte Position der Berührung erkannt werden. Infolgedessen sinkt der Spaß bei der Bedienung des Gerätes, wenn die Eingabe mehrmals wiederholt werden muss.

Genauigkeit der Berührungserkennung

[singlepic id=1465 w=618 float=center]

Die Genauigkeit der Erkennung durch den Touchscreen der Tablet-Geräte wurde von den älteren Teilnehmern als durchschnittlich gut eingeschätzt. In der Auswertung erhält das HTC Flyer allerdings die niedrigste Wertung. Auch für das Sony Tablet P vergeben die Probanden eine negative Einstufung der Erkennungsgenauigkeit, obwohl die Messergebnisse auf eine niedrigere Fehlerquote gegenüber dem HTC Flyer aufzeigen.

Ermüdungsfaktor

[singlepic id=1462 w=618 float=center]

Nach Aussage der Probanden sind nach  jedem Tablet-Test keine oder lediglich geringe körperlichen Ermüdungserscheinungen bei der Nutzung der Tablets aufgetreten, obwohl die älteren Teilnehmer die Geräte während der Tests durchgehend in der Hand halten mussten. Den Kommentaren der Teilnehmer zufolge wären sie bereit, auch zeitlich längere Tests durchzuführen.

Bildschirmgröße

[singlepic id=1461 w=618 float=center]

In der Abbildung  ist erkennbar, dass das Sony Tablet P mit seinen beiden 5,5-Zoll-Displays von allen Teilnehmern als zu klein eingestuft wurde, obwohl die physische Gesamtfläche des Sony Tablet P größer ist als die des HTC Flyer ist. Die Testteilnehmer deuteten an, dass sie die Trennung der Bildschirme in der Mitte als störend empfinden. Ein Teilnehmer bemerkte, dass die geteilten Display-Flächen für ihn einen Kontext-Wechsel verursachen und er nicht die Bildinhalte als Ganzes wahrnehmen würde.

Das Display des HTC Flyers wurde von der Mehrheit als eher zu klein eingestuft. Dem gegenüber wurden im Durchschnitt die Bildschirme des Motorola Xoom und des Sony Tablet S als gut bewertet. Einzelne Teilnehmer können sich für das elisa-Tablet auch noch größere Displays vorstellen.

Qualität der Tablet-Gehäuses

[singlepic id=1464 w=618 float=center]

Die Testpersonen vergaben für alle Geräte eine hohe, jedoch keine sehr hohe Wertung für die Qualität. Dieses Ergebnis sollte vor dem Hintergrund betrachtet werden, dass drei der vier Personen vor dem Pilottest noch keine Erfahrung mit Tablet-Geräten hatten. Infolgedessen erfüllen die Probanden nicht die Voraussetzungen einen objektiven Vergleich zu anderen verfügbaren Tablet-Computern herzustellen. Die Angaben beschränken sich folglich auf den relativen Vergleich zwischen den verwendeten vier Geräten im Test.

Komfort der Touchscreen-Bedienung

[singlepic id=1463 w=618 float=center]

Analog zum Spaß bei der Bedienung verhält sich die Frage, ob die Bedienung mit den Fingern angenehm war. Das Netzdiagramm ist weitestgehend identisch. Der Ausschlag fällt beim HTC Flyer etwas geringer und beim Motorola Xoom etwas größer aus. Infolgedessen wird das Xoom Tablet von den Teilnehmern als sehr angenehm in der Bedienung eingestuft.  Ein möglicher Einfluss auf diese Angabe dürfte die geringe Fehlerquote haben.

Konzentrationsfaktor

[singlepic id=1468 w=618 float=center]

Ähnlich verhält es sich mit den Angaben zur Konzentration bei den Tests. Insgesamt waren in den Fragebögen der Wert für die benötigte Konzentration bei den Tests durchgehend niedrig. Nur bei Tablet-Computern mit kleineren Displays, dem Sony Tablet P und dem HTC Flyer gaben die Probanden einen leicht höheren Konzentrationsbedarf an.

Tablet-Gewicht

[singlepic id=1467 w=618 float=center]

Das Diagramm verdeutlicht eine Abweichung zwischen dem tatsächlichen und empfundenen Gewicht der Tablet-Computer.  Die beiden Sony Tablets wurden weder als zu schwer noch als zu leicht bewertet und liegen gegenüber den anderen Tablets im Mittelfeld. Das Xoom Tablet wurde von allen älteren Teilnehmern als zu schwer eingestuft und knapp danach folgt bereits das über 300 Gramm leichtere HTC Flyer.

Möglichen Einfluss auf die Beurteilung des Gewichts könnte zum Einen die Gesamtgröße des Geräts zusammen mit dem Rahmen haben. Zum Anderen besteht der Rahmen des Xoom Tablets und des HTC Flyers überwiegend aus Metall. Dem gegenüber besteht das Gehäuse des Sony S und P aus Kunststoff.

Gesamteindruck

Auf Basis der durchgeführten Rangreihenbildung durch die Testteilnehmer belegen das Motorola Xoom den ersten, das Sony Tablet S den zweiten,  das HTC Flyer den dritten und das Sony Tablet P den vierten Platz.

Tablet-Computer Platz 1. Platz 2. Platz 3. Platz 4. Platz
Motorola Xoom 1 2 1 1 0
Sony Tablet S 2 2 1 0 1
HTC Flyer 3 0 1 2 1
Sony Tablet P 4 0 1 1 2

Den Probanden zufolge überzeugt das Motorola Xoom durch seine Bedienbarkeit, die Qualität, der Oberfläche und der Helligkeit. Dem Gegenüber wird das Sony Tablet S für seine Bedienbarkeit, das angeschnittene Gehäuse mit breitem Gehäuserand und dem relativ leichten Gewicht bei großer Display-Größe gelobt.

[singlepic id=1471 w=618 float=center]

Zusammenfassung und Ausblick

Aus den Ergebnissen der Pilottest konnten bereits sehr interessante Erkenntnisse gewonnen werden, die beim groß angelegten Test mit insgesamt 30 Probanden in Deutschland und Spanien verifiziert werden müssen. In erster Linie lassen die Ergebnisse aus den Messungen und Fragebögen eine klare Tendenz für Tablet-Computer mit großem Bildschirm erkennen. Dabei sollte allerdings berücksichtigt werden, dass trotz großem Display das Gewicht in einem annehmbaren Verhältnis zur Bildschirmgröße stehen sollte. Bei den vier getesteten Geräten bieten das Motorola Xoom und das Sony Tablet S den besten Kompromiss zwischen Größe und Gewicht. Darüber hinaus hatte das eingesetzte Material Einfluss auf das subjektive Empfinden bezüglich des Gewichts. Zwar wurde ein Tablet-Rahmen aus Metall als höherwertiger eingestuft, jedoch wurde das Gewicht von Plastik-Gehäusen als leichter empfunden.

Die Messungen der Fehlerquote der vier Tablets zeigt, dass für eine hohe Erkennung der Touch-Eingabe durch Senioren eine Mindestgröße von ca. 9-10 mm für die visuellen Interaktionselemente gewählt werden sollte. Andernfalls kann das einen negativen Einfluss auf den Spaß bei der Bedienung haben.

Nicht nur aus den aufgezeichneten Messwerten , sondern auch aus den Fragebögen der Probanden lässt sich das Motorola Xoom als Favorit herausstellen. Für das Tablet wurde mehrfach der erste Platz vergeben. Knapp danach folgt das Sony Tablet S auf dem zweiten Platz. Interessanterweise unterscheidet sich die Platzvergabe je nach Geschlecht. Während Männer eindeutig das Motorola Xoom bevorzugen, vergaben Frauen dem etwas kleineren und leichteren Sony Tablet S die Bestnoten.

Im Rahmen der Tests des SI-Screen Projekts in Spanien und Deutschland werden einige Messergebnisse und Beobachtungen näher beleuchtet werden; insbesondere, ob Frauen und Männer unterschiedliche Präferenzen und Anforderungen an Tablet Computer haben. Dabei wird nicht nur die subjektive Wahrnehmung der Probanden verglichen, sondern auch auf die geschlechtsspezifischen Unterschiede bei den Fingern geachtet.

Auffällig ist, dass die Finger älterer Herren eher breit und groß sind. Die Finger von älteren Damen sind dagegen eher schmal. Dieser Umstand kann Einfluss auf die Präzision der Bedienung haben.  Ein weiterer Einflussfaktor wäre auch die Veränderung der Struktur und Feuchtigkeitsaufnahme der Fingerkuppen  bei älteren Generationen[ref]Studie zu altersbedingten Veränderungen in der Struktur und der Präzision der Finger. Verfügbar unter: http://www.jneurosci.org/content/19/8/3238.full.pdf. (04.06.2012)[/ref].

Unabhängig davon planen wir, die Ergebnisse aus den Tests mit älteren Menschen denen von jüngeren Leuten gegenüber zu stellen. Ziel ist eine Analyse der altersbedingten Auswirkungen auf die Tests.

Danksagung

Wir bedanken uns herzlich bei den vier älteren Testkandidaten für das rege Interesse und die Teilnahme am Pilottest. Ein weiteres Dankeschön an Florian Ott, Benjamin Prost, Tobias Haugg und Britta Meyer für die Unterstützung bei der Vor- und Nachbereitung, sowie der Durchführung des Pilottests an der Universität der Bundeswehr München.

Dieser Beitrag steht im Zusammenhang mit dem Forschungsprojekt SI-Screen, das mit Mitteln des Bundesministeriums für Bildung, und Forschung (Förderkennzeichen 16SV3982), sowie durch das Europäische AAL Joint Programm (AAL-2009-2-088) gefördert wird. Das Vorhaben wird von der Innovationsmanufaktur GmbH (ehemals SportKreativWerkstatt GmbH) koordiniert und gemeinsam mit der Universität der Bundeswehr München realisiert. Weiterführende Informationen sind verfügbar unter http://www.si-screen.eu.

Evaluation von Zeigegeräten nach ISO 9241-9

[toc]Die ISO Norm 9241 ist eine internationale Norm, die Richtlinien zur Interaktion zwischen Mensch und Computer bereitstellt. Neben Vorgaben zur Ergonomie des Arbeitsplatzes und zur Gestaltung der Bildschirminteraktion beschreibt der Teil 9 mit dem Titel „Anforderungen an Eingabegeräte – außer Tastaturen“ neben einer Vielzahl von Begriffsbestimmungen auch Angaben für Maße der Gebrauchstauglichkeit eines Interaktionsmechanismus. So wird die Gebrauchstauglichkeit nach ISO 9241-9 durch die Effektivität, die Effizienz und die Zufriedenheit des Nutzers bei der Nutzung eines Gerätes in einem gewissen Anwendungskontext bestimmt. [ref] Deutsches Institut für Normung (2002): ISO 9241-9 Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten Teil 9: Anforderungen an Eingabemittel − ausgenommen Tastaturen. S.13.[/ref] Außerdem enthält die Norm neben Hinweisen zur Ergonomie und Nutzungsanforderungen bei der Gestaltung von Eingabegeräten außer Tastaturen im Anhang B auch Informationen zur Bewertung der Effektivität und Effizienz der Interaktionsmechanismen. [ref]Deutsches Institut für Normung (2002): ISO 9241-9 Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten Teil 9: Anforderungen an Eingabemittel − ausgenommen Tastaturen. S. 29 ff.[/ref] Zur Evaluation wird demnach ein Fitts’ Law Test verwendet. Diese Evaluationsmethode wird nachfolgend genauer erläutert, indem zunächst die ursprüngliche Evaluation eines Zeigegerätes nach Fitts vorgestellt wird und anschließend das daran angelehnte Verfahren nach ISO 9241-9 beschrieben wird.

Geschichte der Fitts‘ Law Evaluation

Der in der ISO 9241-9 beschriebene Testablauf zur Bewertung von Zeigegeräten basiert auf dem in der HCI auch vor der Normierung häufig zur Evaluation von Zeigegeräten genutzten Fitts’ Law Modell. Der ursprünglich von Paul M. Fitts durchgeführte Testablauf diente der Überprüfung, ob eine schnelle, gezielte Bewegung der Hand durch die physische Stärke des Muskelapparates oder die Geschwindigkeit der Informationsverarbeitung des menschlichen Nervensystems limitiert wird. [ref]Fitts, Paul M. (1954): The Information Capacity of the Human Motor System in Controlling the Amplitude of Movement. Journal of Experimental Psychology, 3/1954 (121), S.381.[/ref] Dazu mussten die getesteten Personen mit unterschiedlich schweren Stiften abwechselnd zwei Aluminiumstreifen mit vorgegebener Breite und festem Abstand berühren.

[singlepic id=842 w=618 h= float=]

Die Veränderung der Breite der Aluminiumstreifen und des Abstands der Streifen diente dann zur Veränderung des Schwierigkeitsgrades. Zur Bestimmung des Schwierigkeitsgrades nutzte Fitts ein Theorem von Shannon zur Bestimmung der Kapazität eines Kommunikationskanals in bit durch ID= log2(2A/ W) mit dem Schwierigkeitsindex ID in bit, der Zielentfernung A und der Zielbreite W. [ref]Shannon, Claude E. (1948): The mathematical theory of communication. 1963. M.D. Computing : Computers in Medical Practice, 4/1948 (14), S. 43.[/ref] Daher wird auch nach der heutigen ISO Norm die Schwierigkeit eines Ziels in bit angegeben und die Leistung eines Zeigegerätes in bit/s gemessen. Das Ergebnis des Tests war eine geringe Abweichung der Bewegungszeiten bei unterschiedlichem Gewicht des Stifts, woraus Fitts folgerte, dass nicht die physische Muskelstärke die Bewegungszeit einschränkt. Fitts’ Law sagt außerdem aus, dass ein linearer Zusammenhang zwischen dem Schwierigkeitsindex eines Ziels und der Auswahlzeit besteht.

[singlepic id=844 w=618 h= float=]

Evaluation nach ISO 9241-9

Die ISO Norm bietet zur Bewertung der Effizienz und Effektivität von Zeigegeräten verschiedene Verfahren, die je nach Interaktionsform ein unterschiedliches Vorgehen zur Datensammlung erfordern.

Dabei unterscheidet die Norm nach folgenden Interaktionsformen[ref]Deutsches Institut für Normung (2002): ISO 9241-9 Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten Teil 9: Anforderungen an Eingabemittel − ausgenommen Tastaturen. S. 30.[/ref]:

  • Zeigen
  • Auswählen
  • Ziehen
  • Nachziehen
  • Freihandeingabe

Je nach vorwiegender Interaktionsform bei der Interaktion mit der Mensch-Computer Schnittstelle hat auch der Versuchsaufbau ein anderes Erscheinungsbild. Während Auswahltests verschiedene Objekte auf dem Display darstellen, die der Nutzer mit dem Zeiger erreichen und auswählen muss, sind Nachziehtest so aufgebaut, dass ein Cursor-Objekt auf einer vorgegebenen Bahn zwischen zwei Randbegrenzungen bewegt werden muss. Der Anordnung von Zeiger und Zielen kann dem folgenden Bild entnommen werden:

[singlepic id=841 w=618 h= float=]

Durch die Testform wird auch die Messung der Daten zur Bewertung des Interaktionsmechanismus bestimmt. Die nachfolgenden Abschnitte beschäftigen sich mit der Bewertung von Zeigegeräten bei Zeige-, Auswahl- und Ziehaufgaben.

Wahl der Schwierigkeitsindizes

Der Schwierigkeitsgrad ID bei einem Auswahltest wird durch die Entfernung des Zeigers zur Zielmitte in der jeweiligen Bewegungsrichtung und der Größe des Ziels nach folgender Formel bestimmt[ref]Soukoreff, R. William & Mackenzie, I. Scott (2004): Towards a standard for pointing device evaluation, perspectives on 27 years of Fitts? law research in HCI. International Journal of Human-Computer Studies, 6/2004 (61), S. 755 bzw. Deutsches Institut für Normung (2002): ISO 9241-9 – Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten Teil 9: Anforderungen an Eingabemittel − ausgenommen Tastaturen. S. 31.[/ref]:

ID = log2 ((D/W)+1) = log2 ((D+W)/W)

Dabei ist D die Zielentfernung (Distance) und W die Zielbreite (Width). Für die Wahl der Maßeinheit für Zielentfernung und Zielbreite macht die ISO Norm keine Vorgaben, jedoch wird darauf hingewiesen, dass eine konsistente Nutzung der gewählten Einheit erforderlich ist. Nach ISO Norm gilt folgende Einordnung der Schwierigkeitsindizes auf der logarithmischen Skala:

  • 2 < ID <= 4 | leichtes Ziel
  • 4 < ID <= 6 | mittleres Ziel
  • ID > 6 | schweres Ziel

Die verwendeten Schwierigkeitsindizes sollten bei einer konkreten Evaluation in einem Bereich zwischen 2 und 8 liegen. Eine Kombination aus Zielentfernung und Zielbreite wird als Kondition bezeichnet. Je mehr Konditionen der Testperson präsentiert werden, desto aussagekräftiger ist das Bewertungsergebnis für das jeweilige Zeigegerät. Dabei ist jedoch zu beachten, dass eine Kondition dem Nutzer 15-25 mal angezeigt werden sollte. Welche Konditionen realisiert werden können, kann von dem verwendeten Display und der genutzten Testform abhängen.

Erhebung der Messwerte

Wurde die für das Einsatzszenario des Eingabegerätes geeigente Testform gewählt und eine Menge von Entfernungs-Zielbreite-Kombinationen festgelegt, wird eine korrekte Erfassung der Nutzerinteraktion während Durchführung des Tests vorgenommen. Dabei sind einige Maße zu erheben, die für die spätere Bewertung notwendig sind. Eines dieser Maße ist die Bewegungszeit MT (Movement Time), also die Zeit, die ab dem Moment vergeht, ab dem der Nutzer den Zeiger in Zielrichtung in Bewegung setzt bis das Ziel ausgewählt wurde.

[singlepic id=843 w=618 h= float=]

Dabei dürfen die Reaktionszeit des Nutzers bis zum Inbewegungnetzen des Zeiger und die Verweilzeit über dem Ziel, die bei manchen Interaktionsmechanismen zum Auslösen des Auswahlevents nötig ist, nicht in der Bewegnungszeit enthalten sein. Außerdem sollten der Start- und der Endpunkt der Bewegung sowie die Zielmitte erfasst werden und eventuelle „Fehler“ (falsche Auswahlevents) wenn sich der Zeiger nicht innerhalb des Ziels befindet, dokumentiert werden. Im Rahmen der Evaluation wird der entwickelte Mechanismus zur Erfassung und Dokumentation der Messwerte für die gewählte Testform dann von einer möglichst breiten und repräsentativen[ref]Insbesondere zum gewünschten Einsatzszenario passend.[/ref] Grundgesamtheit an Testpersonen genutzt.

Anpassung der Daten

Wurden die beschriebenen Messwerte bei der Durchführung des gewählten Testdurchlaufs erhoben, kann eine Anpassung der Schwierigkeitsindizes erfolgen, um den tatsächlich erzielten Schwierigkeitsindex widerzuspiegeln. Dieser sog. „effektive Schwierigkeitsindex“ wird für jede Kondition (also Zielentfernungs-Zielbreite-Kombinationen) errechnet. Dazu ist zunächst die effektive Zielbreite We notwendig. Diese berechnet sich aus der Standardabweichnung der Entfernung zwischen Zielmitte und Auswahlposition multipliziert mit 4,133:

We = 4,133 * StADistanz zur Zielmitte

Die Berechnung des effektiven Schwierigkeitsindexes erfolgt dann auf Basis folgender Formel:

IDe = log2 ((D/We)+1) = log2 ((D+We)/We)

Ist außerdem der Start- und Endpunkt der Zeigerbewegung bekannt, errechnet man zunächst die effektive Zielentfernung De aus dem Mittelwert der Distanz zwischen Start- und Endpunkt für alle ausgewählten Ziele der jeweiligen Kondition. Anschließend lässt sich der effektive Schwierigkeitsindex IDe folgendermaßen berechnen:

IDe = log2 ((De/We)+1) = log2 ((De+We)/We)

Durch die Anpassung des Schwierigkeitsindex an die tatsächlich vom Nutzer erzielten Ergebnisse wird der lineare Zusammenhang zwischen Schwierigkeitsindex eines Ziels und der zur Auswahl des Ziels benötigten Zeit verstärkt.[ref]Soukoreff R. William, Mackenzie I. Scott (2004): Towards a Standard for Pointing Device Evaluation, Perspectives on 27 Years of Fitts‘ Law Research in HCI. International Journal of Human-Computer Studies. 61(6): S. 766.[/ref]

[singlepic id=840 w=618 h= float=]

Bewertung anhand des Durchsatzes

Der Durchsatz ist ein Maß, das die Leistungfähigkeit des Zeigegerätes im Hinblick auf die ausgewählte Testaufgabe quantifiziert. Es kombiniert sowohl die Präzision als auch die Geschwindigkeit eines Interaktionsmechanismus zu einem vergleichbaren Wert. Das Maß für die Präzision ist dabei der zuvor beschrieben effektive Schwierigkeitsindex IDe jederKondition. Das Maß für die Geschwindigkeit ist die durchschnittliche Auswahlzeit der Ziele einer Kondition tm. Der Durchsatz T (Throughput) eines Zeigegerätes mit der Maßeinheit bit ergibt sich aus folgender Summe über alle x unterschiedlichen Konditionen:

T = ∑(IDe/tm)

Das Maß T erlaubt dann einen Vergleich der Leistungsfähigkeit eines Zeigegerätes bei verschiedenen Aufgaben oder verschiedener Zeigegeräte bei derselben Aufgabe. Zusätzlich kann mittels linearer Regression anhand der Wertepaare (IDe,tm) der einzelnen Konditionen überprüft werden, ob ein linearer Zusammenhang zwischen dem effektiven Schwierigkeitsindex und der dafür benötigten Auswahlzeit besteht und das Zeigegerät sich somit gegebenenfalls konform zu Fitts‘ Law verhält.

Praktische Anwendung

Geht man nach den beschrieben Schritten vor, wird mit dem Durchsatz ein Maß gewonnen, dass einen Vergleich verschiedener Eingabegeräte erlaubt. Daher ist die Evaluation nach ISO 9241-9 eine geeignete Methode, um beispielsweise verschiedene natürliche Interaktionsmechanismen zu vergleichen.
In Kürze folgt hierzu ein weiterer Bericht zu einer durchgeführten Evaluation über die Eignung verschiedener Eingabegeräte für die Steuerung eines großen Wandbildschirms unter Einhaltung der ISO-Vorgaben. Dabei wurden die Eigenschaften von fünf Interaktionsmechanismen aus unterschiedlichen Entferungen zu einem großen Wandbildschirm untersucht. Konkret handelte es sich dabei um die Nintendo Wii Remote, die Logitech MX Air Mouse, einen Friendlyway d-sign 52 Touchscreen, einen Microsoft Kinect Sensor und ein HTC Magic Smartphone.

[nggtags gallery=Interaktionsmechanismus+Evaluation]