Étude Gloria Mark

RÉSUMÉ

Nous avons mené une étude empirique pour examiner si le contexte des interruptions fait une différence. Nous avons constaté que le contexte ne fait pas de différence, mais étonnamment, les personnes ont terminé les tâches interrompues en moins de temps sans différence de qualité. Nos données suggèrent que les personnes compensent les interruptions en travaillant plus vite, mais cela a un coût : elles ressentent plus de stress, de frustration, de pression temporelle et d'efforts. Des différences individuelles existent dans la gestion des interruptions : les mesures de personnalité telles que l'ouverture à l'expérience et le besoin de structure personnelle prédisent les coûts de perturbation des interruptions. Nous discutons des implications pour la conception de systèmes qui soutiennent le travail interrompu.

Mots-clés des auteurs Multitâche, interruptions, expérience, contexte

Mots-clés de classification ACM H5. Interfaces d'information et présentation : H.5.2 Interfaces utilisateur : Théorie et méthodes

INTRODUCTION

Le rôle des interruptions sur le lieu de travail a commencé à susciter beaucoup d'attention en IHC ces dernières années. Les études empiriques se sont concentrées sur l'identification de l'ampleur des interruptions et de leur impact sur les tâches [6], la reprise des tâches après une interruption [3, 9], et le moment des interruptions, par exemple [1]. Inspirées par ces études de terrain et de laboratoire, des systèmes ont été développés pour aider les gens à gérer les interruptions (par exemple [3]). Cependant, à mesure que de nouvelles études sur le multitâche et les interruptions émergent, des idées contradictoires apparaissent sur la manière dont les interruptions pourraient affecter le travail.

INTERRUPTIONS ET CONTEXTE

Dans une étude de terrain sur des managers, Hudson et al. [8] ont rapporté que les interruptions pourraient être bénéfiques. D'autres résultats d'études en laboratoire et de journaux les ont décrites comme nuisibles [1, 3]. Mark et al. [10], en revanche, ont découvert que les effets des interruptions pourraient être plus nuancés : dans une étude de terrain, leurs informateurs ont rapporté que les interruptions du même contexte que la tâche en cours étaient bénéfiques, tandis que les interruptions d'un contexte différent étaient perturbatrices. Nous avons décidé d'examiner les différentes perspectives soulevées par ces études. Les interruptions au cours de la journée de travail peuvent être du même contexte que la tâche en cours ou aléatoires, liées à d'autres sujets. Si les interruptions du même contexte que la tâche en cours sont effectivement bénéfiques, cela a des implications importantes pour la conception des systèmes. Par exemple, les systèmes pourraient être conçus pour aider les collègues à adapter leurs interruptions aux autres afin de correspondre au contexte de leurs tâches.

Nous étions intéressés par la mesure du coût de perturbation des interruptions. Un type de coût de perturbation est le temps supplémentaire nécessaire pour se réorienter vers une tâche interrompue après avoir traité l'interruption. Ces études précédentes introduisent des notions contradictoires quant à savoir si le contexte de l'interruption est lié à un coût de perturbation. Par exemple, on peut travailler sur un document et être interrompu par un sujet complètement différent, comme une question sur un budget. Si une interruption a un contexte différent de la tâche en cours, cela pourrait introduire un coût de perturbation car elle implique un changement cognitif de contexte pour traiter l'interruption, puis il faut se réorienter pour reprendre la tâche interrompue. D'un autre côté, on peut être interrompu par une question concernant le même contexte que le document sur lequel on travaille. Cela pourrait être bénéfique, mais si le contexte de l'interruption et de la tâche principale sont similaires, cela pourrait entraîner une interférence avec la tâche principale [5] et ainsi introduire un coût de perturbation. Une troisième possibilité est que le contexte de l'interruption n'ait pas d'importance. Peut-être que toute discontinuité dans la tâche crée un coût de perturbation pour le travail. Les coûts de perturbation des interruptions peuvent également impliquer d'autres facteurs tels que le stress. Une deuxième question que nous nous sommes posée est de savoir comment le travail interrompu pourrait modifier l'état d'un utilisateur ; le travail interrompu est-il significativement plus stressant ou perçu comme plus exigeant que le travail non interrompu ? Bien que nous puissions intuitivement le croire, cela reste une question ouverte. Les coûts de perturbation peuvent également être atténués par des facteurs de personnalité. Nous nous attendions à ce que a) plus une personne est ouverte à de nouvelles expériences (et donc mieux capable de gérer de nouvelles tâches), et b) moins une personne a besoin de structure personnelle (et donc est plus flexible), plus le coût de perturbation serait faible. Nous avons raisonné que ces mesures indiqueraient si certains peuvent s'adapter plus rapidement que d'autres à une nouvelle situation (l'interruption) et ensuite se réorienter vers la tâche. De telles différences individuelles pourraient être utilisées pour concevoir une personnalisation dans un système afin de s'adapter aux préférences du lieu de travail.

L'objectif de notre expérience était de mieux comprendre comment les interruptions affectent le travail : ses schémas, les stratégies des utilisateurs et les coûts de perturbation afin d'informer la conception de systèmes pour aider les gens à gérer le travail interrompu.

CONCEPTION ET PROCÉDURE EXPÉRIMENTALES

Un plan expérimental factoriel 3x2 a été utilisé. Le facteur intrasujet était le contexte d'interruption avec trois niveaux : pas d'interruption (B, base), interruption de même contexte (S), et interruption de contexte différent (D). L'ordre du contexte d'interruption a été entièrement contrebalancé. Parce que les interruptions peuvent provenir de diverses sources, nous avons vérifié si le média pouvait affecter le contexte des interruptions. Le facteur intersujets était le type de média : les sujets étaient interrompus par téléphone ou par messagerie instantanée (IM).

Quarante-huit sujets ont participé. 81 % des sujets étaient des étudiants universitaires allemands avec une moyenne d'âge de 26 ans ; tous avaient un diplôme de fin d'études secondaires allemand (environ équivalent à une année dans une université américaine). La plupart étaient spécialisés en psychologie (27,1 %), en médecine/sciences (16,7 %), ou en mathématiques/ingénierie/IT (10,4 %). Quinze étaient des hommes et 33 des femmes. Tous sauf un participant utilisaient les e-mails depuis au moins deux ans. La moitié des sujets utilisaient la messagerie instantanée depuis au moins un an ou plus ; 29,2 % n'avaient jamais utilisé la messagerie instantanée auparavant. Les sujets ont été payés 12 euros pour leur participation.

Tâche expérimentale.

Nous avons simulé un environnement de bureau en laboratoire et choisi une tâche d'e-mail, courante dans le travail d'information. Les sujets ont lu des instructions indiquant qu'ils devaient jouer le rôle de gestionnaire des ressources humaines dans une entreprise de fournitures d'artisanat de taille moyenne. Ils venaient de revenir de vacances et ont été soigneusement instruits dans toutes les conditions (et ont reçu des incitations) de répondre à tous les e-mails dans leur boîte de réception aussi rapidement, correctement et poliment que possible. Les sujets ont reçu une fiche d'information simple à utiliser pour répondre aux e-mails, par exemple, les niveaux de poste et l'éducation du personnel, les heures supplémentaires, etc. Pour chaque condition de type d'interruption, les sujets devaient répondre à 12 e-mails. Sur la base d'études pilotes, les e-mails dans les dossiers étaient également répartis par sujets. Nous avons confirmé dans l'étude pilote que les questions des e-mails dans toutes les conditions étaient également exigeantes. Le contenu des e-mails consistait en des questions de diverses personnes, par exemple, « Où puis-je obtenir plus d'informations sur les stages dans votre entreprise ? » Les sujets ont d'abord effectué un e-mail d'essai avec l'expérimentateur pour se familiariser avec l'équipement et la tâche.

Interruptions Les sujets ont été informés que leur « superviseur » (l'expérimentateur qui était assis dans une autre pièce) les contacterait périodiquement et leur poserait des questions. Aucune interruption n'a été donnée dans la condition de base (B). Dans la condition S, les participants ont été interrompus par le superviseur avec des questions concernant le contexte des ressources humaines (par exemple, « Combien d'employés, y compris vous, sont dans le département aujourd'hui ? »). Ces questions étaient du même contexte que la tâche principale d'e-mail, c'est-à-dire les ressources humaines. Dans la condition D, les sujets ont été interrompus par le superviseur avec des questions sur un sujet différent non lié au contexte des ressources humaines. Ces interruptions portaient sur des sujets aléatoires, tels que la prochaine fête de l'entreprise (par exemple, « Combien de hot-dogs avons-nous besoin pour 240 employés ? »). Ces types d'interruptions aléatoires ont été conçus pour simuler les types d'interruptions que l'on pourrait attendre dans un véritable environnement de bureau. Des études pilotes ont confirmé que les questions dans les conditions S et D étaient jugées par les sujets comme étant de même contexte et de contexte différent, respectivement, par rapport au schéma des ressources humaines.

Les sujets ont été instruits de prêter attention aux interruptions immédiatement, c'est-à-dire de décrocher le téléphone ou de répondre à la fenêtre de messagerie instantanée. La fréquence des interruptions a été fixée à deux minutes, sur la base des observations de [6] et des expériences pilotes. Pendant l'expérience, l'expérimentateur a ajusté la durée des interruptions pour essayer de rendre les temps aussi égaux que possible dans toutes les conditions.

Variables dépendantes :

Notre principale variable d'intérêt était le temps total pour effectuer la tâche. Le temps total nécessaire pour compléter chaque bloc d'e-mails et le temps passé sur les interruptions ont été enregistrés manuellement. Le temps pour effectuer la tâche a été calculé comme [temps total pour effectuer la tâche – temps passé sur les interruptions]. Si le temps pour effectuer la tâche était plus élevé avec une interruption, cela pourrait indiquer qu'un temps supplémentaire était nécessaire pour effectuer la tâche après une interruption. Nous nous attendions à moins de politesse et à plus d'erreurs dans les messages e-mail qui étaient perturbés. Une mesure de politesse a été calculée en attribuant des points pour l'utilisation de phrases de salutation/clôture standard et de mots polis (par exemple, Cher Monsieur ; sincères salutations, s'il vous plaît, merci). Les erreurs ont été mesurées comme des fautes d'orthographe, des fautes de frappe ou autres (par exemple, noms mal orthographiés). La charge de travail subjective a été mesurée par un indice de charge de tâche NASA (TLX) modifié [7], utilisé par [1]. Nous avons ajouté une mesure de stress aux six échelles de notation données : demandes mentales et physiques, performance, et demande temporelle, que nous avons changée en pression temporelle, effort et frustration. Les sujets ont noté ces facteurs sur l'échelle standard NASA de 20 points.

Mesures de personnalité.

« L'ouverture à l'expérience » a été mesurée dans le cadre de l'Inventaire de Personnalité NEO Révisé en utilisant la sous-échelle Ouverture aux Actions de la traduction allemande [11] car ces éléments correspondaient le mieux à notre sujet. Dix éléments de la sous-échelle Besoin Personnel de Structure (BPS) de l'inventaire Besoin de Clôture Cognitive/Besoin Personnel de Structure ont été utilisés [2], (par exemple, « Je n'aime pas du tout changer mes plans à la dernière minute. »).

Procédure.

L'expérience a été menée dans un laboratoire universitaire et a duré environ 1 heure. Les sujets ont été répartis aléatoirement par type de média et par ordre d'interruption (les traitements ont été contrebalancés avec six permutations). Les sujets ont d'abord rempli un questionnaire pour obtenir les scores des mesures de personnalité et des informations démographiques et d'expérience informatique.

Les sujets ont ensuite effectué la tâche pour chaque contexte d'interruption. Après avoir complété chaque bloc d'e-mails, les sujets ont évalué les mesures de charge de travail dans un questionnaire.

RÉSULTATS Notre première question de recherche était de savoir si le contexte de l'interruption importe. Nous avons effectué des analyses de mesures répétées avec le type de média comme facteur intersujets. Les moyennes sont présentées dans le Tableau 1. Pour le Temps pour Effectuer la Tâche, il y avait une différence significative entre les types d'interruptions (F(2,77.98) = 3.36, p < .05). Étonnamment, les contrastes appariés ont montré que les sujets mettaient le plus de temps dans la condition de base pour effectuer la tâche (B vs. S : F(1,46) = 4.22, p < .05 ; B vs. D : F(1,46) = 4.13, p < .05). Il n'y avait pas de différence significative entre les contextes S et D.

Temps pour effectuer la tâche* (minutes)

Base (pas d'interruption)

Interruption de même contexte

Interruption de contexte différent

Nombre moyen d'erreurs dans les e-mails

22,77 (7,60)

20,31 (5,94)

20,60 (4,93)

Longueur du message e-mail* (nombre moyen de mots)

1,94 (0,91)

1,93 (0,88)

1,84 (0,92)

Politesse des messages e-mail

31,49 (8,1)

29,17 (7,02)

30,16 (7,18)

*Tableau 1. Mesures moyennes de performance de la tâche (écart-type). =p<.05.

Il n'y avait pas de différence significative de type de média, c'est-à-dire que le fait que les sujets soient interrompus par téléphone ou par messagerie instantanée n'avait pas d'importance (F(1,92) = .20, p < .66). Il n'y avait pas d'interaction significative entre le type de média et le type d'interruption sur le temps pour effectuer la tâche. Nous n'avons trouvé aucune différence significative dans le nombre d'erreurs commises entre les types d'interruptions (F(2,92) = 1.70, p < .19). Nous avons comparé notre mesure de politesse et n'avons trouvé aucune différence significative entre les conditions (F(2,92) = .10, p < .91). Pour les deux variables, nous n'avons trouvé aucune interaction avec le type de média.

Il était possible que la raison pour laquelle il fallait plus de temps pour effectuer la tâche dans la condition sans interruption soit que les gens écrivaient davantage. Nous avons examiné la longueur des messages e-mail entre les conditions. Une analyse de mesures répétées sur le nombre moyen de mots par e-mail (Tableau 1) a montré qu'il y avait une différence significative entre les conditions (F(2,92) = 3.34, p < .04). Les messages e-mail étaient les plus longs dans la condition B, sans interruptions (B vs. S : F(1,46) = 5.57, p < .05 ; B vs. D : F(1,46) = 2.20, p < .15). Il n'y avait pas d'interaction significative du type de média avec le nombre de mots.

Bêta

Ouverture à l'expérience

Besoin de structure personnelle

-.363

-.346

-2.22

-2.13

Tableau 2. Coefficients de régression pour les mesures de personnalité

En guise de contrôle, nous avons vérifié si le temps réel passé sur les interruptions était différent dans les contextes identiques ou différents, car des interruptions plus longues pourraient introduire un coût de perturbation plus élevé. Nous n'avons trouvé aucune différence significative dans la durée des interruptions (différence = .62 min, écart-type = 2.8, t(47) = 1.52, p < .14).

Variables de personnalité. Nous avons ensuite examiné dans quelle mesure les mesures d'ouverture à l'expérience et de besoin de structure personnelle sont prédictives du temps nécessaire pour accomplir une tâche constamment interrompue. Notre principale variable d'intérêt était le coût de perturbation et, puisqu'il n'y avait pas de différence de temps pour accomplir la tâche entre les contextes d'interruption identiques/différents, nous avons combiné les temps pour ces conditions afin de former une seule mesure dépendante (temps pour accomplir la tâche - temps passé sur les interruptions). Une analyse de régression pas à pas utilisant les mesures de personnalité comme prédicteurs a montré que l'« ouverture aux actions » et le « besoin de structure personnelle » sont des prédicteurs significatifs du temps pour accomplir une tâche interrompue (F(2,47) = 3.41, p < .04, R² = .14). Il existe une relation inverse : plus le score est élevé pour l'« ouverture à l'expérience » et le « besoin de structure personnelle », plus il est rapide d'accomplir une tâche interrompue (Tableau 2).

Charge de travail mentale*

Base (pas d'interruption)

Interruption de même contexte

Interruption de contexte différent

Stress*

10,02 (3,90)

10,83 (3,96)

11,50 (3,55)

Frustration*

6,92 (3,85)

9,46 (3,97)

9,13 (4,10)

Pression temporelle*

4,73 (2,93)

6,63 (4,19)

6,48 (4,45)

Tableau 3. Mesures moyennes (écart-type) de la charge de travail entre les types d'interruptions. Échelle de 1 (faible) à 20 (élevé), =p<.05, *p<.01.

Mesures de charge de travail.

Nous avons testé la différence des mesures de charge de travail mentale de la NASA (Tableau 3) entre les types d'interruptions. Une analyse de mesures répétées a montré une différence significative (F(2,92) = 3.82, p < .03). La charge de travail était la plus élevée pour la condition de contexte D (D vs. B : F(1,46) = 7.38, p < .01 ; D vs. S : F(1,46) = 2.09, p < .16). Nous avons également constaté que le stress était noté comme significativement différent entre les types d'interruptions (F(2,92) = 12.15, p < .001) et était le plus élevé pour les deux conditions d'interruption (S vs. B : F(1,46) = 20.32, p < .001 ; D vs. B : F(1,46) = 14.94, p < .001). Le niveau de frustration était également significativement différent entre les types d'interruptions (F(2,92) = 5.21, p < .007) et était le plus élevé dans les conditions d'interruption (S vs. B : F(1,46) = 7.88, p < .01 ; D vs. B : F(1,46) = 7.55, p < .01). La pression temporelle était également notée comme significativement différente entre les types d'interruptions (F(2,92) = 4.71, p < .01), avec la pression temporelle la plus élevée notée dans les conditions d'interruption (S vs. B : F(1,46) = 10.65, p < .01 ; D vs. B : F(1,46) = 3.65, p < .10). La quantité d'efforts investis dans la tâche était également significativement différente entre les types d'interruptions (F(2,79) = 8.50, p < .001), avec le plus d'efforts signalés dans les conditions d'interruption (S vs. B : F(1,46) = 6.92, p < .05 ; D vs. B : F(1,46) = 14.60, p < .001). Il n'y avait aucune interaction avec le type de média dans l'une de ces mesures.

DISCUSSION ET CONCLUSIONS

Nos résultats montrent que toute interruption introduit un changement dans le schéma de travail et n'est pas liée au contexte en soi. Nos résultats diffèrent de ceux de [5] qui ont trouvé que la similarité des processus cognitifs des interruptions avec une tâche était perturbatrice. Nous avons plutôt examiné la similarité du contenu des interruptions et d'une tâche. De plus, [4] a constaté que les interruptions extrêmement cohérentes avec la tâche étaient facilitantes. Notre contexte d'interruption partageait le même sujet que la tâche principale (e-mail), mais contrairement à [4], les opérations et les détails différaient. Ensemble, notre étude ainsi que celle de [10], qui rapportent les points de vue subjectifs des participants, montrent que les interruptions partageant un contexte avec la tâche principale peuvent être perçues comme bénéfiques, mais le coût réel de perturbation est le même que pour un contexte différent.

Étonnamment, nos résultats montrent que le travail interrompu est effectué plus rapidement. Nous proposons une interprétation. Lorsque les gens sont constamment interrompus, ils développent un mode de travail plus rapide (et écrivent moins) pour compenser le temps qu'ils savent qu'ils vont perdre en étant interrompus. Cependant, travailler plus vite avec des interruptions a un coût : les personnes dans les conditions interrompues ont ressenti une charge de travail plus élevée, plus de stress, une frustration plus élevée, une pression temporelle plus élevée et plus d'efforts. Ainsi, le travail interrompu peut être fait plus rapidement, mais à un certain prix.

Nos résultats suggèrent que les interruptions amènent les gens à changer non seulement leurs rythmes de travail, mais aussi leurs stratégies et leurs états mentaux. Une autre possibilité est que les interruptions allongent effectivement le temps nécessaire pour effectuer une tâche, mais que ce temps supplémentaire ne survient que directement après l'interruption, lors de la réorientation vers la tâche, et qu'il peut être compensé par un style de travail plus rapide et plus stressant. Des mesures plus sophistiquées de la vitesse de travail immédiatement après une interruption doivent être effectuées pour tester cela. Nous avons constaté que plus une personne est ouverte aux expériences, plus elle gère rapidement le travail interrompu et, étonnamment, nous avons trouvé la même relation pour ceux qui ont un score élevé en besoin de structure personnelle. Peut-être que ceux qui ont besoin de structure personnelle sont mieux capables de gérer leur temps lorsqu'ils sont interrompus.

Bien que les études en laboratoire soient toujours sujettes à des critiques de validité écologique, notre conception de tâche était basée sur un travail de terrain réel. Nous avons simulé des conditions de bureau en utilisant une tâche d'e-mail, ce qui est différent de nombreuses études de laboratoire sur le changement d'attention qui utilisent des tâches abstraites. L'environnement de laboratoire nous a permis d'isoler les variables d'intérêt. Nos résultats ont des implications pour la conception de systèmes. Un certain nombre d'interruptions peut être tolérable car les gens peuvent compenser avec une vitesse de travail plus élevée. Cependant, la technologie pourrait être utilisée pour suivre et contrôler les interruptions sur une longue période afin de ne pas surcharger les gens (comme le suggèrent nos mesures de charge de travail mentale). Après seulement 20 minutes de performance interrompue, les gens ont signalé un stress, une frustration, une charge de travail, des efforts et une pression significativement plus élevés. Nous ne pouvons pas dire si les gens s'adapteraient avec le temps ou si ces mesures augmenteraient seulement. Nos résultats confirment expérimentalement les rapports anecdotiques des informateurs dans les études de terrain qui décrivent un stress élevé lorsqu'ils sont interrompus dans des situations de travail réelles [10]. Nos données ont également contribué à trouver des différences individuelles dans les interruptions. Nos mesures de personnalité suggèrent la nécessité d'une personnalisation des systèmes pour s'adapter à la tolérance préférée des interruptions des gens. Nous espérons que notre étude suscitera un intérêt continu dans ce domaine.

RÉFÉRENCES

Adamczyk P. D. & Bailey B. P. If not now, when? The effects of interruption at different moments within task execution. Proceedings of CHI’04, (2004), 271-278.
Collani, G. Eine deutsche Skala zum Konstrukt Bedürfnis nach kognitiver Geschlossenheit (NFCC)/Persönliches Strukturbedürfnis (PNS). In A. Glöckner-Rist (Ed.), ZUMA-Informationssystem. Mannheim: Zentrum für Umfragen, Methoden und Analysen (2004).
Czerwinski, M., Horvitz, E., and Wilhite, S. A diary study of task switching and interruptions. Proceedings of CHI'04, (2004), 175-182.
Czerwinski, M., Cutrell, E. and Horvitz, E., Instant messaging: Effects of relevance and timing. Proc. of HCI’00, British Computer Society (2000), 71-76.
Gillie, T. & Broadbent, D. What makes interruptions disruptive? A study of length, similarity and complexity. Psych Research, 50, (1989), 243–250.
Gonzáles, V. & Mark, G. Constant, constant, multitasking craziness: managing multiple working spheres. Proceedings of CHI ‘04, (2004), 113-120.
Hart, S. G., & Staveland, L. E. Development of a multidimensional workload rating scale: Results of empirical and theoretical research. In P. A. Hancock & N. Meshkati (Eds.), Human mental workload, Amsterdam, The Netherlands: Elsevier, (1988), 139-183.
Hudson, J.M., Christensen, J., Kellogg, W.A. and Erickson, T. “I’d be overwhelmed, but it’s just one more thing to do:” Availability and interruption in research management. Proc. of CHI 2002, (2002), 97-104.
Iqbal, S.T. and E. Horvitz, Disruption and recovery of computing tasks: Field study, analysis, and directions, Proceedings of CHI 2007, 677-686.
Mark, G., Gonzalez, V., and Harris, J. No Task Left Behind? Examining the Nature of Fragmented Work. Proceedings of CHI’05, (2005), 113-120.
Ostendorf, F & Angleitner, A. NEOPersönlichkeitsinventar nach Costa und McCrae, Revidierte Fassung (NEO-PI-R). Manual. Göttingen: Hogrefe, (2003).