Abstract
Cet article présente le protocole du mur d’images en ligne (ou MIEL), afin d’évaluer – grâce à un exemple – ses apports méthodologiques et analyser son efficacité comme technique de recherche marketing. Nous exposons les fondements théoriques et épistémologiques de cette méthode mixte, puis les principes de sa mise au point et les possibilités d’analyse offertes. Nous montrons que ce dispositif hybride permet de mêler les intérêts d’un protocole interprétatif qui intègre images et textes, tout en générant – à grande échelle – des données riches et de bonne qualité, exploitables statistiquement. Il apparait que le MIEL est bien adapté à l’analyse des composantes expérientielles et émotionnelles de la consommation.
Introduction
Les dimensions expérientielles occupent une place de plus en plus importante dans l’étude des pratiques de consommation. De même, les réponses émotionnelles ou symboliques des consommateurs vis à vis des produits ou des marques suscitent un intérêt croissant de la part des chercheurs et des praticiens. Mais ces contenus affectifs et expérientiels ne sont pas faciles à capter et il convient de déployer des techniques de recherche bien adaptées pour comprendre correctement ces phénomènes intimes, cachés, voire inconscients. Il apparaît que les dispositifs purement quantitatifs ne sont pas assez spontanés et profonds pour y parvenir. Les techniques qualitatives – quant à elles – présentent des limites de généralisation.
Nous voyons ainsi éclore des méthodes mixtes ou hybrides – mêlant protocoles qualitatifs et quantitatifs – qui remettent à jour certaines techniques traditionnelles d’anthropologie visuelle et qui visent l’immersion du répondant pour un plus grand engagement dans le processus de réponse. Nous assistons à l’émergence de nouveaux dispositifs – ou à la résurgence de certains autres – qui peuvent désormais s’appuyer sur les ressources technologiques de l’Internet et sur ses capacités volumineuses de déploiement.
Ces instruments sont toutefois peu connus et les chercheurs ne disposent pas de guide méthodologique pour faciliter leur utilisation. Parmi ces méthodes, nous présentons le mur d’images en ligne (ou MIEL), qui nous semble particulièrement bien adapté à l’analyse des dimensions émotionnelles ou expérientielles de la consommation. Dans cet article, nous en présenterons les fondements théoriques et épistémologiques, puis nous indiquerons – grâce à un exemple – comment le mettre au point et exploiter les nombreux résultats qu’il peut générer. Nous verrons comment le MIEL permet de rendre des dispositifs d’ordinaire très qualitatifs, plus systématiques et plus formalisés. Nous comparerons ensuite la qualité des réponses issues du MIEL, à celle qui est obtenue via d’autres formes de questionnement. Nous pourrons ainsi évaluer ses apports potentiels et son efficacité comme technique hybride de recherche et d’étude marketing. Nous préciserons en conclusion les contextes d’utilisation privilégiés du MIEL.
Le protocole du mur d’images en ligne: à la croisée de plusieurs courants méthodologiques
Présentation du mur d’images en ligne (MIEL)
Le protocole du « mur d’images en ligne » ou MIEL, consiste à demander à la personne interrogée de sélectionner plusieurs images parmi un large choix de photographies afin d’exprimer son avis sur un thème donné, de justifier ensuite ses choix et répondre enfin à d’autres questions fermées. Le MIEL fait partie des méthodes mixtes (ou hybrides) qui connaissent aujourd’hui un intérêt croissant auprès des chercheurs et des praticiens en marketing (Harrison et Reilly, 2011). Ainsi, comme première étape, le répondant se voit exposé – dans le cadre d’une enquête en ligne – à un grand ensemble d’images préparées par les chercheurs et doit en choisir quelques-unes, en réponse à une question visant à repérer ses associations mentales autour du thème étudié, comme par exemple : « Que signifie ce thème pour vous ? Veuillez choisir n images dans le mur ci-dessous, qui représentent ce que ce thème signifie pour vous. ». Dans l’écran suivant, les quelques images choisies sont présentées à nouveau et le répondant est amené à justifier son choix, avec le texte suivant 1 : « Vous avez choisi les images suivantes pour représenter ce que le thème signifie pour vous. Pouvez-vous nous dire en quelques phrases ce que vous aviez à l’esprit quand vous avez choisi ces images et pourquoi vous les avez sélectionnées ? ». Cette étape importante constitue ce que Stanczak (2007) appelle une « collaboration interprétative » des participants. Dans une troisième étape, d’autres questions plus classiques s’ensuivent, mesurant comportements, attitudes et autres motivations vis à vis du phénomène étudié. Le protocole du MIEL comporte donc trois séquences successives : le choix des images, sa justification, puis un questionnement plus fermé.
Ce dispositif nous apparaît très intéressant a priori, pour des recherches à dominante expérientielle ou émotionnelle, car il permet une bonne immersion du répondant. Grâce à la projection, le recours aux images permet d’accéder à des contenus plus cachés ou inconscients (Boddy, 2005). La recherche menée par Albert et al. (2008) emploie le protocole du MIEL avec succès pour étudier le sentiment d’amour envers une marque. Le MIEL génère par ailleurs un volume riche d’informations que le chercheur pourra confronter à d’autres données (triangulation) afin d’asseoir et affiner ses conclusions. De nombreuses analyses sont possibles : descriptives (images choisies, mots et concepts clé des verbatim), comparatives (différences de représentations en fonction de variables explicatives candidates) ou multivariées (en vue d’une segmentation par exemple). Le MIEL peut se présenter comme un compromis méthodologique intéressant pour générer des insights profonds, tout en quantifiant les résultats. Nous allons voir tout d’abord sur quels fondements méthodologiques repose cette technique.
Les méthodes mixtes
Les principes du MIEL coïncident tout à fait avec les éléments constitutifs des approches mixtes, selon une posture que nous pourrions qualifier de « post-positiviste » (Lincoln et Guba, 2000). Les méthodes mixtes de recherche se définissent en effet comme « l’ensemble des procédures de collecte et d’analyse de données quantitatives et qualitatives menées dans le cadre d’une même étude » (Tashakkori et Teddlie, 2010: 19). Leur usage n’est toutefois pas si fréquent, ni dans les recherches en marketing, ni dans la pratique des professionnels des études. Dans notre discipline, la traditionnelle opposition entre approches quantitatives et qualitatives est toujours tenace. Nous manquons par ailleurs de trames méthodologiques bien établies et d’illustrations convaincantes pour piloter des méthodes mixtes (Tashakkori et Teddlie, 2010) alors que celles-ci sont largement disponibles, notamment pour la recherche à dominante quantitative.
Deux raisons principales justifient le recours à des méthodes mixtes de recherche (Onwuegbuzie et Teddlie, 2003) : la « représentation » et la « légitimation ». La « représentation » renvoie à la capacité d’extraire des informations adéquates à partir des données sous-jacentes ou selon les auteurs à « obtenir plus de la part des données ». Il est admis que le caractère non-directif (ou semi-directif) des protocoles qualitatifs de collecte de données permet de recueillir plus librement et plus spontanément un nombre d’informations plus étendu et donc plus riche. A cet égard, Stanczak (2007) souligne la capacité des protocoles incluant des images à révéler de la connaissance inattendue. Nous pouvons considérer ainsi que le MIEL fait partie des techniques projectives ou de « facilitation » (Pellemans, 1999: 97) qui permettent de « franchir la façade sociale de l’individu pour pénétrer son comportement plus en profondeur » mais aussi de « faciliter l’expression plus spontanée des affects et du vécu vis à vis d’un produit ou d’un service ».
La « légitimation » quant à elle, se réfère à la validité de l’interprétation des données. Sur ce deuxième point, via des allers-retours entre les deux types de dispositifs, il s’agirait en quelque sorte de dénombrer les résultats qualitatifs et de qualifier les données quantitatives : on parle parfois de « triangulation » (Andréani et Conchon, 2005 ; Jick, 1979). Le fait de vérifier par une technique qualitative des résultats quantitatifs (illustrer par exemple une analyse typologique par des verbatim de consommateurs) ou l’inverse (vérifier des résultats statistiques via une confrontation à la réalité qualitative du terrain), permet au chercheur ou au chargé d’études d’asseoir la validité de ses conclusions. (Stanczak, 2007: 12) justifie ainsi le recours aux images pour « ajouter une couche supplémentaire de données qu’un lecteur critique peut trianguler avec des données statistiques, de la discussion théorique ou conceptuelle, et l’expérience vécue des participants, interprétée subjectivement ».
Dans le monde académique, les méthodes mixtes sont minoritaires mais elles comptent un nombre significatif de supporters. Une revue scientifique leur est désormais spécifiquement dédiée : le Journal of Mixed Methods Research et elles sont présentes dans environ 15% des articles en sciences de gestion (Cameron et Molina-Azorin, 2011) qui incluent un volet empirique. La plupart du temps, il s’agit de dispositifs séquentiels plutôt que simultanés. Les chercheurs les déploient ainsi, à des fins de développement ou de complémentarité : une étude qualitative en amont d’une enquête par questionnaire, par exemple (Molina-Azorin, 2011). Il apparait par ailleurs que les articles en stratégie et entrepreneuriat qui mobilisent des méthodes mixtes de recherche, produisent un meilleur impact que les travaux purement quantitatifs ou qualitatifs, avec un indice de citation supérieur de 50% pour la stratégie et de 70% pour l’entreprenariat (Molina-Azorin, 2011). Dans le monde professionnel, un certain nombre de praticiens reconnus (Bô, 2010 ; Pawle et Delfaud, 2014) tentent de promouvoir ce type d’approches dites « quali-quantitatives », pour favoriser des prises de décision plus éclairées en marketing.
L’anthropologie visuelle et les protocoles immersifs d’enquête en ligne
Le MIEL s’inscrit dans la longue tradition des techniques de l’anthropologie visuelle. Le recours aux images pour collecter des informations relatives à des questions de sciences sociales ne constitue pas une innovation. Il s’agit d’une des modalités possibles des techniques d’anthropologie visuelle, classées traditionnellement parmi les méthodes qualitatives. Les images peuvent être produites par le chercheur ou par le(s) sujet(s) étudié(s) (Dion, 2007). Certains chercheurs considèrent l’image comme un outil d’enregistrement, via les « inventaires » ou la prise de notes visuelles. Ces techniques apportent une reproduction précise et dynamique de la réalité et peuvent être complétées par un échange organisé entre le sujet et le chercheur autour d’un processus de catégorisation ou « photo-elicitation » (Harper, 2002). Si la catégorisation est réalisée par les sujets eux-mêmes, il s’agit alors d’ « auto-driving » (Heisley et Levy, 1991).
Dans la même lignée, les méthodes de collection d’images (ou de collage) ont connu récemment un net regain d’intérêt. Etablie depuis plusieurs décennies, la méthode ZMET 2 (Zaltman, 1997) propose au répondant d’élaborer une composition, à partir de plusieurs images qu’il aura sélectionnées, pour exprimer son point de vue sur le thème étudié. Les images récupérées donnent lieu à une discussion avec l’analyste qui enregistre et interprète les explications du répondant selon un protocole bien défini (Zaltman et Coulter, 1995). La technique du « photo-langage » est également très populaire dans les sciences sociales et consiste à faire s’exprimer les participants (en groupe ou individuellement) sur la base d’une collection d’images préparée cette fois-ci par les chercheurs, par exemple des adolescents sur le thème de la sexualité (Baptiste et al., 1991). Dans le domaine du design, Yoon, Desmet et Pohlmeyer (2013) ont développé un outil nommé « Embodied Typology of Positive Emotions », sous la forme d’un ensemble de cartes qui représentent et décrivent 25 émotions – via des dessins et des textes. L’intérêt est de faciliter l’expression plus précise des émotions positives, ce que les auteurs appellent la « granularité émotionnelle ». Citons enfin la méthode « Album On Line » (Vernette, 2007) où, suite à une réflexion individuelle sur un scenario donné, les participants s’entendent sur le choix d’un album d’images (obtenues via le Web) pour exprimer leurs représentations du thème étudié. Des mots-clés et des histoires brèves sont générés en parallèle.
Le MIEL, qui s’appuie lui aussi sur des images collectées sur le Web, et qui les soumet ensuite à des répondants d’une enquête sur Internet, peut être rapproché d’un courant méthodologique plus récent défini comme « l’anthropologie visuelle digitale » (Pink, 2011). Il est important de relier ce type de dispositifs à l’essor – dans les sociétés occidentales contemporaines – de ce que certains auteurs appellent la « culture de l’image ». Selon cette culture, les images médiatisées sont utilisées de plus en plus souvent (comme via Facebook, Instagram ou Snapchat par exemple) comme des sources et des expressions de l’identité culturelle (Jansson, 2002) et elles constituent l’écho ou même l’objet de nombreux phénomènes modernes de consommation, en particulier pour les adolescents et les jeunes adultes, selon une vision plus générationnelle.
Aujourd’hui, de nouveaux protocoles sont naturellement disponibles qui exploitent au mieux les ressources du Web – mais dont les usages demeurent encore assez limités (Krantz et Williams, 2010). Nous assistons à l’émergence de protocoles interactifs et « immersifs » (Carù et Cova, 2006), comme le reflet d’une analyse de plus en plus expérientielle de la consommation (Csikszentmihalyi, 2000 ; Schmitt, 1999). L’idée des protocoles d’enquête en ligne immersifs est – selon une tradition qualitativiste – de tenter de recréer partiellement les conditions du thème étudié par de l’illustration et de la contextualisation (les images en sont un des supports possibles), puis par du mouvement et de l’interactivité. Les objectifs opérationnels visent initialement à créer un effet d’accroche stimulant pour donner tout d’abord plus envie de répondre. Il s’agit ensuite et surtout de favoriser l’implication ou l’engagement du répondant et donc la qualité de ses réponses (Downes-Le Guin et al., 2012 ; Puleston, 2011). Bradburn (1977) suggère que si l’interview devient « un événement social agréable à part entière », la perception du « fardeau » de la réponse pourrait s’alléger et conduire à un meilleur engagement du répondant dans l’enquête. Certains chercheurs voient dans les environnements virtuels immersifs des outils de recherche très prometteurs pour les sciences sociales, permettant d’assurer un certain réalisme, tout en garantissant un excellent contrôle expérimental, et ce, sur un échantillon plus large (Blascovich et al., 2002).
Rappelons que la théorie du « double codage » suppose la primauté des images pour capter les réactions non verbales plus émotionnelles (Paivio, 1971). Cette théorie est reprise et développée par Rossiter et Perry (1980) qui décrivent une « double boucle » de persuasion publicitaire, à la fois verbale et visuelle. Selon eux, les images influencent l’attitude vis-à-vis du produit ou de la marque, via la partie visuelle de la boucle.
En outre, nous savons que les images manipulées sur un support numérique s’avèrent très intéressantes pour permettre au répondant de formuler plus facilement des réponses sensorielles ou émotionnelles, comme l’a bien montré l’étude de Pawle et Delfaud (2014) portant sur des cafés instantanés. Ce type de dispositifs peut également contribuer dans une perspective expérientielle à une forme de co-création des produits, comme l’illustre parfaitement le site PixmeAway (Neuhofer et al., 2014) dans le domaine du tourisme.
Il convient enfin de situer le MIEL parmi d’autres méthodes de nature visuelle. Le tableau 1 ci-après rappelle les objectifs, les principes, les bénéfices principaux et les limites de plusieurs dispositifs analogues. Nous constatons que le protocole du MIEL, même s’il n’est pas encore très diffusé dans les recherches en marketing, présente un intérêt certain parmi l’ensemble des techniques de nature visuelle à la disposition du chercheur. Il ne vise pas à remplacer des protocoles purement qualitatifs et exploratoires comme les photo-langages ou les collages, et son investigation est sans doute moins profonde et systématique que le ZMET, mais il peut intervenir plus en aval, dans une étape plus confirmatoire. Dans la lignée de l’AOL, grâce à une diffusion sur l’Internet, conforme aux usages contemporains du Web et de sa profusion d’images, il permet de déployer un dispositif relativement ouvert, libre et spontané (choix parmi plusieurs dizaines d’images – génération de verbatim) sur un grand nombre de répondants. Il donne ainsi la possibilité – au-delà de l’interprétation des images plébiscitées et des textes exprimés – de dénombrer statistiquement les résultats d’une façon un peu plus objectivée. Le rappel des images choisies – deuxième étape du MIEL – permet enfin de reproduire partiellement une certaine forme d’interactivité qui pourrait contribuer à une meilleure implication cognitive du sujet interrogé, qui améliorerait sa satisfaction et la qualité de ses réponses, à travers leur complétude, leur variabilité et leur richesse (Bouzidi, 2011).
Le protocole du “mur d’images” en ligne parmi d’autres méthodes de nature visuelle.
Mise au point et exploitation du mur d’images en ligne
La section suivante décrit plus précisément la procédure de mise au point du MIEL, puis son exploitation. Schématiquement, le processus de mise au point et d’exploitation du MIEL comprend sept phases décrites dans la figure 1 ci-après. Nous les illustrons à l’aide d’un exemple issu d’une enquête en ligne visant à explorer les représentations et les motivations vis à vis de la consommation de chocolat. Le questionnaire a été diffusé en ligne, entre octobre et décembre 2012 en France, auprès d’environ 2000 personnes pré-recrutées – par les étudiants et leur professeur – pour répondre à un questionnaire sur les représentations mentales de la consommation de chocolat, dans le cadre d’un cours de méthodologie des enquêtes. Plus de 800 réponses ont pu être exploitées 3 .

Schéma descriptif des étapes de mise au point et d’exploitation du M. I. E. L.
Sélection des images
La conception du MIEL s’apparente à l’élaboration d’outils similaires incluant des images, comme l’Embodied Typology of Positive Emotions (Yoon et al., 2013). La recherche des images s’effectue initialement par le biais d’un moteur de recherche en ligne. En fonction du thème de l’étude, cette collecte d’images est axée dans notre exemple sur les mots suivants : « chocolate », « chocolat », « cacao ». Cette méthode est efficiente car elle capte – par nature – les représentations parmi les plus populaires de la rubrique concernée.
En plus de représenter différentes formes de produits (tablette, pâte à tartiner, boisson chaude, gâteau, glace, mousse, etc.), les images (toutes en couleurs, de même taille et libres de droit, grâce à la fonction avancée du moteur de recherche utilisé) sont sélectionnées surtout pour qu’elles couvrent l’ensemble des dimensions théoriques fournies par la littérature académique et relatives ici aux motifs de consommation du chocolat. Dans notre exemple, le choix des chercheurs se porte sur les différentes dimensions des expériences de consommation du chocolat d’après l’étude de Zarantonello et Luomala (2011). Quatre types de motivations sont présentés : le chocolat comme médicament, les « manœuvres de l’esprit » (échappement ou nostalgie par ex.), la régression et le renforcement rituel. Le mur d’images est conçu, de sorte qu’au moins trois images soient liées à chaque dimension. Le tableau 2 ci-dessous montre quelques-unes des images utilisées pour représenter les différentes dimensions, selon la catégorisation des chercheurs. Un test de fidélité inter-codeurs est recommandé pour vérifier la bonne allocation des images aux différents thèmes. Ainsi, la mise au point du MIEL combine un double effet : un effet d’émergence des images les plus populaires via le référencement dans les moteurs de recherche et un effet de modération par le chercheur qui veille à respecter un équilibre et une cohérence vis à vis des concepts théoriques mobilisés.
Dimensions théoriques et images proposées.
Tests et version préliminaire
Suite à la préparation du mur d’images initial, un pré-test a été mené sur un échantillon de plusieurs dizaines de répondants. Le but du pré-test est tout d’abord de vérifier l’ensemble du processus : cohérence de la structure du questionnaire, compréhension des questions et des instructions, etc. Il s’agit également d’évaluer la composition du mur d’images afin d’identifier les éventuelles thématiques ou images manquantes, et de vérifier leur bonne lisibilité. Cet échange sur la sélection des images entre chercheurs et sujets testeurs permet de limiter encore la subjectivité du choix des images. Le pré-test a d’ailleurs révélé que certaines images étaient manquantes (barres de chocolat dans un morceau de baguette par exemple), et qu’il existait un nombre trop important d’images représentant le caractère charnel du chocolat. Les commentaires et suggestions émanant du test permettent d’aboutir à la version finale du MIEL.
Validité et cohérence du MIEL
Afin d’appréhender l’erreur possible de réponse introduite par le MIEL, sa validité et sa cohérence doivent être testées avant la mise au point de la version finale. Similairement aux procédures appliquées sur les mesures quantitatives (Helfer et Kalika, 1988), validité et cohérence peuvent être évaluées grâce à une série d’analyses adaptées (Rodriguez Santos et al., 2013) comme:
- l’étude des correspondances entre premier, deuxième et troisième choix qui représente en quelque sorte la validité convergente du MIEL : nous vérifions par exemple qu’un répondant choisissant une image représentant une consommation individuelle en premier, tend statistiquement à choisir une image de la même catégorie pour ses deuxième et troisième choix,
- l’analyse des associations entre les images choisies et les motifs de consommation déclarés dans les réponses aux questions ouvertes suivantes, ce qui permet de tester une forme de validité prédictive, c’est-à-dire ici la capacité des images proposées à induire les attitudes du consommateur, (voir figure 2 ci-après 4 ),
- la confrontation des images choisies avec d’autres mesures de consommation enregistrées ultérieurement dans le questionnaire qui permet d’évaluer la cohérence (Helfer et Kalika, 1988) du MIEL: nous testons par exemple la correspondance statistique entre les préférences induites dans les images sélectionnées et les fréquences et les budgets de consommation déclarés.

Associations entre images et motifs de consommation déclarés.
Types d’analyses possibles
De nombreuses analyses sont possibles à partir d’un large ensemble de mesures incluant des sélections d’images, des verbatim et des réponses à des questions fermées. Les images en particulier (comme les textes libres) fournissent des résultats variés en fonction des questions qui sont posées aux répondants (Stanczak, 2007). Nous pouvons recourir par exemple à l’analyse descriptive des images choisies (considérées individuellement ou par catégories) ou à l’étude des verbatim issus des justifications exprimées après les choix d’images. Les verbatim peuvent être exploités sous leur forme brute ou recodés via l’analyse de données textuelles afin de confronter les catégories thématiques à d’autres variables de l’étude. La signification des images réside surtout dans les modalités selon lesquelles les participants les interprètent, plutôt que dans les propriétés inhérentes à leur contenu (Stanczak, 2007). Dans l’exemple du chocolat évoqué ici, nous pourrons chercher à interpréter pourquoi l’image du gâteau fondant a été la plus fréquemment choisie. En lisant les verbatim associés, nous découvrons que – pour beaucoup – cette image représente une certaine convivialité, soit dans la préparation d’un bon gâteau maison, soit dans le partage d’un bon dessert que tout le monde apprécie.
Selon les questions de recherche, des analyses bivariées sont possibles, en vue de comparer les catégories d’images choisies par les différentes classes d’âge, ou d’observer les thématiques évoquées dans les verbatim, autour du même groupe d’images (comme celles qui évoquent la nostalgie par exemple), en fonction du genre, de la nationalité, etc. Nous avons ainsi observé que les représentations autour de la gourmandise, de la convivialité ou du cadeau varient plus nettement en fonction de la classe d’âge que du genre.

Correspondances entre groupes, images choisies, justifications et dimensions d’implication.
Nous pouvons aussi réaliser des analyses multivariées mêlant images choisies, explications textuelles, et variables numériques. Cette procédure permet notamment aux chercheurs de valider l’interprétation qu’ils font des résultats observés, et de les affiner. Ce principe de « triangulation » est très pertinent pour éviter les interprétations erronées, mais également pour soutenir les conclusions d’une étude.
Ci-après, une analyse factorielle illustre cette démarche en confrontant les variables suivantes :
- les images sélectionnées : repérées par l’abréviation IMG sur la carte,
- les représentations liées à la consommation de chocolat (recodées par analyse lexicale) que les répondants ont exprimées après les choix,
- les groupes dans lesquels les répondants sont répartis, suite à une classification automatique réalisée sur une échelle d’implication simplifiée composée de questions couvrant les cinq facettes proposées par Laurent et Kapferer (1986). Trois groupes sont identifiés via la procédure des centres mobiles. Les « connaisseurs » sont très impliqués vis-à-vis du chocolat, en particulier pour les dimensions situationnelles. Les « hédonistes » sont les plus hauts sur la dimension du plaisir. Les « instrumentaux » sont moins impliqués. Les choix d’images de chacun et leurs justifications permettent de préciser l’interprétation des groupes.
Nous pouvons voir sur la carte factorielle ci-dessus qu’il existe une très bonne correspondance entre l’interprétation des groupes de consommateurs, les images sélectionnées, et les thèmes cités. Par exemple, au Nord-Est de la carte, les « connaisseurs » qui sont très impliqués sur les dimensions situationnelles, font référence aux fêtes et aux souvenirs. Les « hédonistes » insistent bien évidemment sur les dimensions sensorielles : le plaisir, le goût mais aussi la gastronomie. Les « instrumentaux » - placés à l’Ouest de la carte – sont plus détachés vis-à-vis de la consommation de chocolat, et le voient comme un moyen de se réchauffer ou d’accompagner son petit-déjeuner. Les choix d’images montrent que ces trois conceptions du chocolat renvoient aussi à des formes différentes du produit : plutôt liquide et chaude pour les instrumentaux, plus préparée pour les hédonistes (mousse, crème ou glace) et plus élaborée pour les connaisseurs (boîtes de chocolats fins par ex.). En outre, selon une approche mixte, le contenu des verbatim permet de préciser la bonne interprétation des groupes de consommateurs, comme nous le montre le tableau 3.
Verbatim significatifs des groupes de répondants (connaisseurs et hédonistes).
L’efficacité productive du protocole MIEL
Au-delà de son intérêt pour le mixage des approches qualitatives et quantitatives et de ses possibilités de triangulation, nous avons étudié l’efficacité productive du MIEL et, en particulier, son impact sur la qualité, l’abondance et la richesse des réponses.
La qualité des réponses
Parmi les différentes sources d’erreur associées à une enquête (Groves, 1989), la qualité des réponses occupe une place prépondérante. Celle-ci a été trop longtemps limitée à la seule prise en compte du taux de réponse mais plus récemment, la notion de qualité des réponses a été étendue (Ganassali, 2008; Schonlau et al., 2002) à une gamme beaucoup plus large d’indicateurs incluant le taux de remplissage (voir Deutskens et al., 2004 par exemple), l’abondance (voir Healey et al., 2005 par ex.) ou la diversité (Fricker et al. 2005 par ex.). Dans cet esprit, la notion de qualité « élargie » des réponses vise à mesurer l’implication (ou l’engagement) du répondant dans l’enquête et donc sa propension à exprimer ses attitudes, ses opinions ou ses intentions de façon la plus explicite et la plus riche possible. Il est admis que le format du questionnaire en ligne produit un effet sur la qualité des réponses (voir Vicente et Reis, 2010 pour une revue assez récente). En référence au modèle de MacKensie et Podsakoff (2012), nous pensons que le MIEL peut optimiser la qualité des réponses notamment par un double effet de simplification de la tâche de réponse (il est facile de cliquer sur trois images pour exprimer son point de vue) et de motivation à répondre correctement (via un protocole visuel et interactif).
La même enquête sur le chocolat a été utilisée afin de tester l’influence de ce dispositif sur la qualité des réponses. Nous avons en effet conçu et diffusé trois versions différentes du même questionnaire (voir extraits en figure 4 ci-après) :
- la première (1) était classique et n’incluait aucune illustration ;
- la deuxième proposait des images fixes en guise d’illustrations (2), placées au-dessus d’une question ouverte ;
- la troisième incluait un mur de 36 images disposées aléatoirement (3) et représentant les différentes dimensions des expériences de consommation du chocolat d’après Zarantonello et Luomala (2011).

Les trois déclinaisons de l’enquête « Chocolat ».
Les répondants ont été assignés aléatoirement à l’un des trois formulaires selon une répartition prédéfinie de 60%–20%–20% au profit du mur d’images 5 . Les emails d’invitation sont strictement identiques quelle que soit la version du questionnaire visualisée ensuite. Une seule relance a été effectuée, cinq jours après l’envoi simultané des trois versions de l’enquête. Le système de recrutement des participants nous a permis d’enregistrer un taux de réponse particulièrement élevé qui dépasse 40%.
Taux de réponse et de rétention
Le taux de réponse est l’indicateur le plus fréquemment utilisé pour évaluer la réussite d’une campagne d’enquête en ligne. Il est calculé sur l’ensemble des envois réussis, en excluant les mauvaises adresses et les éventuels rejets pour des raisons de blocage technique ou de sécurité. Le taux de rétention est le ratio entre le nombre final de répondants et le nombre initial de personnes ayant visualisé le tout premier écran de l’enquête. L’inverse du taux de rétention est le taux d’abandon, qui mesure la proportion d’internautes ayant quitté l’enquête en cours de route, sans enregistrer et soumettre leurs réponses.
Le tableau 4 ci-après nous montre que le MIEL produit un effet négatif sur le taux de rétention (82% contre 89%). Cette perte légère mais significative s’explique sans doute par la nature un peu plus complexe de la tâche demandée au répondant, qui demande un effort cognitif un peu plus important. L’effet global sur le taux de réponse est neutre dans notre expérience, 41,4% contre 40,5% et la différence n’est pas significative.
Taux de réponse et de rétention selon le protocole.
NON significativement différent du questionnaire en images fixes ou non illustré à p=0,05 (test exact de Fisher).
Significativement différent du questionnaire en images fixes ou non illustré à p<0,01 (test exact de Fisher).
Taux de remplissage et abondance des textes
Le taux de remplissage indique le pourcentage des questions effectivement documentées par rapport à l’ensemble des questions proposées (Ganassali et Moscarola, 2004). Dans notre expérience d’enquête en ligne, aucune réponse n’a été rendue obligatoire et chacun pouvait donc négliger sans contrainte toute question indésirable. L’abondance des textes se mesure via le nombre de mots cités par le répondant sur l’ensemble des questions ouvertes qui lui ont été proposées dans l’enquête (trois dans notre exemple, liées aux représentations de la consommation de chocolat). Sont bien sûr exclues de ce calcul, les questions dont l’affichage serait conditionnel et qui n’apparaitraient qu’en fonction d’une certaine réponse précédente (question filtre).
Le tableau 5 indique que le taux de remplissage est significativement plus élevé pour le questionnaire incluant un mur d’images (98,4% contre 92%). De même, l’effet sur la qualité des réponses aux questions ouvertes textuelles est notoire. La longueur des verbatim atteint 28,8 mots en moyenne pour les répondants ayant visualisé le mur d’images contre 22,8 mots pour les autres. Nous remarquons que le questionnaire incluant des images fixes enregistre des verbatim plus longs que le questionnaire non illustré, ce qui est cohérent avec des résultats antérieurement constatés (Ganassali, 2008). Logiquement, nous constatons enfin que les internautes consacrent plus de temps à répondre à l’enquête quand on leur soumet un MIEL.
Remplissage et qualité des verbatim selon le protocole.
Significativement différent du questionnaire en images fixes ou non illustré à p<0,05 (test exact de Fisher) – (**) significativement différent du questionnaire en images fixes ou non illustré à p<0,01 (test de Student).
Richesse d’évocation des verbatim
La richesse d’évocation des verbatim en tant que telle a été peu fréquemment mobilisée dans le passé pour mesurer la qualité des réponses (Ganassali, 2008). Elle est spécifique à la manière dont sont documentées les réponses aux questions ouvertes textuelles. Au-delà de la longueur des verbatim, il s’agit de vérifier si les répondants ont exprimé des réponses plus ou moins « riches » en contenu (Healey et al., 2005). Dans notre cas, nous avons mesuré la richesse d’évocation des réponses, en repérant et en dénombrant des mots-clés qui marquent le caractère expérientiel de la réponse, via les sensations, les émotions, les circonstances, ou les personnes évoquées par le répondant. L’analyse des verbatim peut se faire via une analyse de contenu au fur et à mesure de la lecture des réponses ou d’une manière plus systématique, via une analyse lexicale. Compte tenu du large volume de textes et de leur caractère relativement homogène, c’est cette deuxième méthode que nous avons retenue, comme dans d’autres recherches (voir Mossholder et al. 1995 par exemple) où les émotions ont été codées selon un protocole similaire. Le tableau 6 ci-après indique une centaine de mots-clés qui ont été identifiés par les chercheurs, pour repérer et coder une évocation riche de la consommation de chocolat sur l’ensemble des verbatim.
Liste des principaux mots-clés identifiés comme une évocation riche de la consommation de chocolat.
Un répondant ayant été soumis au protocole du mur d’images évoque en moyenne 2,32 mots-clés riches, contre seulement 1,75 pour les autres, et cette différence est statistiquement significative (voir tableau 5 ci-dessus). Ce résultat accrédite la thèse de la capacité immersive du mur d’images, évoquée en première partie de cet article, pour faciliter la profondeur et l’élaboration des contributions de la part des répondants.
Discussion et conclusion
Le MIEL permet d’enrichir le protocole de questionnement par une séquence relativement libre, ludique et impliquante, qui favorise une bonne immersion dans le thème étudié. La confrontation aux données quantitatives recueillies ensuite autorise une démarche de triangulation particulièrement intéressante (il s’agit ici d’une triangulation des données, selon la classification de Denzin, 1978). Situés à la croisée de plusieurs courants méthodologiques, les principes du MIEL coïncident bien avec les éléments constitutifs des approches mixtes et la méthode s’insère bien dans les classifications proposées (Bahl et Milne, 2006), comme une technique dite « intégrée », à mi-chemin entre les approches qualitatives et quantitatives. Ce protocole constitue ainsi une des modalités possibles de cette mixité méthodologique, qui pourrait nous inviter à une certaine réconciliation épistémologique. Via des allers retours entre observation, déduction, modélisation et explication, ce type d’approches vise à combiner les atouts de postures rivales comme le positivisme et le constructivisme (Avenier et Gavard-Perret, 2012). Le positivisme est présent quand le MIEL est utilisé en vue de valider ou rejeter les différences de représentations entre plusieurs profils de répondants par exemple. Le constructivisme est en œuvre quand il s’agit de découvrir progressivement les différents groupes possibles d’opinion ou de représentations sociales autour d’un thème, en observant les images choisies et en consultant les verbatim associés. La possible mise en œuvre de ces différentes analyses au sein de la même étude fait du MIEL un protocole résolument mixte. Ceci est particulièrement pertinent aujourd’hui, après les « tournants » postmoderne, culturel ou interprétatif, où selon (Stanczak, 2007: 8), « on ne considère plus vraiment la pure objectivité d’une recherche académique sans biais, et l’on acquiesce (ou même on attend) une réflexion subjective transparente dans de nombreux travaux ».
Le MIEL intègre en effet une part de subjectivité assumée dans le choix des images proposées et surtout dans la manière dont ces choix et leurs justifications seront interprétés. Il mobilise également une véritable objectivité dans le dénombrement des préférences, des fréquences de mots ou dans la correspondance – qui peut être statistiquement validée – des choix et des textes avec les réponses aux questions fermées. (Stanczak, 2007: 8) nous confirme que « comme la subjectivité et le réalisme interagissent dans l’espace entre l’image et celui qui la voit, la même chose se passe entre le producteur de l’image et son sujet ou son contenu ».
A cet égard, Koller et Sinitsa (2009) envisageaient le déploiement en ligne des méthodes qualitatives sur une large population, notamment pour mesurer et corréler des dimensions comportementales et plus psychologiques. D’une façon très schématique, le MIEL représente une version numérique des protocoles traditionnels qui recourent aux matériels graphiques, selon une démarche que certains appellent désormais l’anthropologie visuelle digitale (Pink, 2011). Ce nouveau procédé permet en outre de rendre ces dispositifs d’ordinaire très qualitatifs, plus systématiques et plus formalisés. Les données qui en sont issues sont plus structurées et permettent ainsi, en plus des interprétations sémantiques du matériau textuel et imagé, un traitement plus quantitatif, et par conséquent plus objectivé, voire plus confirmatoire. Le déploiement de ces anciens protocoles visuels sur le Web autorise enfin l’accès à des échantillons plus nombreux, fournissant des conclusions dotées d’une plus forte reproductibilité, comme le suggéraient Blascovich et al. (2002). A cet égard, nous pourrions qualifier le MIEL de méthode « post-positiviste » (Lincoln et Guba, 2000), car nous pouvons considérer qu’il aborde une réalité imparfaitement appréhendable, avec un objectivisme plus nuancé, tout en produisant des résultats que cette approche décrit comme « probablement vrais ».
En matière de mémorisation, selon la théorie du double codage, il est établi que le système verbal est activé quand des stimuli verbaux sont présents et domine pour des tâches qui requièrent des réponses verbales et plus rationnelles, tandis que le système non verbal est activé quand des stimuli non verbaux sont présents et domine pour des tâches qui requièrent des réponses non verbales, plus affectives (Paivio, 1971). Il a été démontré récemment (Herz et Diamantopoulos, 2013: 111) dans une étude mixte sur les associations liées au pays (Country-Specific associations) que les méthodes visuelles (le collage dans ce cas) étaient plus performantes pour capter les associations affectives autour de la consommation. Les auteurs soulignent que « l’adoption d’approches verbales et non verbales conjointes fournit des insights complémentaires au sujet des associations faites par les consommateurs autour des marques ».
A ce titre, le MIEL doit trouver toute sa pertinence dans des problématiques et des objets de recherche où la dimension affective est importante. Récemment, le recours aux images comme modalités d’expression des réactions émotionnelles a été discuté et validé par une recherche de Yoon et al. (2013). Ces auteurs utilisent les images pour faciliter la « granularité affective », c’est à dire une expression plus fine et plus profonde des réactions affectives. Derbaix et Pham (1989) proposent une typologie de l’affect en sept catégories: l’appréciation (la plus cognitive des réactions), l’attitude, la préférence, le tempérament, l’humeur, le sentiment et le choc (la plus affective des réactions). Nous pouvons alors considérer que des outils comme le MIEL vont être particulièrement pertinents pour capter les affects les plus intenses comme les humeurs, les sentiments ou même les expériences fortes, que les comptes rendus verbaux ne permettent pas toujours de bien appréhender (Derbaix et Pham, 1989). En marketing, de nombreux domaines s’intéressent à l’étude des affects « intenses » et parmi les champs les plus concernés, citons notamment le marketing des services, la publicité, les approches expérientielles, ainsi que la brand strategy.
Au-delà du positionnement méthodologique, nous souhaitions concrètement évaluer le dispositif du MIEL, dans ses conséquences sur le processus de réponse et sur la qualité des données récoltées. L’impact s’avère tout d’abord négatif sur le taux de rétention des participants à l’enquête. Comme dans d’autres protocoles interactifs et animés (Downes-Le Guin et al., 2012), les abandons en cours de saisie sont un peu plus nombreux que dans les questionnaires simples. Cela s’explique sans doute par l’effort cognitif (donc le temps) que le répondant doit consentir pour s’exprimer, qui est légèrement plus important. Dans un deuxième temps, nous constatons que pour ceux qui sont restés en ligne – et qui constituent une très large majorité (82% dans notre exemple) – la qualité des réponses s’avère bien meilleure. Le taux de remplissage, l’abondance des verbatim et leur richesse d’évocation présente des valeurs plus élevées. Tout se passe comme si ce type de protocoles plus impliquants avait tendance à introduire un léger « biais de sélection », en décourageant les répondants peu volontaires (Rogelberg et Stanton, 2007) et en stimulant les autres. Dans une certaine mesure, nous retrouvons les problèmes de représentativité liés aux populations constituées de « sujets volontaires » (Rosnow et Rosenthal, 1976), ce qui nous amène – par prudence – à déconseiller le protocole du MIEL pour les sondages, où la généralisation est une priorité absolue.
Mais dans de nombreux autres cas, dans les enquêtes en sciences sociales – et en marketing tout particulièrement – le chercheur ou le chargé d’études attend la participation active (voire même « productive ») des sujets qu’il sollicite. Il espère leur implication et leur engagement afin d’obtenir une largeur et une profondeur d’expression dans leurs « insights », utiles pour éclairer les décisions à venir. A cet égard, des protocoles mixtes comme le MIEL s’avèrent prometteurs en vue de stimuler l’abondance et la diversité des réponses. Ce type de dispositifs peut offrir aujourd’hui de nombreuses opportunités sur des problématiques de consommation expérientielle, de persuasion publicitaire, ou de capture et d’évaluation des valeurs émotionnelles (Albert, Merunka et Valette-Florence, 2008) ou symboliques de la marque par exemple ; en particulier dans certains domaines d’application comme le tourisme, les loisirs, la culture, le luxe, l’hygiène-beauté, où la verbalisation des attributs est parfois difficile.
Du point de vue managérial, la technique du MIEL constitue une modalité concrète du tandem « quali-quanti » dont les praticiens sont généralement convaincus (Bô, 2010). Elle présente un très bon rapport qualité/prix, en permettant de générer un volume important d’insights assez riches et objectivés, pour des coûts de mise en œuvre relativement restreints. Enfin, ce type de protocole visuel peut présenter une bonne qualité esthétique et véhiculer ainsi une image plus moderne et plus valorisante de l’organisation émettrice, ce qui n’est pas négligeable quand l’enquête s’adresse à des clients ou des collaborateurs.
Des variantes au MIEL peuvent être envisagées. Les chercheurs peuvent introduire encore plus de spontanéité dans l’expression des répondants, en les invitant comme pour l’AOL par exemple, à poster trois images de leur choix – repérées suite à une fouille sur le Web – dans un espace prévu du questionnaire en ligne, puis à exprimer leurs associations d’idées. S’il s’agit en revanche de renforcer la standardisation du protocole, il est aussi possible d’y adjoindre des échelles de profils expérientiels ou émotionnels, comme celui de Holbrook et Batra par exemple (1987) ou poursuivre le développement d’outils visuels plus normés comme l’Embodied Typology of Positive Emotions (Yoon et al., 2013).
A l’issue de cet article, nous avons montré que ces techniques visuelles mixtes avaient leur place au sein de l’ensemble des méthodes à disposition des chercheurs en marketing et des praticiens des études. Il est important de continuer les recherches pour tester et déployer ces instruments hybrides dans de nouveaux domaines d’application. Il sera utile par exemple de déterminer quelles catégories d’images permettent de produire des évocations plus riches. Sur ces dispositifs innovants, d’autres repères méthodologiques seront utiles, pour en faciliter une mise au point encore plus adaptée et plus efficace.
Footnotes
Acknowledgements
L’auteur tient à remercier la rédactrice-en-chef et les lecteurs anonymes pour la qualité de leurs conseils et de leurs suggestions lors du processus de révision. Il remercie également la société Sphinx pour le soutien technologique de cette recherche.
