Abstract
Entre l’outil et la méthode, entre le tutoriel et le manuel de méthodes, se trouve comme une case manquante : l’étude des usages concrets que les chercheur.e.s font des logiciels d’aide à l’analyse qualitative (CAQDAS). Les contributions réunies dans ce numéro proposent d’ouvrir cette boîte noire de l’analyse en revenant sur différents usages de ces outils dans le cadre d’enquêtes sur des objets aussi variés que la médecine légale, la dimension sexuée du traitement pénal, le comportement politique des électeurs états-unien, la place des intellectuels dans les partis ou l’impact de la crise et de l’européanisation sur les régions sociales-démocrates. Plutôt qu’une présentation des fonctionnalités offertes par ces logiciels, il s’agira de saisir les stratégies de codage déployées par les auteur.e.s et les traditions d’analyse dans lesquelles ils/elles s’inscrivent mais aussi les effets de ce type de logiciels sur les pratiques de recherche.
Introduction
La généralisation de l’informatique et la multiplication des données numériques ont contribué à diffuser l’usage de logiciels d’analyse en sciences humaines et sociales. Si l’analyse assistée par ordinateur a d’abord été développée parmi les tenants des méthodes quantitatives, les logiciels d’aide à l’analyse qualitative ont émergé à la fin des années 1980, d’abord dans le monde anglo-saxon puis plus tardivement dans l’espace francophone. Ils sont le plus souvent désignés par l’acronyme CAQDAS (Computer Assisted Qualitative Data Analysis Software) 1 . Cependant l’aide fournie peut être vue de différentes manières. On fait parfois l’erreur de croire que les CAQDAS constituent une méthode à part entière, au même titre que l’analyse conversationnelle par exemple. Dans la typologie qu’ils proposent, Denzin et Lincoln répertorient ainsi la « computer assisted analysis » comme « method of analysis » (Denzin et Lincoln, 2011 : 12, Table 1.1), commentant que « faced with large amounts of qualitative materials, the investigator seeks ways of managing and interpreting these documents, and here…computer-assisted models of analysis may be of use » (Denzin et Lincoln, 2011 : 14). Or, il s’agit là d’une confusion entre outils et méthodes largement répandue à propos des CAQDAS, comme le fait observer Nigel G. Fielding pour qui « it confuses a technical resource with an analytic approach. » (Fielding, 2000 : § 6). En effet, les CAQDAS ne sont pas « a distinct method or approach to analysis, that the software does not ‘do’ the analysis. On the contrary, a major function of the software is to help organise the analysis. In particular, it is a way of managing the data and the analytic thoughts that are created in the analysis. The software no more ‘does’ the analysis than the word processor I am using now writes this chapter for me. » (Gibbs, 2014 : 277). Les CAQDAS sont ainsi des outils susceptibles d’être mobilisés dans le cadre d’approches méthodologiques très différentes.
Les CAQDAS sont en effet des logiciels d’aide à l’analyse qualitative. Leur dénomination rappelle à juste titre qu’ils ne constituent qu’un appui technique à la recherche. C’est bel et bien le chercheur qui fait l’analyse. Parfois qualifiés pour cette raison de « muets » (Lejeune, 2017 : 206), ces logiciels se distinguent d’outils d’analyse automatique ou semi-automatique plus « bavards » à qui le/la chercheur.e peut déléguer tout ou partie des opérations d’analyse, à l’instar des logiciels de lexicométrie, des automates, des registres ou des dictionnaires 2 . S’il s’agit là de choses connues, c’est d’autant plus important de rappeler ce principe général que nombre de chercheur.e.s succombent au cours du processus de codage à la tentation illusoire de déléguer l’analyse au logiciel, allant au-devant de déceptions, de frustrations et d’impasses. Serviteurs muets, offrant ce que l’on peut faire à la main dans une certaine mesure, les CAQDAS n’en constituent pas moins des outils utiles.
Dans cette perspective, ce dossier propose précisément d’interroger les différents usages que les chercheur.e.s 3 font des CAQDAS pour analyser leurs matériaux empiriques, bref d’interroger la méthode à l’œuvre au cœur de l’outil. Il s’agit donc moins de présenter les principales fonctionnalités de différents logiciels que de saisir comment elles sont utilisées en fonction de la méthode, de la problématique ou de la spécificité du corpus. C’est pourquoi, ce dossier se veut résolument empirique et les contributions fondées sur des recherches de terrain. Ce dossier s’inscrit par ailleurs dans une démarche pluraliste, se voulant à sa mesure le reflet de la diversité des ancrages disciplinaires, nationaux et méthodologiques des chercheur.e.s et des outils existants. Les articles portent ainsi sur des objets aussi variés que la médecine légale, la dimension sexuée du traitement pénal, le comportement politique des électeurs ou encore les intellectuels et les idées politiques en milieu partisan.
Forte de cette diversité, l’étude des usages que les chercheur.e.s font des CAQDAS sera déclinée sous la forme de deux grandes questions symétriques : Comment les chercheur.e.s utilisent ces outils ? Qu’est-ce que ces outils font faire aux chercheur.e.s ?
Stratégies de codage et traditions d’analyse
Très concrètement, ces outils proposent une série de fonctionnalités d’aide à l’analyse telles que l’affectation de codes à des segments des matériaux, l’annotation via la création de commentaires ou de mémos, le regroupement des codes ancrés dans des catégories analytiques plus générales ou encore des outils de requête quali-quantitatifs permettant d’interroger le corpus sur la base des cooccurrences. Dans ce dossier, les auteur.e.s ont ouvert les portes de la cuisine méthodologique en donnant à voir les usages qu’ils/elles ont fait de ces fonctionnalités et tout particulièrement trois dimensions généralement peu abordées de la stratégie de codage : la manière dont les chercheur.e.s codent concrètement leur matériau, le moment où le codage survient dans la temporalité de la recherche et la manière dont le codage dépend du type de matériaux traité. On va voir que leurs façons de faire renvoient à des stratégies de codage diversifiées qui dépendent notamment des traditions d’analyse dans lesquelles ils/elles s’inscrivent.
De quoi le codage est-il le nom ?
Force est de constater en première instance la diversité des termes utilisés dans la littérature : « code », « thème », « rubrique », « étiquette », « nœud ». Cela renvoie sans doute à des différences de terminologie d’un logiciel à l’autre pour des raisons de distinction sur le marché des CAQDAS. Mais cette diversité lexicale constitue aussi un symptôme de la pluralité dans la manière de concevoir ce qu’est un code. Et l’étude des manières concrètes par lesquelles les utilisateur/rices des CAQDAS codent leur matériau confirme l’hétérogénéité des pratiques et conceptions. Il convient par conséquent de déplier ce signifiant flottant qu’est le terme codage pour en analyser les différentes dimensions : la place du codage dans la méthode, la nature des codes et la logique qui préside au codage.
En premier lieu, la place du codage dans la méthode diffère selon les traditions d’analyse. Le codage commence-t-il en amont de l’analyse au sens où la grille de codes est définie a priori, comme dans l’analyse thématique construite à partir de la littérature, quitte à être testée sur un échantillon du corpus dans une phase exploratoire, comme le suggèrent par exemple les tenants de la content analysis 4 ? Ou bien le codage est-il au contraire le moment même de l’analyse des données, selon les principes de la Grounded Theory (GT) (Glaser et Strauss, 1967 ; Strauss et Corbin, 1998) ou de l’approche de Miles et Huberman (Miles et al., 2013) ? La deuxième dimension constitutive de toute stratégie de codage concerne la nature des codes. Les codes sont-ils unidimensionnels, homogènes et exclusifs, dans une visée de classement thématique et/ou afin d’être statistiquement significatifs en vue d’une quantification qui nécessite un nombre limité de codes ? Sont-ils au contraire pluridimensionnels, hétérogènes et croisés, au moins pour la première phase de codage, ouvert, ce qui engendre un grand nombre de codes, qu’il s’agira par la suite de regrouper ? Enfin, la troisième dimension concerne la logique qui préside au codage. Ce dernier consiste-il en une indexation, c’est-à-dire l’identification des thèmes abordés ou les informations intéressantes dans un matériau ? Le code est dans ce cas une rubrique qui désigne, qui décrit ce dont parle l’enquêté.e (Paillé et Mucchielli, 2012). Ou bien le codage relève-t-il davantage de l’interprétation qui consiste à qualifier les représentations, le vécu, l’expérience de l’acteur ; le code est alors une étiquette qui analyse ce qu’il dit à ce sujet (Lejeune, 2014 : 63–64).
L’articulation de ces trois dimensions analytiques (résumées dans le tableau 1) va nous permettre de commenter la diversité des stratégies de codage mises en œuvre avec un CAQDAS, et notamment celle des contributions de ce dossier. Dans son enquête sur le raisonnement des électeurs états-uniens, Luis Vila-Henninger a d’abord établi un codebook à partir de la littérature scientifique qu’il a appliqué aux transcriptions des entretiens qu’il avait réalisés. Il a ensuite modifié, supprimé et ajouté un certain nombre de codes, selon le principe de reconstruction issu de l’Extended Case Method (ECM) de Michael Burawoy (Burawoy, 1998, 2009). La démarche hypothético-déductive de départ est donc par la suite contrebalancée par la modification du codebook initial pour intégrer des éléments non prévus par la littérature ou aller chercher d’autres explications et élargir ainsi les références théoriques, affiner certaines hypothèses et en invalider d’autres. L. Vila-Henninger a par ailleurs couplé ce codage qualitatif à une analyse de contenu plus quantitative, en recourant au query tool 5 d’Atlas.ti afin notamment d’opérer des croisements pour savoir quel enquêté mobilise plus tel type de raisonnement, en fonction de sa position sociale ou son appartenance politique.
Dimensions de la stratégie de codage
Dans son enquête de thèse sur les effets de genre dans le traitement pénal des affaires de stupéfiants, Kathia Barbier a d’abord effectué un premier codage par « thématiques » où elle a indexé les grands thèmes traités par les enquêtés, en rapport notamment avec sa grille d’entretien. Ce type de codage relève d’une analyse qualitative de contenu de type hypothético-déductive. Elle a ensuite procédé à un codage par « mots-clés » permettant d’affiner et de redécouper les thèmes : elle est ainsi passée progressivement d’une logique indexative à une logique plus interprétative et inductive, assistée par ailleurs de ses notes d’analyse. Elle a également créé des codes descriptifs, semblables à des variables, qui correspondent aux propriétés sociales des enquêté.e.s, et qu’elle a regroupés sous forme de « base de données qualitatives ». En cela, son approche se rapproche d’une analyse quali-quantitative de contenu.
Dans son enquête sur les médecins légistes et les expertises médico-légales qu’ils effectuent, R. Juston a opté, quant à lui, pour une stratégie de codage davantage inductive, plus directement inspirée par la GT. Il a ainsi créé de nombreux codes ouverts qu’il a par la suite regroupés sous des catégories plus générales, suivant en cela les trois types de codage préconisés par la GT (codages ouvert, axial et sélectif). Il a par ailleurs créé un grand nombre de mémos associés à des citations, codes ou documents.
Pour ma part, les deux réanalyses que j’ai menées – respectivement sur les revues et les intellectuels communistes et socialistes d’une part, et sur le positionnement des régions social-démocrates face à la crise économique et au processus de convergence européenne d’autre part – s’inspirent pour partie seulement de la GT. Cet ancrage méthodologique oriente la phase de codage ouvert selon une approche systématique, micro, inductive et, pour l’essentiel, interprétative. Cela s’accompagne de l’annotation systématique permettant de documenter chacune des phases d’analyse. La montée en généralité et la conceptualisation ont été effectuées par ailleurs selon une logique fondamentalement réticulaire, les catégories analytiques se construisant au fur et à mesure par mise en relation des codes ouverts. Cela n’exclut toutefois pas le recours contrôlé à certains outils quantitatifs implémentés dans Atlas.ti.
L’étude des usages concrets des CAQDAS donne ainsi à voir non seulement une diversité des pratiques de codage d’un.e. chercheur.e à l’autre mais aussi l’hybridation méthodologique dont ils/elles font preuve au sein de leur recherche. Ouvrir les coulisses de l’analyse permet ainsi d’observer les aller-retours, glissements, hybridations, bricolages qui correspondent à la science en train de se faire, loin des oppositions tranchées et parfois un peu forcées théoriquement entre démarches méthodologiques (hypothético-déductive versus inductive) ou traditions d’analyse (analyse de contenu, ECM, GT, etc.).
Temporalité de la recherche et stratégie de codage
Une autre dimension abordée dans ce dossier et définitoire de la stratégie de codage réside dans le moment où le codage survient dans la temporalité de la recherche. On peut analytiquement distinguer dans une recherche quatre activités : 1) la problématisation, instruite par la consultation de la littérature sur le ou les domaine(s) concerné(s) ; 2) la collecte du matériau empirique ; 3) l’analyse du matériau ; 4) la rédaction des résultats de l’analyse. Ces quatre activités peuvent s’organiser de manière séquentielle ou de manière parallèle (Lejeune, 2014 : 21–22). Dans le premier cas, elles se succèdent de manière linéaire. L. Vila-Henninger a ainsi procédé d’abord à la réalisation des entretiens, puis à leur transcription avant d’importer les matériaux dans un CAQDAS et d’effectuer le codage proprement dit. C’est également mon cas dans la mesure où j’ai utilisé des CAQDAS dans le cadre de réanalyses d’enquêtes qualitatives. Par conséquent, les entretiens avaient déjà été réalisés par les chercheur.e.s premier.e.s avant même le début de l’enquête seconde. L. Vila-Henninger a également procédé à la revue de la littérature avant l’enquête de terrain, suivant l’organisation séquentielle de la recherche selon les conseils souvent donnés aux doctorants par leurs superviseurs.
Dans l’organisation parallèle de la recherche, les quatre activités se superposent et s’influencent de manière circulaire. Dès le premier jour de son terrain, K. Barbier a ainsi importé dans Sonal – qu’elle avait déjà utilisé pour son master – les enregistrements de ses entretiens. Elle a même enregistré directement quelques-uns de ses entretiens depuis Sonal sur son ordinateur. Elle a ensuite effectué simultanément le découpage des bandes, l’attribution de thématique(s) aux extraits définis et la transcription intégrale des entretiens. R. Juston a également codé ses entretiens et créé des mémos conjointement à son travail de terrain ; il se réfère en ce point explicitement à la GT et indique par ailleurs les effets de cette organisation parallèle de sa recherche sur sa pratique (voir infra).
L’organisation séquentielle de la recherche est parfois érigée en bonne pratique prescrite aux étudiants. L’étude des pratiques effectives des chercheur.e.s montre néanmoins que le processus de recherche n’est en réalité jamais linéaire : « non seulement l’analyse débute avant que la collecte soit terminée, mais la question de recherche évolue aussi en cours de processus. Le chercheur est également amené à s’exprimer publiquement avant que l’analyse soit complétée. » (Lejeune, 2016 : 403) Pour cette raison, aux yeux des tenants de la GT, l’organisation séquentielle de la recherche constitue une démarche trop figée, susceptible de brider la production d’idées neuves et d’empêcher l’évolution de la stratégie adoptée sur le terrain. Entreprendre séparément la consultation de la littérature, puis la collecte, suivie de l’analyse, et enfin de l’écriture est jugé aussi artificiel qu’improductif (Lofland et Lofland, 1984 : 132). Toutefois, il convient de ne pas trop rationaliser le choix d’opter pour telle ou telle organisation de la recherche en ne l’interprétant que comme l’effet d’une prise de position épistémologique. Il renvoie aussi et surtout à des considérations pratiques dans le déroulement de l’enquête : manque de temps pour transcrire intégralement les matériaux, nécessité de présenter des résultats intermédiaires dans le cadre d’une thèse ou à l’occasion de la rédaction d’un article, etc. Surtout, ce dossier peut contribuer à éviter de tomber dans le discours prescriptif des « bonnes pratiques » en montrant aussi le coût d’une organisation parallèle de la recherche. Dans ce cadre, K. Barbier dit bien le caractère chronophage qu’a représenté pour elle le fait de transcrire ses entretiens avant de les analyser à l’occasion d’une précédente enquête. Toutefois, elle mentionne à l’inverse que le fait de coder dès les premiers entretiens l’a amené à devoir recoder par la suite en partie les premiers entretiens, ses catégories d’analyse ayant évolué (voir l’article de Barbier et Juston dans ce numéro).
Types de matériaux et stratégies de codage
La variété des usages des CAQDAS renvoie à la diversité des méthodes et de l’organisation temporelle de la recherche mais aussi à la diversité des matériaux. Les stratégies de codage dépendent également du type de matériaux que le.s chercheur.e.s analysent, c’est-à-dire à la fois la matérialité des modes (écrit, oral, multi-médias, web) dans lesquels ils s’inscrivent et du rapport qu’ils établissent entre eux (à travers l’alignement multimodal par exemple). Dans cette perspective, K. Barbier a procédé sous Sonal à un premier codage thématique des bandes audio de ses entretiens avant même leur transcription. Elle a ensuite procédé à une synchronisation des enregistrements et des transcriptions afin de constituer véritablement un corpus multimodal. J’ai procédé d’une manière analogue en créant des corpus audio-textuels concernant deux des trois enquêtes réanalysées afin de m’aider dans l’analyse de certains passages d’un matériau que je n’avais pas moi-même produit. L. Vila-Henninger et R. Juston ont, quant à eux, travaillé sur des corpus textuels.
On peut donc utiliser des CAQDAS pour traiter et analyser des matériaux différents. Mais l’intérêt des CAQDAS est qu’ils permettent d’analyser ensemble des matériaux de nature différente en permettant de meilleures gestion et navigation documentaires pour deux raisons. D’abord, les CAQDAS permettent la gestion de corpus (relativement) volumineux. Les fonctions de tri et de filtre et les outils de requête qu’offrent ces logiciels permettent de se retrouver dans une masse documentaire volumineuse et de ne travailler que sur une partie du corpus. Pour certains commentateurs, les CAQDAS favoriseraient une analyse de moins en moins approfondie de corpus de plus en plus grands, ne serait-ce que parce qu’elle est devenue possible (Gibbs, 2014 : 291). Toutefois, les données collectées par Fielding et Lee sur l’usage des CAQDAS par des chercheur.e.s britanniques invalident largement ces craintes : en moyenne, les corpus et les échantillons des projets qualitatifs n’ont pas augmenté (Fielding and Lee, 1996). Ma propre expérience de formateur auprès d’équipes de recherche a montré en outre que les CAQDAS fonctionnent parfois assez mal avec des corpus trop volumineux. Surtout, c’est moins la disponibilité des CAQDAS qui a conduit à l’analyse de grands corpus que le fait que les chercheurs qui traitent de grands corpus recourent à ce type de logiciels 6 .
Ensuite, les CAQDAS rendent la navigation dans le corpus beaucoup plus fluide en permettant d’une part, de constituer des corpus audio-textuels comme nous l’avons vu et, d’autre part, d’établir des liens transversaux entre les matériaux à travers différents objets comme les codes, les groupes de codes ou les mémos. Ces différents liens permettent par exemple de retrouver facilement le propos de tel enquêté lors de l’écriture d’un article, ou encore d’établir des parallèles surprenants entre des éléments dispersés dans la masse des documents, etc.
Ces fonctionnalités disponibles sont par la suite utilisées de manière différente et plus et moins poussée selon les chercheur.e.s. L. Vila-Henninger a ainsi importé essentiellement ses transcriptions d’entretiens dans Atlas.ti afin de les analyser. De son côté, R. Juston a intégré dans ses différents projets ses transcriptions d’entretiens et ses notes d’observation mais aussi d’autres documents d’enquête (documents à destination de son directeur, supports de communication ou projets d’articles, etc.). K. Barbier a, quant à elle, importé dans Sonal, en plus de ses matériaux, ses notes de lecture d’articles et ouvrages consultés dans le cadre de sa thèse. Enfin, j’ai pour ma part, importé dans Atlas.ti l’ensemble des documents produits par chaque chercheur.e premier.e et que j’avais pu collecter (matériaux, notes d’analyse, documentation préparatoire, travaux universitaires, publications, etc.), me permettant ainsi de reconstituer l’enquête d’un point de vue documentaire.
Cette première partie contribue à documenter la manière dont les chercheur.e.s utilisent les CAQDAS. Reste à inverser la question et à se demander non plus ce qu’ils/elles font de ces outils, mais ce que l’usage de ces outils fait à leurs pratiques de recherche.
Ce que l’outil fait aux modes d’analyse
Le second axe de ce dossier consiste à interroger ce que le logiciel fait aux usages ou, pour le dire autrement, dans quelle mesure l’outil oriente la méthode ? Comme le souligne Gibbs, « the use of technology is not neutral. Just as word processing has changed the way some people write, so CAQDAS has changed the way analysis is done and there is considerable debate about the extent to which the software has affected practice » (Gibbs, 2014 : 277). Dans cette perspective, deux types d’effets des CAQDAS sur les pratiques des chercheur.e.s peuvent être distingués : ceux qui concernent l’utilisation des CAQDAS en général et ceux qui renvoient à l’épistémologie embarquée spécifique à chacun d’eux.
Les effets de l’utilisation des CAQDAS sur la recherche
La littérature sur les effets supposés ou réels des CAQDAS est très largement focalisée sur l’analyse. Dans cette perspective, l’un des apports de ce dossier est de montrer que l’utilisation d’un CAQDAS a aussi des effets – potentiels et variables – sur la pratique du terrain. Dès le début de son enquête, K. Barbier a codé chaque transcription avec une série de thèmes correspondant aux propriétés socio-démographiques de l’enquêté.e (sexe, âge, fonction, service), constituant ainsi progressivement une base de données descriptives de sa population enquêtée. Or, comme elle l’écrit, cette base lui a permis par la suite de réorienter la sélection de ses enquêtés afin « d’éviter une trop forte homogénéité des profils d’enquêtés, souvent induite par le recrutement en ‘boule de neige’ […] employé sur le terrain » (Voir l’article de Barbier et Juston dans ce numéro). Il ne s’agit pas en soi d’un effet propre à l’outil puisque les chercheur.e.s faisaient des tableaux pour suivre l’échantillon en constitution bien avant l’arrivée de ces logiciels. Mais le fait de pouvoir le visualiser facilement et selon plusieurs modes (tabulaire, synthèse quantitative, etc.) facilite sans doute ce suivi. Dans le même ordre d’idées, R. Juston mentionne le risque que le/la chercheur.e habitué.e à ces logiciels anticipe ces codes dans les notes qu’il/elle prend : « Le chercheur se surprend ainsi à préformater ses documents pour faciliter le travail à venir sur le logiciel, ou à mener ses entretiens en anticipant la manière dont en seront thématisés les différents passages » (Voir l’article de Barbier et Juston dans ce numéro). L’analyse des données ayant été concomitante à leur collecte, selon une organisation parallèle de la recherche (voir supra), l’utilisation d’un CAQDAS a ainsi eu un effet sur la pratique de terrain des deux chercheure.s.
Un deuxième effet de l’utilisation d’un CAQDAS observé dans ce dossier est la découverte et l’adoption par les chercheur.e.s de méthodes d’analyse dont ils n’étaient pas familiers auparavant. Le fait que les contributeur/rice.s à ce dossier soient des jeunes chercheurs expliquent sans doute cela ; chaque nouvelle recherche nous amène à apprendre de nouvelles manières de faire enquête, quel que soit l’outil. Mais le choix de celui-ci joue dans l’orientation du type de méthodes découvertes. L’utilisation d’Atlas.ti a ainsi amené le chercheur qualitativiste formé à la socio-histoire politique que j’étais à m’inspirer davantage de la GT par l’effet notamment de lectures sur les CAQDAS et de formations à l’usage de ceux-ci. Tout comme le fait de l’utiliser dans le cadre d’enquêtes collectives m’a amené à recourir à certaines fonctionnalités quantitatives. Il s’agit donc d’un effet de l’outil sur la méthode, non pas directement à travers ses fonctionnalités ou son ergonomie, mais à l’occasion du processus d’apprentissage du logiciel ou de son utilisation au sein d’une équipe de recherche.
Un troisième effet de l’utilisation des CAQDAS porte sur la temporalité de la recherche. Par leurs fonctionnalités, ces outils peuvent sembler faire gagner du temps en contribuant à la collecte d’une partie des matériaux, à l’organisation du corpus, en évitant les allers-retours entre les différents documents (de la transcription à la note d’analyse par exemple). Tous les contributeurs insistent sur ce point. Toutefois – et ils sont également unanimes à le dire – l’utilisation de ces outils représente également un coût temporel important : Par le temps nécessaire à l’apprentissage et l’appropriation de l’outil (Basit, 2003 : 152) ; En favorisant le micro-codage au plus près du matériau ; En amenant le chercheur à davantage documenter son analyse, en systématisant l’annotation
7
; En incitant le/la chercheur.e à faire ce qu’il/elle ne pouvait faire manuellement comme l’exploration de son corpus par les fonctions recherche ou les outils de requête.
En ce sens, les CAQDAS ne produisent pas en soi des recherches plus rapides ou plus lentes mais ils modifient sans aucun doute le temps consacré respectivement à chaque opération de recherche et ainsi l’économie temporelle générale de l’enquête. Les CAQDAS peuvent favoriser chez les chercheur.e.s au profil inductiviste une tendance plus forte au micro-coding 8 et une systématisation de l’annotation et de la documentation de chacune des phases d’analyse. Si cet effet peut être bénéfique et améliorer l’analyse, il peut aussi parfois aboutir à une forme de « coding fetishism » (Marshall, 2002 : 60) ou « codomanie » (Lejeune, 2014 : 82) ; ils finissent au cours du codage du matériau par trouver tout intéressant, perdant de vue leurs questions de recherche et codant à l’infini.
Quatrième effet : l’usage de CAQDAS peut potentiellement amener le chercheur à modifier le mode (écrit, oral, iconographique) par lequel il appréhende les matériaux et en particulier, à sortir de la prééminence accordée au texte dans l’analyse. En permettant la création de corpus multi-modaux, mon usage de Sonal et d’Atlas.ti m’a ainsi amené à revenir davantage aux sources orales et à ne plus effectuer l’analyse qu’à partir des seuls textes. Tout comme Atlas.ti m’a amené à analyser différemment en recourant massivement à des formes de visualisation des codes comme les network views.
Le cinquième effet de l’usage des CAQDAS est ambivalent. Ces outils permettent des analyses reposant de manière stricte sur le matériau, offrant ainsi une vraie plus-value scientifique à la fois en termes de rigueur et de transparence. Toutefois, comme le notent K. Barbier et R. Juston, le prix à payer en retour peut être une certaine « frilosité à proposer des hypothèses imparfaitement étayées » (voir l’article de Barbier et Juston dans ce numéro). Si le codage peut toujours être révisé de manière rétroactive, cela demande en effet du temps et de l’énergie, si bien que le/la chercheur.e aura tendance à garder sa grille de codes existants : « Ce sentier de dépendance jalonné par les codes existants ne favorise donc pas nécessairement l’inventivité du sociologue. […] Avec ces logiciels, on n’oublie rien, mais peut-être explore-t-on moins, du fait du confort des codes existants » (Barbier et Juston, ce numéro).
Le sixième et dernier effet lorsqu’on recourt à un CAQDAS est le risque potentiel d’essentialisation des codes. De nombreuses critiques portent sur la décontextualisation des matériaux que porteraient en germe les CAQDAS (Paulus et al., 2017 : 2). Toutefois, il convient de déconstruire ce qu’on entend par « décontextualisation ». Dans le sens d’extraction des matériaux et d’abstraction progressive des codes, la décontextualisation n’est pas un « risque », mais une réalité. Elle est même ce qui fonde l’intérêt des CAQDAS. Ces outils permettent en effet de gérer des corpus volumineux et hétérogènes et de produire un codage systématique et fin précisément parce qu’ils offrent des fonctionnalités permettant de ne pas être noyé.e dans les matériaux, de ne sélectionner les matériaux que sous un certains aspect sans devoir gérer l’ensemble des informations qui leur sont associées. Dans un premier temps, le codage consiste à décontextualiser le segment auquel il est associé, c’est-à-dire à le sortir de son contexte afin de le rendre sémantiquement indépendant (extraction) ; ce faisant, il est déjà recontextualisé une première fois puisqu’il est ainsi mis en relation avec les autres segments associés au même code. La seconde phase de codage consiste à poursuivre la recontextualisation en établissant des liens entre les codes et donc en même temps, entre les segments associés à tous ces codes. Très concrètement, sous Atlas.ti par exemple, cela implique de ne plus avoir la transcription sous les yeux mais de travailler depuis le code manager – autrement dit, la fonctionnalité de gestion des codes – ou le query tool. Il y a donc bien décontextualisation vis-à-vis de l’unité documentaire originale : on ne travaille plus que sur des codes de plus en plus abstraits et sur des extraits. De même, le fait qu’un même code ou mémo soit attribué à des segments issus de différents documents permet d’établir des hyperliens transversaux entre eux sous un certain angle. Lorsque l’utilisateur/rice récupère les extraits associés à cet objet, ils sont de fait décontextualisés (au sens d’extraits) du document dont ils sont issus respectivement. En ce sens d’extraction/abstraction, il y a bien décontextualisation. Toutefois, cela n’est pas propre aux CAQDAS et vaut pour beaucoup d’analyses manuelles, en tous cas en sciences sociales. Ne pas décontextualiser, c’est se condamner à la myopie, à rester le nez rivé sur les matériaux sans s’autoriser ce saut interprétatif par lequel on établit des liens, on sélectionne, on trie, on coupe, qui facilitent la montée en généralité. Par ailleurs, les CAQDAS permettent de revenir toujours, si nécessaire, aux matériaux. Le risque potentiel est sans doute moins la décontextualisation des matériaux que l’essentialisation des codes, sous l’effet notamment de leur représentation visuelle (qui apparaissent comme des objets extérieurs ayant leur vie propre) et de leur quantification possible.
Tous ces effets induits par le recours à un CAQDAS n’ont rien d’automatiques. Ce n’est pas l’outil qui « fait faire » mais la rencontre entre lui et un certain profil de codeur/euse, lié à l’ancrage disciplinaire, méthodologique et théorique de l’utilisateur/rice. C’est là tout l’intérêt de passer du discours de la méthode généraliste à l’étude des usages concrets. Cela étant dit, les effets abordés ici sont communs à l’ensemble des CAQDAS. Reste donc à saisir les effets spécifiques à certains d’entre eux.
L’épistémologie embarquée des différents CAQDAS
Les CAQDAS forment une famille de logiciels qui n’ont pas tout à fait la même épistémologie embarquée (Demazière et al., 2006 : 178) 9 . On entend par là une certaine conception de la recherche et de l’analyse qui oriente la conception du logiciel et se traduit par une série de choix techniques (algorithmes implémentés, fonctionnalités, ergonomie et interface visuelle) et une terminologie. Les outils informatiques ne constituent pas simplement de nouveaux moyens de produire du savoir. Ils produisent dans le même temps une certaine définition du savoir (Gillespie, 2014 : 167 ; Manovich, 2013 : 338), voire de ce qu’est la réalité (Hayles, 2012 : 60). À cet égard, une réflexion sur le développement des CAQDAS en SHS ne saurait faire l’économie de ce que l’importation du langage et de l’« imaginaire du code » fait à ces dernières, plus encore dans un contexte de renforcement des humanités numériques (Broca, 2016). Les fonctionnalités offertes par les logiciels abordés par les différents papiers, leur ergonomie et leur terminologie propres montrent qu’ils ont été pensés pour favoriser certains usages et qu’ils en rendent d’autres plus difficiles. Je relève pour ma part cinq effets de l’épistémologie embarquée de ces logiciels, dont la présentation successive suit en quelque sorte le parcours de l’utilisateur, depuis sa découverte de l’interface et du vocabulaire propres à l’outil jusqu’à la structuration de sa grille de codes, en passant par la gestion de ses matériaux, le codage ouvert et l’usage des outils de requêtes statistiques 10 .
En premier lieu, la terminologie de chaque logiciel révèle pour partie l’ancrage épistémologique d’origine de celui-ci. « Grille thématique » ou « Base de données qualitative » dans Sonal, la distinction « Memos » et « Comments » dans Atlas.ti, etc. ces termes ont une connotation méthodologique. Or, le choix d’un terme plutôt qu’un autre n’est potentiellement pas sans effets sur la manière dont l’utilisateur/rice va penser l’usage qu’il peut en faire. Parler de « grille thématique », c’est déjà renvoyer l’utilisateur à une analyse de contenu de type thématique. Distinguer commentaires et mémos, c’est suggérer une forme d’annotation inspirée de la GT.
Deuxièmement, il est parfois reproché aux CAQDAS d’induire un risque de décontextualisation des matériaux (Paulus et al., 2017 : 2). Ce risque n’est pas absent comme je l’ai mentionné plus haut. Toutefois, les CAQDAS les plus performants en matière de multimodalité contribuent à l’inverse à mieux contextualiser des matériaux. On constate souvent en sciences sociales un décalage entre un discours valorisant les sources orales, mettant en avant l’importance de l’entretien comme interaction et interlocution, et le fait qu’en pratique, les chercheur.e.s ne travaillent pour l’essentiel plus que sur les textes, une fois la transcription effectuée. Les CAQDAS peuvent permettre d’aller ainsi à l’encontre de la tendance des sciences sociales à se limiter à l’analyse de textes, en permettant la constitution de véritables corpus audio-textuels, même si leur usage en ce sens semble encore assez rare. De même, en permettant l’import des données web (et c’est sans doute là une des pistes de leurs développements futurs), ils permettent d’étudier les matériaux web non plus seulement sous forme statique, textuelle et au regard de leur contenu mais co-construits sur plusieurs sites, de manière dynamique et saisis dans leur environnement socio-technique.
Troisièmement, l’épistémologie embarquée a pour effet de rendre le micro-coding plus ou moins aisé selon le logiciel. À titre d’exemple, sous NVivo, l’ergonomie visuelle de la fenêtre latérale droite, où sont présentés les codes, limite le codage intensif d’une même citation par un grand nombre de codes ou encore le chevauchement de citations et des codes associés, les rendant difficilement lisibles. Il s’agit là d’un effet direct du fait que ce logiciel a été pensé pour réaliser un codage avec un nombre limité de codes ouverts. Le micro-coding est également limité dans Sonal dans la mesure où, s’il est possible d’associer plusieurs codes (« thèmes » et « mots-clés » dans la terminologie Sonal) à un même segment de la bande-son, le chevauchement d’extraits n’est pas possible. Cela renvoie au fait que le codage dans Sonal se rapproche en partie du chapitrage audio et que le logiciel n’a pas été conçu à l’origine comme un CAQDAS mais plutôt comme un outil d’aide à la transcription. À l’inverse, Atlas.ti, qui est sans doute le logiciel le plus directement inspiré des principes de la GT (LaRossa, 2005 ; Seale et al., 2004), s’avère tout à fait adéquat pour un codage ouvert intensif.
Quatrièmement, l’épistémologie embarquée a des effets directs sur la gamme des outils quantitatifs offerts par les différents logiciels. À cet égard, les capacités de calcul, d’export ou de visualisation des données sont particulièrement développées dans NVivo et font de ce CAQDAS le plus proche des méthodes quantitatives (Roy et Garon, 2013 : 166). De même, la formation quantitative du concepteur de Sonal fait de ce CAQDAS un outil d’analyse mixte, complétant le système de codage (« thèmes » et « mots-clés ») par une série d’outils quantitatifs comme la lexicométrie, la chronométrie ou la constitution d’une base de données qualitatives appréhendant les codes comme des variables. À l’inverse, le query tool dans Atlas.ti met très peu en avant les résultats chiffrés d’une requête, qu’il faut aller chercher tout en bas à gauche de l’interface. Le codage étant conçu comme le moment de l’analyse, la quantification des codes a une fonction essentiellement exploratoire et ne saurait constituer une forme d’objectivation des données.
Cinquièmement, les CAQDAS présentent des modes de structuration des codes très différents. La démarche hypothético-déductive procède d’une logique arborescente dans laquelle un code est indexé dans une catégorie plus générale. Dans cette perspective, MaxQDA et NVivo proposent une structuration des codes en arborescence, respectivement selon une « hiérarchie fonctionnelle » et une « hiérarchie organisationnelle » (Lewins et Silver, 2014 : 93). MaxQDA a une « hiérarchie fonctionnelle » dans laquelle les codes sont organisés en codes de niveau supérieur, sous-codes et sous-sous-codes. L’activation d’un code de niveau supérieur (par exemple pour une extraction) active automatiquement tous ses sous-codes. NVivo propose, quant à lui, une « hiérarchie organisationnelle » de codes ; les codes sont organisés en une arborescence mais il n’y a pas d’activation automatique des données codées par ses sous-codes lors d’une extraction. Dans une approche inductive, la montée en généralité, de la micro-analyse à quelques concepts centraux, passe par l’établissement de liens entre les catégories, ce qui correspond au codage axial dans la terminologie de la GT. Il s’agit là d’une logique fondamentalement réticulaire. Un même code peut ainsi être relié à différents codes sans relever d’une catégorie plus générale commune. Dans ces approches, la fonctionnalité network est très utilisée (voir par exemple Bandeira De Mello et Garreau, 2011). Il est significatif qu’Atlas.ti ne propose pas de hiérarchie de codes. Cela ne signifie pas qu’il soit impossible de le faire mais implique soit de recourir à des intitulés de codes standardisés ou à des codes tree (Friese, 2013) qui imitent un arrangement hiérarchique (d’où l’appellation de « hiérarchie cosmétique » par Lewins et Silver), soit de les réunir en groupes de codes 11 . Le choix du mode de structuration de codes n’est pas sans effets sur l’analyse. Une arborescence hiérarchique incitant à la création de catégories exclusives les unes des autres, elle favorise les analyses de contenu de type thématique et implique sinon un codage a priori, a minima que le/la chercheur.e ait une idée assez claire de ce qu’il/elle recherche dès le début. Une structuration réticulaire des codes favorise en revanche une analyse inductive en amenant le/la chercheur.e à spécifier progressivement la nature des relations entre les codes ouverts.
Ces cinq effets – sur la terminologie, la gestion de corpus multimodaux, le codage ouvert, les requêtes dans le corpus et la structuration des codes – montrent bien que contrairement à l’affichage promotionnel qui est fait parfois sur les sites des logiciels propriétaires et payants, selon lequel ces outils seraient adaptés à toutes les méthodes d’analyse, tous n’ont pas la même épistémologie et tous ne font pas la même chose. Pour autant, l’étude de la manière dont les chercheur.e.s se saisissent de ces outils montre que si les outils orientent les usages, ce n’est pas sur le mode du déterminisme technique. Ils rendent plus difficiles et plus coûteuses certaines opérations et en facilitent au contraire d’autres. Les CAQDAS ne sont pas neutres et ont des effets. Le fait qu’ils aient des épistémologies embarquées n’est pas un problème en soi ; il ne l’est que lorsque le chercheur n’en a pas conscience, la réflexivité s’arrêtant à la porte de l’instrument. Par ailleurs, cela n’empêche pas une réelle pluralité des formes d’appropriations de ces outils par les utilisateur/rices.
Des effets, pas des déterminations
Pour certains auteurs, les CAQDAS s’inscrivent dans une certaine conception théorique, si bien que leur utilisation imposerait certaines stratégies analytiques (Coffey et al., 1996 ; Lonkila, 1995). Le premier postulat est sans doute discutable dans la mesure où, comme nous venons de le voir, la référence commune à la GT masque en réalité des épistémologies embarquées sensiblement différentes. Toutefois, j’aimerai m’attarder ici sur la discussion du second postulat qui mérite à mon sens d’être largement nuancé. Ces critiques ont été formulées lors de l’émergence des premières versions des CAQDAS. Près de vingt ans après, nous disposons désormais de davantage de recul sur les usages et les effets de ces outils sur les pratiques de recherche. Dans cette perspective, l’étude des usages au cœur de ce dossier montre que l’épistémologie embarquée d’un logiciel ne détermine pas mécaniquement l’usage du logiciel et ce pour plusieurs raisons 12 .
En premier lieu, les CAQDAS se sont développés dans un contexte essentiellement anglo-saxon et d’Europe du Nord, en référence à la GT. Celle-ci s’est imposée progressivement comme référence théorique centrale au cours des premières conférences internationales de l’Université du Surrey, de l’Université du Colorado à Breckenbridge (1990) et de Brême (1992) qui ont présidé au lancement puis au développement de cette famille de logiciels (Lonkila, 1995). Toutefois cette référence cache en réalité une pluralité d’appropriations de la GT qui renvoie au fait qu’elle ne constitue pas une théorie aussi homogène que ce que l’on peut lire. Cela est dû notamment au fait que la GT a connu de véritables inflexions méthodologiques sous la plume de ses concepteurs eux-mêmes ; on constate ainsi un écart entre ses premiers développements à l’occasion de la publication par Barney G. Glaser et Anselm L. Strauss de The Discovery of Grounded Theory en 1967 et les reformulations concurrentes dont elle a fait l’objet ultérieurement. Par ailleurs, la GT a connu un véritable succès et une large diffusion dans l’espace académique anglophone, au point de devenir un label renvoyant à des approches analytiques différentes (Kenny and Fourie, 2014). Enfin, la référence à la GT occulte un aspect non négligeable : Glaser et Strauss n’avaient pas imaginé l’émergence des décennies plus tard d’outils qu’ils n’ont donc jamais utilisés eux-mêmes pour leurs propres enquêtes. Toutes ces raisons font que derrière la référence commune à la GT se cache ainsi une hétérogénéité sémantique qui en fait une véritable auberge espagnole à laquelle des chercheur.e.s aux usages méthodologiques très variés peuvent se référer.
Deuxièmement, les logiciels n’ont en réalité (presque) plus d’épistémologie embarquée car les outils aussi ont une histoire et connaissent lors de son cours toute une série d’inflexions à la fois techniques et méthodologiques. D’une part, certains d’entre eux sont hybrides dès le début, comme Sonal développé comme logiciel de transcription et de codage qualitatif mais par un chercheur issu de la démarche quantitative (Alber, 2018), ce qui se retrouve dans certaines fonctionnalités (tri croisé, lexicométrie, chronométrie). D’autre part, les CAQDAS les plus connus (Atlas.ti, NVivo et MaxQDA) sont des logiciels propriétaires et payants sur un marché très concurrentiel. Pour cette raison, ils tendent à intégrer de plus en plus de fonctionnalités afin de correspondre à des demandes très variées de la part de leurs utilisateurs. Si bien que leur ancrage dans la GT a été hybridé avec des fonctionnalités renvoyant davantage à d’autres approches qualitatives ou aux approches quantitatives. Dans cette perspective, une classification des CAQDAS a été proposée qui distingue ceux qui seraient plus adéquats pour faire de l’« analyse inter-cas » (ou « inter-sites) » – Atlas.ti, HyperResearch et Weft QDA – et ceux qui seraient plus appropriés pour l’« analyse intra-cas » comme QDA Miner, MaxQDA et NVivo (Huberman et Miles, 1994) 13 . Or, comme le relèvent Normand Roy et Roselyne Garon et pour les raisons notamment commerciales mentionnées précédemment, ces classifications sont sans doute « de moins en moins pertinentes considérant les nouvelles options des logiciels. » (Roy et Garon, 2013 : 167). Dans la même veine, les CAQDAS les plus performants permettent désormais l’intégration de corpus multimodaux issus du web qui le font s’éloigner de la seule GT pour l’hybrider avec des formes d’analyses qualitatives du discours, comme l’étude des « techno-discours » (Paveau, 2013) et de l’interface humains-machines (Manovich, 2001) 14 .
Troisièmement, parce que ce sont des logiciels d’aide à l’analyse qualitative, ils laissent beaucoup de place aux chercheurs, ce qui étend considérablement les possibilités d’usages. En se centrant sur les usages concrets qu’en font les chercheur.e.s, le dossier met au jour des usages de logiciels pas forcément prévus à l’origine par leur(s) concepteur(s). Certains chercheurs utilisent ainsi un CAQDAS sans créer le moindre code ; ils s’en servent « simplement » comme logiciel d’annotation avec le recours quasi-exclusif aux mémos 15 . De même, R. Juston a choisi progressivement de créer un projet dans Atlas.ti par chapitre de thèse, usage qui va à l’encontre de l’idée initiale qu’un CAQDAS permet de centraliser en un seul projet tous les documents de l’enquête.
Le troisième cas de figure est le détournement épistémologique. Une majorité de CAQDAS a été conçu à l’origine en s’inspirant largement de la GT, bien que selon des modalités et des proximités variables comme on a pu le voir plus haut. L’un des principes fondamentaux de celle-ci est l’élaboration continue et progressive de catégories d’analyse que l’on regroupe par la suite en catégories plus théoriques. Or, une grande partie des recherches conduites avec des CAQDAS consiste au contraire en l’application d’une grille d’analyse pré-existante, qu’il s’agisse d’une grille thématique calquée par exemple sur la grille d’entretien ou d’un codebook construit à partir de la littérature existante. Il s’agit donc d’un détournement des CAQDAS de leur ancrage épistémologique original, lié à l’évolution commerciale des versions successives des CAQDAS mentionné précédemment. À cet égard, l’un des grands intérêts de l’article de L. Vila-Henninger réside précisément dans ce « détournement » d’Atlas.ti : il recourt ainsi au logiciel qui est sans doute le plus proche de la GT pour entreprendre une analyse qualitative issue d’une autre approche méthodologique, qu’est l’Extended Case Method, couplée à une analyse de contenu plus quantitative.
Cette multiplication des usages s’explique en outre par le fait que la plupart des CAQDAS les plus performants et les plus diffusés sont payants (et relativement chers). Par conséquent, nombre de chercheur.e.s utilisent le logiciel disponible localement plutôt que celui qui correspond le mieux à leur ancrage méthodologique et théorique.
Pour toutes ces raisons, même si les CAQDAS ont des épistémologies embarquées, ils n’imposent pas au chercheur une méthode. Paradoxalement, la souplesse de ces outils est d’ailleurs en partie problématique. Autorisant de multiples pratiques et une évolution du codage, on ne sait pas toujours très bien le statut épistémique et méthodologique des codes créés par le.s chercheur.e.s. Si bien que si le.s chercheur.e.s ne documentent pas finement et de manière systématique leur codage, on ne voit pas les recodages discrets, changements de pied méthodologiques, les hybridations sauvages, etc. En ce sens, la souplesse des CAQDAS peut être un piège pour certains codeurs et une difficulté pour comprendre les manières de faire des collègues 16 .
Conclusion
Entre l’outil et la méthode, il y a une médiation trop souvent éludée, comme une case manquante : l’usage. Entre le manuel de méthode assez généraliste, où l’analyse est traitée souvent à partir de parti-pris épistémologiques très généraux, et le manuel d’utilisation de tel ou tel logiciel, manquent encore des ressources articulant véritablement technique et méthodologie, logiciels et traditions d’analyse. Ce dossier se propose de contribuer à combler ce double manque en donnant à voir les différents enjeux et manières de faire des chercheur.e.s et ingénieur.e.s utilisant ces outils.
La première partie a permis d’esquisser quelques lignes transversales et comparaisons entre les différentes contributions concernant la stratégie de codage effectivement utilisée par les auteur.e.s (renvoyant à la place du codage, la nature des codes et la logique de codage), le moment où le codage survient dans la temporalité de leur recherche et sur quel type de matériaux il a été effectué. Elle révèle en l’occurrence non seulement une réelle diversité des approches et des traditions d’analyse entre les auteur.e.s mais bien souvent une hybridation de celles-ci au sein d’une seule et même recherche. Les papiers révèlent également l’importance du moment où le recours à un CAQDAS est effectué dans la temporalité de la recherche et ses effets aussi bien sur l’analyse que sur la pratique du terrain. La variété des usages s’explique en outre par la diversité des types de matériaux que les chercheur.e.s analysent ou qu’ils considèrent pertinents d’importer dans ces logiciels. La comparaison des contributions montre que décidément les CAQDAS ne sont bien que des outils qui font l’objet d’investissements méthodologiques fort différents.
La seconde partie, quant à elle, s’est attachée à prendre au sérieux la question des effets de l’utilisation d’un CAQDAS sur les pratiques de la recherche. Il s’est agi de refuser la fausse alternative entre ceux qui considèrent que ces outils imposent une certaine méthode à leur utilisateur/rice et celles pour qui ce sont des outils neutres. Les différentes contributions ont permis de dégager des effets potentiels de l’utilisation des CAQDAS sur la recherche : effets sur la pratique du terrain, découverte de nouvelles méthodes associées à ces outils, transformation du temps respectif consacré à chaque étape de l’analyse, appréhension des matériaux au-delà des seuls textes, une certaine dépendance au codage déjà réalisé et décontextualisation des matériaux. On a également traité des effets plus spécifiques de tel ou tel CAQDAS en rapport avec son épistémologie embarquée, effets relatifs à la terminologie, la gestion de corpus multimodaux, le codage ouvert, les requêtes dans le corpus et la structuration des codes. Toutefois, les effets ne sont pas des déterminations mécaniques. Les appropriations contraires et multiples de la GT, la diversification des fonctionnalités des logiciels ou encore la souplesse de ces derniers – rendant possible toute une série d’usages sous-déterminés, imprévus, voire de détournements – sont autant de facteurs atténuant les effets de l’outil sur la méthode, ce qui est à la fois une liberté pour les chercheur.e.s et une source potentielle de difficultés et de biais.
Ce dossier se veut une contribution à une analyse réflexive plus large de la science en train de se faire, « par le bas », en s’intéressant à la fois aux manières de faire concrètes des chercheur.e.s dans leur analyse et à la manière dont ils se saisissent d’instruments, de techniques, d’outils comme les CAQDAS. Ce dossier appelle d’ailleurs à une multiplication des types d’usages observés. Dans cette perspective, quelques pistes peuvent d’ores et déjà être mentionnés ici, comme par exemple l’usage des CAQDAS dans le cadre de projets collectifs, pour l’analyse de documents d’archives ; le recours aux fonctions de recherche automatique en analyse du discours ; ou encore l’articulation de leur utilisation avec d’autres outils d’analyse plus quantitatifs comme les logiciels d’analyse de réseaux ou d’analyse factorielle, selon une méthodologie mixte.
J’aimerais conclure enfin en soulignant qu’ouvrir la boîte noire de l’analyse n’est pas sans risques. Outre le caractère chronophage qu’implique le fait de documenter l’analyse, les évolutions que connaissent le champ académique sont telles qu’il n’est pas forcément dans l’intérêt d’un.e chercheur.e de trop s’exposer en mettant à disposition la manière dont il/elle s’y est pris pour produire et interpréter ses résultats. L’individualisation de la carrière académique, qui accroît un peu plus encore l’importance de la réputation et de la crédibilité dans l’avancement, la précarisation d’une partie importante du personnel de l’enseignement supérieur et la pression croissante de l’évaluation et des injonctions à la rentabilité de l’investissement dans la recherche font qu’ouvrir la boîte noire de l’analyse a un coût. Ce qui, au plan collectif, est une condition pourtant nécessaire de la controverse scientifique étayée et de la cumulativité du savoir est ainsi extrêmement risqué au plan individuel. Les contributions qui suivent n’en ont que plus d’intérêt.
Footnotes
Déclaration de conflit d’intérêts
L’auteur déclare n’avoir aucun conflit d’intérêt potentiel pour tout ce qui concerne le déroulement de la recherche, les droits d’auteur et/ou la publication de cet article.
Financement
L’auteur n’a bénéficié d’aucun soutien financier particulier relatif au déroulement de la recherche, à ses droits d’auteur et/ou à la publication de cet article.
Remerciements
Je tiens à remercier Sophie Duchesne et Viviane Le Hay pour la confiance qu’elles m’ont accordée en me proposant de coordonner ce dossier ainsi que Mathieu Brugidou pour ses nombreuses relectures des différentes contributions. Merci également aux auteur.e.s qui ont accepté de jouer le jeu et d’ouvrir la boîte noire qu’est souvent l’analyse en donnant à voir leurs pratiques de codage.
