Abstract
Cet article se propose d’interroger les liens entre analyse secondaire et utilisation de CAQDAS sur la base de deux réanalyses d’enquêtes qualitatives effectuées à l’aide du logiciel Atlas.ti (et, de manière complémentaire, Sonal). Sera traitée ainsi la manière dont ces logiciels ont été utilisés dans ce contexte pour la construction et la gestion du corpus, le codage ouvert, l’annotation, la conceptualisation ainsi que l’usage d’outils quantitatifs sur des matériaux qualitatifs. Il s’agira pour chacune de ces activités de saisir de manière réflexive à la fois les effets de la réanalyse sur l’usage de ces outils, les apports des CAQDAS à la réanalyse, et la méthode d’analyse qui a informée l’usage de telles ou telles de leurs fonctionnalités
Introduction
La recherche qualitative en sciences sociales a connu de profondes mutations et innovations, parmi lesquelles ce double processus entamé depuis les années 1990. D’une part, l’analyse secondaire des enquêtes qualitatives en sciences sociales s’est développée sur cette période de façon significative, au Royaume-Uni et en Europe (Corti et Thompson, 2004 ; Heaton, 2004 ; Duchesne, 2017). Parallèlement, si les premiers programmes ont vu le jour dès les années 1980, le véritable essor des CAQDAS commence à partir des années 1990 (Tesch, 1990 ; Fielding and Lee, 1991). Ces deux processus ont connu un développement autonome, pourtant il existe « a real affinity between the tool – qualitative software – and the technique – secondary analysis » (Fielding, 2000 : §42). D’un point de vue historique d’abord, CAQDAS et analyse secondaire ont été développés et ont fait l’objet de débats au sein de réseaux interconnectés, voire communs, notamment à l’Université du Surrey et celle d’Essex (Brugidou et Le Roux, 2005 : 1). Le débat sur l’analyse secondaire est ainsi porté par des chercheurs qui sont aussi largement des utilisateurs et des promoteurs des CAQDAS. Certain.e.s d’entre eux ont réalisé des analyses secondaires en recourant à ces logiciels, à l’instar de Nigel et Jane Fielding revisitant l’enquête de Stanley Cohen et Laurie Taylor sur les prisonniers purgeant de longue peine et utilisant pour cela le logiciel WinMax (Fielding, 2000). L’ESDS (Economic and Social Data Service) Qualidata at the UK Data Archive, basée à l’Université d’Essex, a par ailleurs participé à l’initiation aux CAQDAS des chercheurs déposants dans la banque et a développé des partenariats avec le CAQDAS Networking Project, créé la même année et basé à l’Université du Surrey à Guildford (Corti, 2003 : 477).
Du point de vue scientifique, le rapport entre CAQDAS et analyse secondaire est pour l’essentiel traité dans la littérature selon trois angles. Le premier, largement majoritaire, insiste sur ce que les premiers apportent à la seconde, traitant la question de manière générale. Les CAQDAS favoriseraient ainsi l’analyse secondaire en rendant possible la transparence des données, leur partage sous une forme structurée, documentée et complète, voire leur évaluation externe à des fins de vérification des résultats (Fielding and Lee, 1998 : 63–64 1 ; Brugidou et Le Roux, 2005 ; Dargentas et al., 2007 : 158 ; Lewins et Silver, 2014 :14). D’autres auteur.e.s appréhendent le lien entre logiciels et analyse secondaire à partir cette fois des problématiques liées à l’archivage pérenne des données qualitatives, comme l’interopérabilité des formats logiciels (Muhr, 2000 ; Corti et Gregory, 2011) ou la protection des données personnelles des enquêté.e.s (Akeroyd, 1991 : 95). Enfin, une troisième série de publications porte sur des cas concrets d’analyses secondaires de données qualitatives outillées par le recours à des CAQDAS. Certains font simplement mention de l’usage d’un CAQDAS dans le cadre d’une analyse secondaire (Fielding et Fielding, 2000 : 679–680 ; Le Roux et Vidal, 2000 : §5 et 17 ; Dargentas et Le Roux, 2005 : §33). D’autres, plus rares, portent spécifiquement sur la manière dont un CAQDAS a été utilisée dans le cadre d’une analyse secondaire (Abrial et al., 2017 ; Hamidi, 2017) 2 , voire la réanalyse de données codées dans un CAQDAS dès l’enquête première (Medjedović et Witzel, 2008).
Dans le prolongement de ces travaux, cet article se propose d’explorer spécifiquement le lien entre réanalyse d’enquêtes qualitatives et utilisation de CAQDAS en s’appuyant sur deux réanalyses d’enquêtes qualitatives que j’ai effectuées à l’aide de CAQDAS (Atlas.ti et, de manière complémentaire, Sonal). Après une présentation des enquêtes premières et du type de réanalyse que j’ai effectuées pour chacune d’elles, je reviendrai sur la manière dont l’usage que j’ai fait des CAQDAS a été influencé par le fait que je les ai utilisés dans le cadre de réanalyses (1). Par la suite, sera traitée la manière dont j’ai utilisé ces logiciels dans ce contexte pour la construction et la gestion du corpus (2), le codage (3), l’annotation (4), la conceptualisation (5) ainsi que l’usage d’outils quantitatifs sur des matériaux qualitatifs (6). Il s’agira pour chacune de ces activités de saisir à la fois l’apport des CAQDAS à la réanalyse, et la méthode d’analyse qui a informé l’usage de telles ou telles de leurs fonctionnalités.
Contexte des enquêtes
Cette première partie vise à présenter le contexte des réanalyses que j’ai menées, c’est-à-dire à la fois les deux projets, les corpus premiers concernés ainsi que les raisons qui m’ont amené à recourir à des CAQDAS dans ces recherches.
Présentation des réanalyses et des enquêtes premières
Cet article rend compte de l’utilisation de CAQDAS dans le cadre de deux projets de réanalyse d’enquêtes qualitatives. Le premier porte sur la place des idées et des intellectuels en milieu partisan. La revue a longtemps été l’un des médias participant de la structuration même de l’espace intellectuel français, singulièrement à gauche. Les revues théoriques de parti constituent en outre une interface privilégiée entre responsables partisans et intellectuels. Pour ces deux raisons, l’enquête que j’ai réalisée prend pour objet deux de ces revues : La Revue Socialiste et La Nouvelle Critique, respectivement liées au Parti socialiste (PS) et au Parti communiste français (PCF). Le dispositif d’enquête repose sur la combinaison de trois méthodes : le dépouillement et l’analyse des archives de ces revues, l’analyse textométrique de leurs numéros et la réanalyse d’entretiens menés dans le cadre de deux enquêtes antérieures.
La première a été réalisée par Frédérique Matonti sur les intellectuels membres de La Nouvelle Critique, revue théorique du PCF, sur une période allant de 1967 à 1980 (Matonti, 1996). Traitant de l’obéissance politique et des rapports entre intellectuels et direction, cette enquête a été réalisée en combinant dépouillement et analyse archivistiques, analyse de contenu qualitative des numéros de La NC et réalisation de 61 entretiens auprès d’acteurs ayant participé à la vie de la revue 3 . La seconde enquête première, réalisée par Émeric Bréhier porte, quant à elle, sur les revues politiques de la gauche non communiste de 1958 à 1986 (Bréhier, 2000). Le chercheur y interroge les différentes fonctions que jouent ces revues dans un contexte d’unification progressive des groupements non communistes autour du Parti socialiste de François Mitterrand. Il recourt pour cela à un dispositif méthodologique combinant travail archivistique, analyse des appartenances des acteurs aux comités de rédaction et réalisation de 41 entretiens auprès des principaux acteurs de ces revues 4 .
Réalisé dans le cadre de l’ANR réAnalyse et du projet beQuali, le volet réanalyse de cette recherche a consisté à analyser ensemble les 81 entretiens conduits par ces deux chercheur.e.s pour les interroger à partir de nouvelles questions 5 , conformément à l’approche adoptée par certaines des premières réanalyses menées outre-Manche (Savage, 2011 ; Gillies et Edwards, 2012). Par rapport à ces deux recherches, l’enquête que je mène part d’une double interrogation. D’une part, quelle place respective est accordée à la doctrine et aux intellectuels dans ces deux partis au cours de cette période ? D’autre part, qu’est-ce que la relation de concurrence et de proximité avec l’autre parti a comme conséquence sur la place accordée aux intellectuels et aux revues dans chaque milieu partisan ? Les enquêtes NC et RGNC ont été ainsi collectées et analysées dans une perspective à la fois comparative et croisée.
La seconde réanalyse porte sur les entretiens de l’enquête « Territorial Governance in western Europe : between Capacity and Constraint (TERGOV) 6 », menée par Alistair Cole, Jean-Baptiste Harguindeguy, Romain Pasquier et Christian de Visscher (Cole et al., 2015 ; 2016). Il s’agit d’une enquête comparative interrogeant l’impact de la crise économique de 2007–2008 et des processus de convergence européenne sur quatre régions dirigées par des partis sociaux-démocrates : Andalousie, Bretagne, Pays de Galles et Wallonie. Dans ce cadre, l’équipe de chercheurs premiers a réalisé entre 2012 et 2014 une campagne de 104 entretiens auprès des élites politiques, administratives, syndicales et patronales de ces régions.
Cofinancée par l’ESRC (Economic and Social Research Council) et le PALSE (Programme Avenir Lyon-Saint-Étienne) en 2016–2017, cette réanalyse diffère de la première en ce qu’elle ne consiste pas à poser de nouvelles questions à partir des mêmes matériaux, mais plutôt à approfondir l’analyse des entretiens à partir d’une nouvelle méthode. A. Cole a utilisé NVivo pour coder les entretiens de l’enquête TERGOV, selon une approche hypothético-déductive et quantitative proche de la content analysis, qui contraste avec l’approche plus inductive et qualitative qui est la mienne. Les codes créés par A. Cole sont des catégories thématiques désignant ce dont parlent les enquêté.e.s et exclusives les unes des autres. La réanalyse a donc consisté, en conservant le même outil (Atlas.ti donc), à mettre en œuvre une autre méthode de codage, un codage inductif et ouvert, très près du texte. Il s’est agi ensuite de relier les codes ouverts ainsi créés aux codes thématiques produits par le chercheur premier afin d’une part, d’analyser ce que recouvrait ces thématiques pour appréhender ce que les enquêté.e.s disent de ces sujets et, d’autre part, d’étudier le lien entre ces thématiques via la manière dont les enquêté.e.s les articulent dans leur discours.
La première réanalyse relevait de mes domaines de spécialité (analyse des partis, sociologie des intellectuels, histoire sociale des idées politiques) et les objets et terrains des chercheur.e.s premiers étaient proches des miens. La réanalyse de l’enquête TERGOV m’a au contraire amené à me confronter à une littérature dont j’étais moins familier, à la croisée de la politique comparée et de la sociologie de l’action publique, autour des questions de gouvernance multi-niveaux et d’européanisation des politiques publiques. Par ailleurs, si c’est moi qui ait effectué la réanalyse des entretiens premiers, elle s’est faite en étroite collaboration avec l’un des chercheurs premiers (A. Cole). Enfin, la réanalyse de l’enquête TERGOV ne porte que sur une partie du corpus premier. En effet, pour des raisons pratiques (contraintes temporelles et budgétaires), je ne pouvais en quelques mois coder l’ensemble du corpus d’entretiens premiers. C’est pourquoi nous avons fait le choix avec le chercheur premier de me concentrer sur les seuls entretiens gallois et bretons et d’exclure les cas wallons et andalous.
Ce que la réanalyse fait à l’utilisation de l’outil
J’ai réalisé mes travaux de mémoire et ma thèse sans recourir à un CAQDAS, procédant à une analyse manuelle des matériaux assez classique 7 . C’est à l’occasion de mon premier post-doctorat, mené dans le cadre de l’ANR réAnalyse, que j’ai découvert ces outils. La démarche réanalytique qui était la nôtre au sein de l’équipe nous a amenés à faire le choix de recourir à un CAQDAS de façon à rendre plus transparente l’interprétation des matériaux premiers, ce dont je ressentais moi-même le besoin, et ce pour trois raisons.
D’abord, comme dans beaucoup d’analyses secondaires, je n’ai pas réalisé moi-même l’enquête de terrain. La réanalyse suppose dans ce cas une approche indirecte (c’est-à-dire décalée dans le temps et séparée du recueil des données) des informations et du sens contenu dans les matériaux, et par conséquent, une méthode d’analyse particulièrement attentive à l’interprétation. D’une part, en permettant un micro-codage très fin, au plus près du texte, Atlas.ti me semblait utile afin d’éviter au maximum les erreurs d’interprétation 8 . En permettant d’annoter chaque code, il me permettait en outre de documenter la manière dont j’interprétais chaque passage. Je créais ainsi un mémo du type « A voir avec le/la chercheur.e premier.e » et/ou « Recouper avec archives » pour les passages des entretiens qui me posaient question. Ils relevaient de trois types : ceux dont je ne parvenais pas à décrypter le sens, ceux dont l’interprétation que j’en faisais me paraissait alors peut-être aller au-delà de ce que disent effectivement les enquêté.e.s et ceux qui me semblaient ambigus et donc sujets à plusieurs interprétations possibles. Je centralisais ensuite ces mémos et les importait de manière à nourrir la grille de questions à discuter avec le/la chercheur.e premier.e lors de notre rencontre suivante 9 , mon journal d’archives ou encore mon journal d’analyse.
Ensuite, les matériaux premiers ne sont pas toujours conservés intégralement ; le chercheur second n’a ainsi bien souvent accès qu’à une partie du corpus, voire à des fragments, d’où le souci de tirer le maximum d’informations et de significations des matériaux conservés. Sur les 61 entretiens de l’enquête NC, 56 ont été enregistrés (soit 78 cassettes) et 39 ont été transcrits de manière partielle ou intégrale. Seuls 4 entretiens sont définitivement perdus, n’ayant été ni enregistrés ni transcrits. 91,8 % du corpus a donc pu être exploité et réanalysé. Concernant l’enquête RGNC, aucun enregistrement audio n’a malheureusement été conservé. Pour cette raison, 17 entretiens sont définitivement perdus et 24 entretiens transcrits ont pu être collectés. Seulement 58 % du corpus a donc pu être réanalysé. La totalité des entretiens de l’enquête TERGOV a en revanche été conservée et était déjà transcrite.
Enfin, la réanalyse des données d’autres chercheur.e.s est toujours sensible. Le réanalyste se trouve ainsi confronté aux critiques des détracteurs de cette méthode en même temps qu’il doit gérer la relation délicate avec les chercheurs premiers. Un codage très inductif afin d’être le plus fidèle possible à la parole enquêtée, une documentation me permettant de justifier mes interprétations, tout cela était aussi une manière de me protéger contre le risque d’être accusé de décontextualiser les données ou de mal les comprendre. Et dans ce cadre, le CAQDAS m’aidaient à faire un codage fin et une annotation systématique qui auraient été plus difficiles à gérer manuellement.
La réanalyse des enquêtes qualitatives n’a pas simplement favorisé le recours à un CAQDAS ; elle a en outre eu des effets sur la manière dont j’ai appréhendé l’outil. Les deux réanalyses abordées ici partagent très largement une méthode d’analyse commune, fondée sur une analyse qualitative du discours de type inductif s’inspirant partiellement de la Grounded Theory (par la suite GT) 10 . Il n’en reste pas moins que j’ai dû adapter ma stratégie de codage à la fois aux spécificités de chaque enquête première et aux finalités de chaque enquête seconde.
En premier lieu, l’usage que j’ai fait des CAQDAS était conditionné par le type de matériaux que j’avais à réanalyser. Outre leur degré de conservation déjà mentionné, celle de leur transcription a également joué un rôle. Le fait d’avoir pu collecter à la fois les transcriptions et les enregistrements audio de l’enquête NC m’a ainsi amené à me demander pourquoi la chercheure première a transcrit ou non tel ou tel entretien ou passage de l’entretien et à interroger le potentiel du non-transcrit au regard de mes questions de recherche. Dans cette perspective, le fait que certains logiciels comme Sonal aident à opérationnaliser cette question de recherche en permettant d’aligner son et texte, de coder le son et de quantifier la part respective du transcrit et du non-transcrit m’a amené à creuser davantage ce point.
La stratégie de conduite des entretiens des chercheur.e.s premier.e.s a également eu des effets différenciés sur l’usage que j’ai fait des CAQDAS, et en particulier sur le type de codage. À titre d’exemple, les entretiens réalisés par F. Matonti révèlent ainsi une approche ethnographique et centrée surtout sur l’interprétation de la parole enquêtée, quand É. Bréhier s’intéressait d’abord à établir la véracité des faits, selon une approche dominante chez les historiens 11 . Ces différences de méthode expliquent ainsi que le codage interprétatif s’avérait beaucoup plus aisé pour la réanalyses des entretiens de l’enquête RGNC (sur codage interprétatif/indexatif, voir infra).
Enfin, les méthodes d’analyse employées par les chercheur.e.s premier.e.s influencent également l’utilisation que j’ai faite des CAQDAS dans la réanalyse de leurs matériaux. L’une des difficultés majeures de la réanalyse vient du fait qu’il est souvent difficile d’avoir accès à la documentation dans laquelle les chercheur.e.s premier.e.s reviennent sur la manière dont ils ont analysé leurs données. Faute d’une telle documentation, l’analyse reste largement une boîte noire, que l’analyse des publications et la réalisation d’entretiens auprès des chercheur.e.s premier.e.s ne permet que partiellement de rouvrir. Si je n’ai accès qu’aux matériaux proprement dits pour la première réanalyse, il en était autrement pour celle de l’enquête TERGOV. A. Cole avait en effet utilisé lui aussi un CAQDAS (NVivo), selon une méthode d’analyse différente de la mienne, plus proche de la content analysis. Ayant accès au codage premier (sous la forme d’un projet NVivo), je pouvais donc envisager une utilisation inédite pour moi d’Atlas.ti consistant à recoder les matériaux selon une méthode différente et à l’aide d’un outil différent pour ensuite réinterroger le codage initial au regard des résultats produits.
La démarche réanalytique a donc favorisé mon recours à des CAQDAS et la manière de les utiliser en appelant une micro-analyse inductive. D’autre part, elle a également eu pour effet de pluraliser les usages faits des CAQDAS selon les caractéristiques de l’enquête première (types de matériaux, questions de recherche, méthode et outils employés) et les finalités de l’enquête seconde. Reste à voir désormais plus avant ce que les outils apportent au réanalyste et la manière dont ils ont été utilisés selon la méthode d’analyse retenue.
Construire et gérer le corpus
Le premier apport des CAQDAS pour les réanalyses que j’ai menées est l’appui technique qu’ils fournissent dans le travail de construction et de gestion du corpus en amont même de l’analyse. Plus précisément, ils m’ont aidé d’une part, dans la collecte et le traitement des matériaux et d’autre part, dans la gestion documentaire.
Aider à la collecte et au traitement du matériau
Certains CAQDAS présentent des fonctionnalités facilitant la collecte de matériaux. Le logiciel Sonal permet l’enregistrement en direct d’entretiens ou de séances d’observation depuis son ordinateur. Au cours de l’un des entretiens réalisés avec l’un.e des chercheur.e.s premier.e.s, mon dictaphone numérique est tombé en panne. Refusant d’utiliser mon smartphone (pour des raisons de protection des données), j’avais alors enregistré la suite de l’entretien depuis mon ordinateur portable via Sonal. J’ai par la suite eu recours à cette fonctionnalité de manière systématique afin de doubler les enregistrements audio des entretiens avec les chercheur.e.s premier.e.s.
Mais les CAQDAS peuvent s’avérer également utiles pour le traitement des matériaux collectés : ainsi Sonal pour m’aider à la transcription des enregistrements audio des entretiens de l’enquête NC. Une majorité des transcriptions d’entretiens réalisés par F. Matonti est relativement fidèle et exhaustive 12 . Toutefois, certains entretiens sont peu transcrits, d’autres ne le sont que partiellement. Or, comme je l’ai développé ailleurs, le non-transcrit est potentiellement riche pour l’enquête seconde (Rioufreyt, 2017a : 132 ss). Dans cette perspective, le logiciel Sonal offre toute une série de fonctionnalités utiles pour cette tâche – comme le mode Dictée ou les raccourcis clavier 13 . J’aurais pu tout à fait utiliser un logiciel de transcription, puis importer les transcriptions dans Atlas.ti, s’il s’était agi simplement d’utiliser Sonal pour les transcriptions. Mais c’est le fait qu’il propose des fonctionnalités d’aide à la fois à la transcription et à l’analyse du matériau sonore, comme nous allons le voir, qui expliquent mon recours à cet outil.
Créer des corpus multi-modaux
Les CAQDAS ne sont plus simplement des logiciels d’« ingénierie textuelle » (Jenny, 1997). Ils tendent en effet de plus en plus à permettre la création et la gestion de corpus multimodaux en permettant l’alignement et/ou la synchronisation des différents modes présents dans les matériaux (texte, audio, vidéo, multimédias web). Dans cette perspective, j’ai d’abord utilisé Sonal afin de synchroniser les enregistrements audios et les transcriptions des entretiens de l’enquête NC. Sonal permet en effet littéralement de « voir le son » en attribuant des codes directement sur des segments de la bande sonore et ainsi d’analyser le matériau oral lui-même (Alber, 2010) 14 . J’ai importé les entretiens réalisés par F. Matonti dans le logiciel et j’ai codé systématiquement tous les passages non transcrits des entretiens afin de saisir dans quelle mesure le non transcrit est intéressant scientifiquement et pertinent pour la réanalyse. (cf. Figure 1)

Coder la bande son sous Sonal pour saisir le non-transcrit
La chronométrie (en millisecondes) s’avérait en l’occurrence beaucoup plus précise que le simple comptage de mots ou de caractères de la transcription pour objectiver la part du non-transcrit, comme on peut le voir ci-dessous. (cf. Figure 2)

Chronométrie du non-transcrit dans Sonal
Ce premier usage, visant essentiellement à justifier l’intérêt de la réanalyse, m’a alors amené à découvrir tout l’intérêt de revenir aux sources orales pour l’analyse. Initialement, je travaillais comme la plupart des collègues sur les transcriptions d’entretiens, mettant de côté les enregistrements audios une fois ceux-ci transcrits. On constate en effet en sciences sociales un décalage entre la valorisation des sources orales, l’importance de l’entretien comme interaction et interlocution, et le fait que l’on travaille pour l’essentiel sur leur transcription, c’est-à-dire sur des sources écrites. Les inscriptions paratextuelles dans les transcriptions permettent certes de garder trace de la forme orale pour signifier ici un rire ironique, là un ton dubitatif. Reste qu’une partie du matériau oral est perdu au cours de la transcription : passages non transcrits, débit et prosodie, longueur des silences, modulation de la voix, etc. Or, ces informations se sont avérées parfois très utiles pour l’analyse. J’ai donc importé par la suite les entretiens de l’enquête NC et ceux de l’enquête TERGOV dans Atlas.ti et les ai alignés au texte des transcriptions. La possibilité qu’offre les CAQDAS non seulement de retourner « à la source » si je puis dire (c’est-à-dire aux matériaux oraux) mais aussi d’aligner son et texte s’avérait très utile pour la réanalyse à plusieurs égards
D’abord, le retour aux sources orales a constitué la manière la plus approfondie pour moi de me familiariser avec les enquêtés, m’approprier le matériau, en m’offrant quelque chose d’analogue à l’immersion dans le terrain. Nul besoin certes de corpus multimodal pour réécouter les enregistrements. Toutefois, l’alignement avec l’écrit me permettait de comprendre les passages de l’enregistrement plus difficiles à entendre et/ou (comme dans l’exemple ci-dessous) de créer directement un mémo ou un code, des idées surgissant de l’écoute que la lecture n’avait pas suscitée ou de manière moindre.
Ensuite, en permettant à l’inverse de consulter facilement les bandes son des passages transcrits qui me paraissaient plus difficiles à interpréter, les CAQDAS me permettaient d’éviter, autant que faire se peut, les mauvaises interprétations. L’intonation de l’enquêté.e (signifiant une opposition radicale ou bien une nuance), la manière de lier des phrases (indiquant une forme de lien sans recours à un connecteur logique) me permettait ainsi parfois de lever une ambiguïté ou d’écarter une hypothèse. À titre d’exemple, l’un des enquêtés de F. Matonti relate un moment de vive controverse au sein du groupe Tel Quel à l’occasion d’un débat avec les animateurs de La Nouvelle Critique. Dans la transcription, le paratexte mentionne un rire qui semble indiquer que l’enquêté s’amuse avec une certaine distance de « la violence des débats idéologiques au sein d’une revue d’avant-garde parisienne ». Toutefois, la réécoute de l’enregistrement montre qu’il s’agit là d’un rire non point moqueur mais abasourdi et peiné, suggérant que l’enquêté avait vécu là un moment difficile (cf. Figure 3). Ce qui peut sembler un détail révèle au contraire de précieux indices à la fois sur les sentiments de l’enquêté à l’égard de tel et tel membre de Tel Quel et les traces laissées par un énième épisode de querelle mêlant intime et idéologie dans l’engagement communiste de cet enquêté (ce que confirme un passage plus loin sur la bande).

Revenir au son pour interpréter un rire
Enfin, l’alignement audio-textuel s’est avéré parfois très utile pour aider le(s) chercheur(s) premier(s) à resituer l’entretien en question et répondre à certaines de mes questions lors de nos entretiens, afin de confirmer par exemple les métadonnées de certains entretiens (identité des enquêté.e.s ou des enquêteur.e.s, date de réalisation, etc.) ou bien pour discuter de certaines de mes interprétations du matériau. La ré-immersion dans le matériau oral s’avérait souvent beaucoup plus efficace pour le travail de remémoration que la lecture du verbatim transcrit. Le timbre de l’enquêté.e, son accent, sa prosodie, son rire, ses silences, la modulation de sa voix, toutes ces informations perdues au cours de la transcription sont ainsi autant de « points d’accroche » mnésiques aussi importants que le contenu du propos. Dans ce contexte, le recours à un CAQDAS fluidifiait considérablement ces sessions de réécoute. Grâce aux mémos associés aux passages transcrits dont je voulais discuter avec les chercheurs.e.s premier.e.s, je retrouvais ces extraits facilement parmi la masse de matériaux et n’avais plus qu’à cliquer sur le marqueur (qui correspond au rectangle bleuté aux contours rouges dans l’exemple ci-dessus) pour l’écouter avec le/la chercheur.e premier.e. Nous pouvions les réécouter ensemble plusieurs fois facilement grâce à la fonction « rembobiner » et je pouvais directement intégrer ce que me disait le/la chercheur.e premier.e dans un mémo associé aux passages concernés.
On voit ici l’intérêt d’aligner/synchroniser les matériaux et le rôle joué par les CAQDAS dans ce travail. Mais ces outils permettant d’aller un peu plus loin en reliant les matériaux proprement dits aux autres documents générés au cours de l’enquête.
Constituer son enquête d’un point de vue documentaire
Les CAQDAS facilitent la gestion documentaire en centralisant l’ensemble des documents constitutifs de l’enquête sous une interface unique. Atlas.ti m’a permis ce faisant de rassembler tous les documents constitutifs de l’enquête première que j’ai pu collecter et de les importer sous un seul projet, tout en pouvant gérer le corpus ainsi créé et la navigation en son sein facilement. L’approche réanalytique se singularise par le fait de prendre pour unité de collecte et d’analyse non pas tel fonds de centres d’archives ou tel fonds de chercheurs comme dans l’approche archivistique classique, ni les données, comme la plupart des banques de données qualitatives, mais l’enquête. Cela signifie que la collecte et l’analyse de l’enquête première ne se limitent pas aux données ou aux matériaux d’enquête proprement dit 15 mais s’étendent à l’ensemble des documents produits dans le cadre de l’enquête, des documents préparatoires aux publications en passant par les matériaux empiriques, les preuves issues de leur interprétation, les documents méthodologiques ou administratifs (cf. Tableau 1).
L’enquête d’un point de vue documentaire
*La distinction data/evidence a été proposé par Martyn Hammersley (Hammersley, 2010). Les data sont les matériaux – notes d’observation, enregistrements et transcriptions d’entretiens, corpus documentaire – que l’on fabrique au cours de la recherche. Les evidences sont ce qu’on en fait pour valider les hypothèses ; ce sont des matériaux mais travaillés, interprétés et traités au regard des informations dont on dispose, des questions de recherche et du cadre théorique qu’on utilise. Elles ne correspondent qu’à une partie du matériau rassemblé mais en sont une version enrichie.
La majorité des utilisateurs de CAQDAS en sciences sociales utilisent ces logiciels essentiellement pour analyser des transcriptions d’entretiens. Pour ma part, j’ai importé dans chaque projet Atlas.ti non seulement les transcriptions d’entretiens premiers et les enregistrements audio qui y sont associés mais également les différents documents (articles, travaux universitaires et ouvrages) en lien avec les enquêtes, que les chercheurs les aient publiés ou non. Cela me permettait ainsi de pouvoir relier plus facilement les matériaux et les interprétations que les chercheur.e.s premier.e.s en avaient faits dans leurs publications et de mieux comprendre ainsi leur approche. J’ai également importé les enregistrements audio des entretiens réalisés auprès des chercheur.e.s premier.e.s et leurs transcriptions afin de pouvoir y revenir pour m’aider à interpréter certains passages ou à me rappeler le contexte de tel entretien.
Le codage ouvert
Étape cruciale de l’analyse qualitative dans la GT, le codage ouvert consiste à rester au plus près du matériau textuel afin d’en dégager au maximum le sens 16 . En soi, le codage qualitatif peut se faire manuellement à l’aide du feutre surligneur, du ciseau, du tube de colle et de l’écriture en marge du document imprimé. Les CAQDAS apportent simplement la possibilité de multiplier les codes, de faire se chevaucher les segments codés et de relier des extraits là où, dans l’analyse manuelle, le document codé serait rapidement illisible ou les extraits découpés trop nombreux. Les CAQDAS sont d’un usage très souple. Les stratégies de codage peuvent donc varier et renvoient d’abord à la méthode d’analyse du chercheur. Dans mon cas, les matériaux premiers ont été codés de manière systématique et micro-analytique (1), inductive (2) et essentiellement interprétative (3).
Codage systématique et micro-analyse
En commençant le codage, j’ai été confronté rapidement à deux questions. La première est la suivante : dois-je coder tout ou seulement une partie du corpus ? Le codage sélectif a le mérite d’être plus rapide et facile mais il n’a de sens que dans une démarche hypothético-déductive. Il suppose en outre une phase de tests des codes sur une partie conséquente du corpus pour s’assurer de leur pertinence. Dans une démarche inductive comme la mienne, le choix de recourir à un codage systématique du corpus se justifie à plusieurs égards. D’une part, ne sachant pas encore exactement ce que je vais trouver, ce d’autant plus que je n’avais pas moi-même réalisé les entretiens, le codage sélectif comporte un risque de ne travailler que sur ce qui fait immédiatement sens pour le chercheur ou de sur-utiliser dans l’analyse certains morceaux du corpus particulièrement adaptés à la démonstration et qui seraient plus conformes aux hypothèses. Si la méthode peut d’une certaine manière être définie comme l’art de se donner les moyens d’avoir tort, le codage systématique fonctionne ici comme un dispositif méthodologique très utile. D’autre part, il rend possible un usage des outils de requête statistiques permettant de donner une image de l’importance que représentent les passages auxquels on a associé tel ou tel code par rapport à l’ensemble du corpus (voir infra).
La seconde question qui s’est posée à moi était celle du degré de granularité de l’information codée qu’il convient d’adopter. À titre d’exemple, l’une des questions systématiquement posées dans des entretiens de l’enquête TERGOV concerne les défis que la région devra relever au cours des 5-10 prochaines années (sous la forme de questions du type : « What major challenges is Wales going to be facing over the next five years from your perspective ? »). La question étant ouverte, les réponses des enquêtés étaient bien souvent multiples. Devais-je sélectionner un code pour tous les défis énoncés par un enquêté lors de l’entretien ou bien un code pour chaque défi énoncé ? Dans le premier cas, l’unité de sens est l’enquêté, dans le second cas, l’unité de sens est l’idée. Conformément à une logique inductive, il m’est apparu qu’il convenait de coder chaque défi séparément. D’une part, cela me permettait d’analyser plus finement (au sens étymologique du terme analyse, comme décomposition des éléments) les représentations de chaque enquêté.e en distinguant les idées qui les composent puis en étudiant les relations logiques et/ou sémiotiques entre elles. D’autre part, coder chaque défi séparément m’a permis de dégager plus facilement des liens transversaux entre les enquêtés et entre les régions, répondant ainsi à une des exigences de l’analyse comparative. Toutefois, le choix d’un micro-codage s’explique également par un effet de l’interface visuelle sur l’unité de sens ; l’usage d’Atlas.ti m’a amené en effet à coder non plus une page A4 ou un entretien, mais une ligne après l’autre, ou au niveau du paragraphe (cf. Figure 4). Et la possibilité d’attribuer plusieurs codes à un même passage et de faire se croiser des citations ont renforcé un peu plus encore un micro-codage très fin.

Micro-codage et interface visuelle
Le codage systématique et très micro a pour effet d’engendrer un grand nombre de codes. À titre d’exemple, la réanalyse des entretiens TERGOV a ainsi donné lieu à la création de 1159 codes ouverts différents (sans compter les codes abstraits), soit une moyenne de 22 codes environ par entretien.
Une approche inductive
L’approche inductive que j’ai adoptée dès les débuts de la réanalyse a également eu des effets très nets sur ma manière de coder. En premier lieu, elle influence directement la place du codage dans la méthode. Dans les réanalyses que j’ai effectuées, le codage n’est pas ce qui précède l’analyse des données, mais l’analyse elle-même, inscrivant ma démarche dans la lignée des principes de la GT (Glaser et Strauss, 1967 ; Strauss et Corbin, 1998) ou de la théorie de Miles et Huberman (Miles et al., 2013). C’est pourquoi la réanalyse a consisté à repartir des transcriptions d’entretiens sans recourir aux catégories d’analyse des chercheur.e.s premier.e.s ni même à des codes définis a priori.
Le deuxième effet d’une méthode inductive concerne la nature des codes. Dans ce type d’approches, les codes sont pluridimensionnels, hétérogènes et croisés, au moins pour la phase de codage ouvert. Cela a deux conséquences concrètes en termes de codage. D’une part, les citations peuvent se chevaucher pour partie et donc les codes être cooccurrents, ce qui a été le cas pour l’immense majorité des codes ouverts créés dans chaque projet. D’autre part, cela signifie que les codes peuvent appartenir à différentes catégories plus générales à la fois, ce qui fut là aussi bien souvent le cas (voir infra sur le regroupement de codes lors du codage axial).
Indexation et interprétation
On peut distinguer deux logiques de codage en analyse qualitative, que je présente dans l’introduction de ce dossier : l’interprétation et l’indexation. La logique qui a été la mienne est fondamentalement interprétative. Il s’agissait de saisir les catégories de pensée des enquêté.e.s. Concernant les deux premières enquêtes, le codage des entretiens visait ainsi à saisir leur profil intellectuel, leur conception de ce qu’est un intellectuel à travers la manière dont les enquêtés ont vécu leur investissement dans la revue, leur engagement au Parti, leur rapport à la direction, etc. Concernant la troisième enquête, le codage avait pour but de saisir les représentations des acteurs concernant le rôle de la région et la manière dont elle faisait face à la crise économique et aux injonctions des institutions communautaire européennes.
Toutefois, au codage interprétatif s’est ajouté de manière complémentaire un codage indexatif, autrement dit, le codage des éléments factuels contenus dans les entretiens. Pour la réanalyse des deux premières enquêtes, j’ai ainsi codé toutes les informations factuelles sur les groupements (revues, clubs, partis, courants intra-partidaires, syndicats) mentionnés par les enquêté.e.s : leur fonctionnement pratique, leur histoire, etc. Dans le même ordre d’idées, j’ai systématiquement codé les informations mentionnées par les enquêtés sur chacun d’eux afin de constituer, après recoupement, une notice biographique par individu. Pour la réanalyse de l’enquête TERGOV, j’ai également réalisé un codage indexatif visant cette fois non plus des informations factuelles sur les individus ou les groupes mentionnés par les enquêté.e.s, mais les thèmes qu’ils/elles abordent, reprenant la grille de codes initialement utilisée par A. Cole sous NVivo (voir infra). Les deux types de codage peuvent être menés dans la même enquête. En revanche, cela a impliqué pour ma part d’effectuer ces deux types de codage l’un après l’autre et non en même temps. Les logiques d’indexation et d’interprétation sont en effet difficilement compatibles dans la même phase de codage tant les manières de construire les codes et de les intituler diffèrent radicalement 17 .
L’annotation
L’utilisation d’un CAQDAS ne constitue pas en soi une garantie que l’analyse soit explicitée et documentée mais ces logiciels en facilitent techniquement la possibilité. Dans la GT, la documentation de l’analyse n’est pas simplement un plus mais une condition nécessaire 18 . Or, l’immense majorité des CAQDAS s’inspirent de la GT. C’est pourquoi ils présentent des outils d’annotation permettant de documenter chacune des phases d’analyse du matériau.
Usages des commentaires et des mémos
Atlas.ti distingue les commentaires, nécessairement associés à un objet (document, code, citation, groupe, réseau, etc.), et les mémos, qui peuvent être libres ou associés à un objet et gérés séparément depuis un memo manager.
Dans cette perspective, j’ai associé de manière systématique un commentaire à chaque code nouvellement créé. Chaque commentaire de code suit un modèle-type comprenant les rubriques suivantes : explicitation du titre (utile en cas d’usage d’abréviations), résumé et analyse de(e) citations associée(s) au code, métacodes envisagés auxquels associer le code, objets connexes comme par exemple la network view (voir infra) associée au code. Les commentaires de codes me servaient ainsi de notes d’analyse, permettant de raconter la genèse d’un code, la raison de sa pertinence à un moment donné et de résumer l’idée que me suggérait le passage. Dès la phase de micro-codage au plus près du texte, surviennent d’ailleurs des idées de catégories plus générales sous lesquelles subsumer les codes ouverts (Lewins et Silver, 2014 : 158 ss). À titre d’exemple, un des enquêtés interrogés par F. Matonti revient sur ses désaccords avec l’interprétation que fait Althusser de Montesquieu. Ceux-ci renvoient à la fois à la méthode, très éloignée de celle des historiens dont l’enquêté se sent proche, au fait que pour lui le marxisme est à la fois une science et un humanisme et au fait que cela engage une conception des rapports entre parti, classe et société qu’il ne partageait pas. J’ai donc codé ce passage « Controverse avec Althusser » et ai inscrit dans le commentaire de ce code trois catégories plus générales à créer plus tard : « Rapports philosophie-histoire du point de vue de la méthode », « Marxisme, science et humanisme » et « Rapports parti-classe-société ». Plutôt que d’inscrire l’une de ces trois catégories plus générales dans l’intitulé du code, j’ai préféré le faire dans le commentaire de code afin de ne pas déterminer trop tôt la catégorie plus générale sous laquelle le regrouper, et ce pour deux raisons. D’une part, les catégories plus générales étaient susceptibles d’évoluer au fur et à mesure du codage. D’autre part, un même code ouvert peut être regroupé sous plusieurs codes plus généraux, ce qui a été assez souvent le cas. J’ai par ailleurs également associé un commentaire à chaque document (pour les entretiens) afin d’y inscrire le contexte de l’entretien (date, nom de l’enquêté.e, etc.), de donner les propriétés de l’enquêté.e ou toute information susceptible d’informer de manière éclairée l’analyse du matériau.
Quant aux mémos, je les ai utilisés selon quatre usages. D’abord, pour chaque projet, j’ai créé un mémo libre (associé à aucun objet) dans lequel je rédigeais en continu un journal de codage où sont consignés les différents choix en matière de stratégie de codage. Ensuite, les mémos me permettaient parfois d’écrire des hypothèses, idées d’ordre plus général que les commentaires associés à tel objet, et de relier ces notes aux segments du matériau qui les ont suscités. Ces notes d’analyse étaient centralisées dans le memo manager, fonction ad hoc d’Atlas.ti. Les mémos me permettaient également de noter la définition de tel ou tel acronyme ou initial d’organisations (comme WEFO pour Wales European Funding Office ou CC pour Comité Central du Parti communiste français), très nombreux dans les entretiens et nécessaires dans une enquête comparant des partis ou des systèmes politiques et administratifs nationaux et régionaux assez différents. Dans la même logique, j’ai créé un mémo à chaque occurrence d’un pseudonyme pour noter l’identité de la personne qui se cachait derrière. Enfin, comme je le précise plus haut, j’ai créé des mémos pour les passages difficiles à interpréter et qui requéraient de croiser les entretiens avec d’autres sources ou d’en discuter avec le/la chercheur.e premier.e.
Analyse outillée et technologies scripturaires
Dans ce travail d’annotation, le recours à d’autres formes que l’écriture linéaire s’est avéré très utile. L’utilisation de schémas, de tableaux, de diagrammes, de cartes heuristiques constituent en effet autant de dispositifs formels aidant à étendre et affiner la pensée, ce que l’on peut nommer à la suite Jack Goody des technologies scripturaires (Goody, 1979) 19 . Dans cette perspective, j’ai recouru à plusieurs dispositifs formels dans les commentaires associés à certains codes particulièrement intéressants. Pour des raisons de place, je me concentrerai ici sur l’un de ces dispositifs, qui consiste en l’élaboration de tables d’opposition, le plus souvent dans le commentaire de codes (cf. tableau 2). Ces tableaux permettent la mise en série d’oppositions structurales constitutives du discours des enquêtés (dedans/dehors, féminin/masculin, gauche/droite, libéralisme/socialisme, etc.), à l’instar de ce que firent Claude Lévi-Strauss dans l’analyse des mythes (Lévi-Strauss, 1996), Guy Michelat et Michel Simon dans l’interprétation des modèles culturels (Donegani et al., 2002), Pierre Bourdieu dans l’étude des représentations sociales (Bourdieu, 2000) ou encore Mary Douglas dans son analyse culturelle (Douglas, 1966), à partir de cadres théoriques et méthodologiques par ailleurs fort différents. À titre d’exemple, je prendrai la série d’oppositions mobilisées lors de l’entretien par un intellectuel socialiste interrogé par É. Bréhier (cf. Tableau 2). Dans un passage de cet entretien, l’enquêté mentionne que l’entourage de François Mitterrand lui paraissait « extrêmement bourgeois » et qu’il était proche « à l’inverse de [nom3] et [nom4] ». Le connecteur logique « à l’inverse » indique que proximité, estime et origine sociale sont liées chez lui. Il est éloigné des gens « extrêmement bourgeois » qu’il méprise et proche des gens simples qu’il estime. Cette affirmation est renforcée quelques lignes plus loin lorsqu’il déclare qu’il appréciait la « présence simple, militante de Danièle Mitterrand qui, presque tous les jours participait aux tâches quotidiennes les plus ingrates comme le courrier et le secrétariat ». On voit là le système de valeurs de l’enquêté. Toutefois, comme le confirme le jugement positif énoncé à l’égard de Danièle Mitterrand, « bourgeois » désigne ici certes l’origine sociale mais aussi et surtout le comportement. Est « bourgeois » celui qui refuse de se salir les mains, de se taper les tâches ingrates, qui fait des manières et qui est sophistiqué. L’opposé de bourgeois n’est donc pas prolétaire ou ouvrier mais plutôt travailleur, militant, gens simple. J’ai ainsi pu progressivement mettre en série les oppositions structurales mobilisées par cet enquêté sous la forme de la table d’oppositions ci-dessous :
Table d’opposition « bourgeois » versus « gens simples »
Ce type de technologies scripturaires permet ainsi, pas à pas, de construire des typologies qui m’ont aidé par la suite à pouvoir comparer les enquêté.e.s entre eux et en particulier, entre intellectuels socialistes et communistes, sur la question de la classe sociale. Plus largement, ces outils d’annotation permettent littéralement d’opérationnaliser la réflexivité en permettant au/à la chercheur.e de tenir un véritable journal de codage, équivalent pour la phase d’analyse du journal de terrain.
Montée en généralité et conceptualisation
Les CAQDAS peuvent aider le chercheur à la conceptualisation ou encore ce que les anglo-saxons nomment theory building à travers toute une gamme de fonctionnalités qu’ils offrent. Toutefois, là encore, le choix des fonctionnalités sélectionnées parmi cette gamme et l’usage qui en est fait dépend de la méthode d’analyse retenue. Les méthodes d’analyse inductives proches de la GT recourent ainsi de manière privilégiée à la fonctionnalité network 20 , en ce qu’elle permet de relier des codes sous de multiples rapports via des catégories abstraites non exclusives (voir par exemple (Bandeira De Mello et Garreau, 2011). À l’inverse, la démarche hypothético-déductive procède davantage d’une logique arborescente hiérarchique dans laquelle un code est indexé dans une catégorie générale exclusive. D’où le recours plus fréquent à un codes tree 21 ou à des intitulés de codes standardisés (Friese, 2009).
Comme nous avons pu le voir, la méthode d’analyse retenue pour la réanalyse des trois enquêtes est inductive et s’inspire pour partie de la GT. Conséquemment, après l’analyse des matériaux premiers (après le codage ouvert), l’étape suivante a consisté à établir des liens entre codes et à les rassembler afin de dégager des catégories d’analyse là où le codage ouvert consistait au contraire à disséquer le texte, à multiplier les interprétations. Ce codage est dit axial dans la terminologie GT dans la mesure où il ne s’agit pas de ranger les codes dans des cases a priori et exclusives comme dans une logique arborescente hiérarchique mais plutôt d’établir des liens entre eux selon une logique réticulaire. Dans cette perspective, j’ai recouru principalement à deux manières de relier des codes : les groupes de codes et la fonction link to.
Les groupes de codes comme entonnoirs et filtres
La fonction groups 22 est une autre fonctionnalité très utile dans Atlas.ti et à laquelle j’ai eu recours pour organiser les données et monter progressivement en généralité. Les groupes sont des ensembles, des clusters de documents, de codes ou de réseaux permettant ainsi de les regrouper, à l’instar de fichiers dans un dossier. Même si elle semble proche d’une logique arborescente hiérarchique (puisqu’on met des objets – document, code, mémo, etc. – dans un ensemble plus grand), cette fonctionnalité reste compatible avec une logique réticulaire dans la mesure où un même objet peut être rangés dans différents groupes.
Les groupes de codes peuvent servir de prototypes aux concepts qui seront constitutifs de la théorie finale 23 . Toutefois, s’ils peuvent jouer le rôle de noyaux rudimentaires, les groupes ne sauraient être utilisés en tant que tels pour structurer la grille de codes car un tel usage rend les choses très compliquées à gérer, notamment lorsque les fonctions réseau sont employées (Friese, 2010 : 222). J’ai donc plutôt utilisé les groupes de codes comme des entonnoirs et des filtres permettant de me concentrer soit sur un aspect dans les matériaux traités, soit sur les liens entre plusieurs catégories. Pour ne prendre qu’un exemple, les groupes de codes m’ont permis de réanalyser le codage effectué par le chercheur premier dans l’enquête TERGOV. Celui-ci comprend 14 codes thématiques généraux 24 (appelés « nodes » dans la terminologie de NVivo) que l’on peut voir ci-dessous (cf. Tableau 3, Figure 5).
Liste des codes premiers de l’enquête TERGOV

Code Group Manager – Liste des thématiques
Après avoir procédé au microcodage des entretiens de l’enquête TERGOV dans Atlas.ti, j’ai créé des groupes de codes sous Atlas.ti correspondant aux codes thématiques créés par A. Cole sous NVivo. Puis j’ai relu les codes ouverts que j’avais créés et, lorsque cela me paraissait lié, je les ai associés avec un ou plusieurs des groupes de codes. Ce faisant, ainsi qu’on peut le voir sur la Figure 5, j‘ai relié des codes interprétatifs (codage secondaire) à des codes thématiques (répliques du codage premier).
Si les groupes de codes thématiques créés à partir du codage d’A. Cole se sont avérés utiles pour m’aider à préstructurer le regroupement de codes, ils ne disent que peu de choses sur la signification du lien entre les codes ainsi regroupés. Ce sont des entonnoirs très utiles mais ils ne disent rien d’autre sémantiquement que ce dont parle les enquêté.e.s et non ce qu’ils en disent (d’où la limite d’une analyse qui se limiterait à une indexation thématique). Ce sont également des filtres permettant au chercheur de ne travailler que sur un aspect du matériau réanalysé. Une fois les codes ouverts regroupés dans les différents groupes, je pouvais sélectionner chacun d’eux afin d’étudier plus finement la relation entre les différents codes et ainsi dégager progressivement la signification que recouvrait chaque thème du codage premier dans le discours des enquêté.e.s. Mais, pour ce faire, il me fallait recourir à d’autres fonctionnalités.
Spécifier la relation entre les codes et la visualiser
Dans Atlas.ti, une autre manière de relier des codes consiste à utiliser la fonctionnalité link to. J’ai ainsi relié plusieurs codes ouverts dont le rapprochement me semblait faire sens en les reliant à un code abstrait. Un code abstrait est un free code (relié à aucune citation, contrairement aux codes ouverts) qui relie plusieurs codes ouverts (via la modalité is part of de la fonction link to) sous une catégorie plus générale. Si les codes abstraits sont des codes qui ne sont associés à aucune citation, Atlas.ti est cependant capable de récupérer toutes les occurrences d’un code abstrait dans le texte, en allant chercher les citations aux codes ouverts qu’il relie. Cette possibilité permet de travailler avec des codes abstraits sans perdre le contact avec le matériau. C’est d’autant plus important que, dans une démarche inductive, l’ensemble des codes et des relations entre codes sont retravaillés tout au long du processus de codage.
Les codes abstraits permettent de relier des codes sous des catégories plus générales et non exclusives, offrant ainsi les avantages des codes groups (comme entonnoirs et filtres), mais en permettant mieux que ces derniers de définir les liens qu’entretiennent les codes subsumés sous un même code abstrait, grâce à deux possibilités offertes par Atlas.ti.
D’une part, la fonctionnalité link to permet à la fois de relier des codes entre eux et de spécifier la nature de leurs liens (causalité, appartenance, opposition, etc.). Ces derniers peuvent en effet être de natures différentes. D’où la distinction importante ici à faire entre lien et relation. Le lien, c’est le fait que deux objets soit reliés ; la relation, c’est la caractérisation de ce lien 25 . D’autre part, comme nous allons le voir, il est possible de représenter visuellement ces relations sous forme de réseaux. Une précision doit en outre être faites à propos des network views ; il ne s’agit pas d’un réseau au sens structural où l’entend l’analyse de réseau (Wasserman et Faust, 1994) mais d’une représentation visuelle sous forme de réseau 26 .
En définissant des relations transitives (is a part of ou is property of) entre deux codes, le chercheur peut travailler sur différents niveaux d’abstraction. Dans l’exemple de network view (cf. Figure 6), le niveau d’abstraction va ainsi croissant. Celui-ci se distingue à la fois par la disposition spatiale des codes (des codes les plus ancrés en bas et sur les côtés aux codes les plus abstraits au centre et en haut) et le recours aux couleurs (de la couleur jaune à l’orange, puis au vert et au bleu).

Exemple de network view
Les codes ouverts « Modèle politique breton : collaboration entre acteurs publics et privés » ou « Sentiment de destin commun et identité des CCI » (créés directement d’après les verbatims) sont liés par des relations transitives à un code abstrait « CA_Modèle politique consensuel », lui-même lié à un code encore plus abstrait « CA_Modèle politique breton ». Celui-ci se caractérise selon les enquêté.e.s par un modèle politique consensuel, à la fois entre partis, entre acteurs locaux et services de l’État déconcentrés et entre acteurs publics et privés, et un fort attachement à la construction européenne. Ceséléments m’ont permis d’enrichir la signification des codes premiers « Style » et « Divergence ».
La vue réseau (Figure 6) montre que j’ai utilisé ici principalement la relation is part of, mais pas seulement. On voit par exemple que le code ouvert « Spécificité Bretagne : implantation Front National plus récente » est relié aux codes abstraits « CA_Modèle politique consensuel » et « CA_Européisme breton » par la relation is cause of. Il s’agissait dans ce cas d’établir une relation causale par laquelle l’implantation plus limitée et tardive du Front National en Bretagne s’expliquerait (selon les enquêté.e.s) par une culture politique spécifique fondée sur un consensus politique et un attachement à la construction européenne comparativement plus forts que dans d’autres régions françaises.
Introduire une analyse quantitative basique du corpus qualitatif
La plupart des CAQDAS comprennent désormais une gamme de fonctionnalités quantitatives simples mais qui peuvent s’avérer très utiles. Parmi celles-ci, on peut noter des fonctions de statistique textuelle (telles que les nuages de mots-clés et les grappes de co-occurrences) appliquées au texte ainsi que des tables de fréquence et de co-occurrence appliqués aux codes. Ces outils peuvent aussi bien être utilisés pour explorer le corpus de manière transversale ou en avoir une vue plus générale, que pour analyser à proprement parler le matériau. Ils offrent ainsi des moyens de développer des méthodes mixtes allant au-delà de la simple juxtaposition d’analyses qualitatives et quantitatives (Tashakkori et Teddlie, 2010 ; Fielding, 2012) .
Qualitativiste de formation, j’ai longtemps été méfiant à l’égard de la quantification de codes qualitatifs, c’est-à-dire créés par le chercheur lui-même. Mon expérience de codage collectif dans le cadre de l’équipe ERC Qualidem, avec des collègues plus familiers avec l’usage de méthodes mixtes dans des CAQDAS, m’a néanmoins fait évoluer pour partie, ce qui a eu un effet sur la réanalyse de l’enquête TERGOV. Dans cette perspective, j’ai utilisé la fonction document groups sous Atlas.ti afin de travailler sur des sous-corpus et d’établir une comparaison entre les enquêtés gallois et bretons. Pour cela, j’ai créé deux document groups (Interview Brittany et Interviews Wales) dans lesquels j’ai regroupé les entretiens de chaque terrain. J’ai par la suite utilisé la fonction code-document table afin de croiser groupes de documents et groupes de codes, permettant ainsi de mesurer la distribution des différents codes thématiques par terrain (cf. Tableau 4).
Code-Document Table – Une comparaison entre les codes de deux terrains
Les outils quantitatifs implémentés dans des CAQDAS doivent être maniés avec précaution. Il convient ainsi de relativiser la portée des résultats ci-dessus et plus encore d’en spécifier leur statut dans l’analyse. D’abord, le nombre de cas étudiés est trop limité pour que les statistiques soient significatives. Ensuite, les entretiens ont été menés globalement selon la même grille d’entretien dans les quatre pays étudiés. Toutefois, on constate parfois quelques variations d’un cas national à l’autre dans la manière de poser les questions, ce qui peut contribuer à accentuer certaines différences entre cas. Troisièmement, le codage évolue au fur et à mesure du processus, si bien que la quantification des codes n’avait de validité ici qu’à condition d’harmoniser le codage, et donc de recoder les premiers entretiens. Enfin et surtout, il convient de rappeler qu’il s’agit là d’une quantification de codes qualitatifs, c’est-à-dire produits d’une interprétation par un chercheur situé. Un autre chercheur y aurait sans doute vu d’autres choses ou interprété les mêmes choses autrement. Cela vaut évidemment tout autant pour les analyses statistiques que pour la démarche qualitative. Toutefois, la différence vient du fait que les chiffres n’ont pas le même statut. En l’occurrence, les chiffres obtenus dans Atlas.ti ne sauraient prétendre au statut d’indicateurs objectifs – puisqu’il est toujours possible de rajouter ou supprimer des codes –, quand les logiciels d’analyses automatisées permettent au moins dans un premier temps de l’analyse de dégager des résultats indépendants de l’interprétation du chercheur en calculant la fréquence et la distribution de mots et surtout, de cooccurrences de mots ou de catégories de mots, ou encore leur proximité spatiale dans le texte (via les concordances). Ici il ne s’agit pas de résultats objectifs mais plutôt d’indications qu’il s’est agi ensuite d’étayer ou de creuser. Bref, de quoi discuter les hypothèses en cours et en formuler de nouvelles.
Ces précisions étant faites, la code-document table n’en fournit pas moins des données importantes pour l’analyse. S’il est impossible ici pour des raisons de place de fournir une interprétation détaillée de l’ensemble de ces résultats, j’en donnerai simplement un qui montre tout l’intérêt de la quantification de codes. Alors que l’analyse lexicale menée sous NVivo par A. Cole faisait apparaître que les enquêtés bretons n’utilisent presque jamais le mot « partis », il apparaît que la thématique « Partis » (comme « Social-démocratie ») est distribuée de manière relativement équilibrée entre les entretiens bretons et gallois (47,96 % et 52,04 %). Autrement dit, les enquêtés bretons parlent tout autant des partis que leurs homologues gallois. Ce qui les singularise est qu’ils le font en utilisant très peu le mot général - « partis - et en évoquant plutôt le nom d’acteurs partisans spécifiques. Si l’analyse inductive interprétative ne peut prétendre à l’objectivation, elle montre à l’inverse ici sa force : en s’intéressant au discours des enquêtés dans ce qu’ils disent explicitement mais également les représentations que cela implique, elle permet de saisir des significations plus implicites, indirectes ou latentes.
Conclusion
Au terme de cette analyse, on voit que la relation entre réanalyse et CAQDAS est plutôt une relation à trois termes : les matériaux collectés (ici donc les documents constitutifs des enquêtes premières au sens fort, i.e. type et volume des matériaux conservés, méthodes, questions de recherche, cadre théorique) ; la méthode d’analyse choisie pour ces matériaux (dans mon cas, une analyse qualitative du discours de type inductif pour commencer) et les outils (Atlas.ti et Sonal). La conjonction de ces trois dimensions détermine ainsi les usages que les chercheur.e.s font des outils. La présente contribution vise à montrer tout l’intérêt d’analyser de façon réflexive la manière dont le chercheur s’approprie les outils, passant d’une présentation généraliste des apports des CAQDAS à leurs usages effectifs dans le cadre de la recherche.
Plus spécifiquement, cet article constitue un double apport à la littérature. D’abord, il aborde ce que le recours à un CAQDAS dans le cadre de réanalyses fait à l’usage des outils, question qui est sans doute le parent pauvre de la littérature sur le sujet. Dans cette perspective, on a pu voir que la réanalyse a favorisé l’utilisation de CAQDAS et orienté le choix du programme parmi cette famille de logiciels, ainsi que la manière de l’utiliser, en appelant à une micro-analyse inductive. Elle a également eu pour effet de diversifier les usages faits des CAQDAS selon les caractéristiques de l’enquête première (types de matériaux, questions de recherche, méthode et outils employés) et les finalités de l’enquête seconde.
Cet article montre également que la réanalyse est aussi l’occasion de poursuivre l’interrogation sur ce que les CAQDAS font à l’analyse qualitative (Lejeune, 2010). Leur usage dans le cadre des réanalyses que j’ai menées a en l’occurrence produit des effets sur l’analyse elle-même, cinq effets en particulier : un intérêt accru pour le retour aux sources orales ; une tendance plus forte au micro-coding ; une systématisation de l’annotation et de la documentation de chacune des phases d’analyse ; un recours renforcé à différentes formes de visualisation des matériaux et des preuves ; et, enfin, une ouverture aux méthodes mixtes de la part d’un chercheur initialement défiant à l’égard de la quantification des codes qualitatifs. J’ajouterai par ailleurs un effet indirect de l’utilisation de CAQDAS dans le cadre de mes enquêtes : la découverte de toute une littérature méthodologique anglo-saxonne qui a accompagné mon apprentissage de ces outils. Il convient néanmoins de ne pas succomber à une forme larvée de déterminisme technique : ce n’est pas l’outil seul qui a produit ces effets. Mon utilisation des CAQDAS s’inscrit aussi et surtout dans la trajectoire intellectuelle et pratique d’un jeune chercheur qui a acquis davantage d’expérience au fil des années et plus encore, qui s’est socialisé à travers plusieurs projets collectifs dans un univers de chercheur.e.s sensibles aux questions de méthode, réflexif.ve.s quant à l’usage des outils et ayant réalisé une pluralité de formes d’enquêtes. Difficile dans ces conditions de séparer ce que l’outil fait aux pratiques de recherche du contexte social et temporel dans lequel leur apprentissage puis leur utilisation intensive se sont effectués.
Au final, l’utilisation de CAQDAS dans le cadre des réanalyses que j’ai menées s’est avérée fructueuse. Il convient bien sûr de se méfier de la sensation que peut susciter la découverte des CAQDAS (MacMillan et Koenig, 2004). Je suis convaincu cependant que l’outillage de mes analyses a rendu celles-ci bien meilleures. Il m’a en particulier permis de coder le matériau premier beaucoup plus finement que je ne l’aurais fait avec une analyse manuelle, d’annoter de manière systématique chacune des opérations interprétatives et ainsi de documenter en détail l’analyse. L’utilisation de ces outils m’a également ouvert à d’autres manières de faire, en valorisant davantage que je ne le faisais auparavant l’importance de retourner aux sources orales et en m’initiant à l’usage des outils quantitatifs qui, pour limités qu’ils soient en comparaison d’autres logiciels, n’en ont pas moins été très utiles pour interroger et explorer le corpus autrement que ce que j’avais l’habitude de faire. Ces logiciels m’ont ainsi permis à la fois d’avoir une analyse plus solidement ancrée dans les matériaux empiriques et des résultats plus fins et robustes sur le plan de l’administration de la preuve. Le fait de travailler sur les matériaux d’autres chercheurs m’a invité à une attention accrue à l’interprétation, par souci de respecter leur travail et la parole enquêtée comme de me prémunir des éventuelles critiques que suscitent souvent les réanalyses. Mais ces outils m’ont permis d’opérationnaliser cette attention et ainsi donné les moyens d’accomplir la tâche que je m’étais fixée.
Footnotes
Remerciements
Cet article a bénéficié tout au long de ses différentes versions des relectures exigeantes et bienveillantes de Sophie Duchesne, Mathieu Brugidou et Camille Hamidi. Qu’ils en soient sincèrement remerciés. Merci également aux chercheur.e.s premier.e.s de m’avoir fait confiance en me donnant accès à leurs enquêtes. Pour toutes ces raisons, si j’ai le monopole du blâme pour ce qui est de son contenu dont je suis seul responsable, je ne saurai avoir celui de la louange.
Déclaration de conflit d’intérêts
L’auteur déclare n’avoir aucun conflit d’intérêt potentiel pour tout ce qui concerne le déroulement de la recherche, les droits d’auteur et/ou la publication de cet article.
Financement
La première réanalyse a bénéficié d’un financement dans le cadre d’un post-doctorat réalisé dans le cadre du projet beQuali en 2015–2016. La seconde a été cofinancée par l’ESRC (Economic and Social Research Council) et le PALSE (Programme Avenir Lyon-Saint-Étienne) en 2016–2017. L’auteur n’a en revanche bénéficié d’aucun soutien financier particulier relatif à ses droits d’auteur et/ou à la publication de cet article.
