Abstract
Sur le terrain et dans son laboratoire, l’enquêteur amasse une grande quantité de notes aux statuts divers. Face au volume de ces matériaux et à leurs natures plurielles (retranscriptions d’entretiens, comptes-rendus d’observation, journaux de terrain, notes de lectures, etc.), des logiciels fournissent un équipement précieux pour accompagner le chercheur dans le processus d’analyse. Cet article revient sur l’usage qui a été fait de deux d’entre eux, Atlas.ti et Sonal, dans le cadre de deux thèses de sociologie (l’une sur la médecine légale et l’autre sur le traitement pénal des affaires de stupéfiants). Dans ces deux cas, le recours à ces logiciels n’a pas visé à en épuiser toutes les fonctionnalités, mais plutôt à épauler des opérations ordinaires de la recherche qui, par l’intermédiaire des logiciels, ont gagné un caractère systématique. L’article revient sur les façons par lesquelles ces logiciels permettent de faire plus et plus vite, tout en pointant certains effets attachés à leur usage dans le processus de conceptualisation. À travers une illustration au plus près des processus cognitifs analytiques, et en comparant Sonal et Atlas.ti, cet article montre que le recours aux logiciels implique des prises de position théoriques sur l’ensemble des étapes constitutives de l’élaboration sociologique depuis le travail de terrain jusqu’à l’écriture finale d’une recherche (article, rapport, thèse), comme par exemple l’idée selon laquelle l’aller-retour entre les niveaux empirique et théorique constitue un moteur puissant de l’analyse sociologique.
Introduction
La scène se déroule en 2012, lors d’un cours de « Théorie et Méthode » dispensé par un professeur d’Université à des étudiants en Master 2 « Recherche » en sociologie. La séance porte sur l’analyse et notamment sur la phase d’interprétation consistant à passer du matériau brut à ce que l’on veut en dire. Le professeur transmet donc des recettes concrètes pour explorer, séparer, interpréter et connecter les données à des formes plus conceptualisées. Nous reconstituons ici l’échange selon les souvenirs qui nous restent : - « Imprimez et centralisez sur une grande table vide l’ensemble de vos notes. Puis prenez des ciseaux et découpez tous les bouts de textes qui se rapportent à une même idée. Regroupez ensuite ces bouts de papier selon la catégorie à laquelle ils se réfèrent et collez-les entre eux. » Un élève lève la main. Le professeur lui donne la parole. - « Il existe des logiciels permettant d’automatiser ces opérations concrètes, et qui fonctionnent exactement comme la trousse que vous décrivez : ils découpent les éléments textuels d’un même document qui sont suffisamment différents, puis les collent au sein d’autres documents regroupant tous les extraits décrétés similaires par le chercheur. » - « Je ne connais pas ces logiciels, mais je vous les déconseille, parce que les logiciels font des choses sans que le chercheur puisse les contrôler. Une paire de ciseaux et un tube de colle font amplement l’affaire. »
L’un comme l’autre, nous avons réduit l’utilisation de ces logiciels à la conduite d’opérations ordinaires de recherche (archivage, organisation et exploration des données) dans des enchaînements de séquences similaires à ceux qui accompagnent ces opérations dans le mode manuel (le ciseau et la colle) ou à leurs variantes sur des logiciels de traitement de texte (le copier-coller). Il s’est donc agi de systématiser les opérations d’analyse plutôt que de les automatiser. Un tel usage minimaliste ne se laisse toutefois pas rabattre sur le seul plan instrumental puisqu’il a impliqué des prises de positions théoriques sur ce que faire du terrain veut dire et sur le sens à donner aux différentes opérations d’une recherche, qui vont de la réalisation d’entretiens, du stockage et de l’analyse du matériau, à l’écriture finale d’une recherche (article, rapport, thèse).
Pour mettre au jour quelques-uns des effets du recours à ces logiciels sur nos recherches doctorales, il ne s’agira ni d’en détailler les modes d’emploi 5 , ni de discuter les choix épistémologiques et techniques de leurs concepteurs, mais plutôt de rendre compte, à la manière d’un compte-rendu d’analyse (comme il y a des comptes-rendus de terrain), de ce que nos recherches doctorales doivent à l’utilisation de ces deux logiciels. Cet article s’inscrit ainsi dans la lignée des travaux affirmant la nécessité de lier « méthodes logicielles et réflexivité du sociologue » (Demazière et al., 2006) et plaidant à la fois pour une inventivité dans les méthodes à utiliser et pour une certaine prudence dans leur mise en œuvre. C’est cette même posture prudente, inventive et réflexive que nous embrassons à travers ces récits comparés d’utilisation d’Atlas.ti et de Sonal 6 .
Pour limiter l’abstraction parfois caractéristique des propos relatifs aux outils informatiques – ces outils se donnant mieux à « voir » qu’à « lire » –, nous distinguerons ici deux niveaux de lecture : celui du texte présente le lien entre l’opération d’analyse et ces logiciels en général ; celui des encadrés revient sur leurs usages en donnant à voir, concrètement et à la première personne du singulier, ce que Sonal et Atlas.ti ont fait à nos recherches. L’article commence par décrire brièvement certaines des fonctionnalités de ces logiciels en distinguant ce que l’on y met (1) et ce que l’on y fait (2). Il montre notamment que, bien que reposant sur des fonctionnalités différentes, les deux logiciels permettent d’ancrer empiriquement l’analyse. Il propose ensuite une réflexion sur ce que ces logiciels font aux pratiques de recherche et revient sur quelques précautions qui nous semblent importantes à prendre en compte dans le recours à ces équipements informatiques (3).
Présentation de nos deux recherches doctorales
La thèse de Kathia Barbier porte sur le traitement pénal des affaires de stupéfiants. Elle y interroge, de façon croisée, les effets du genre des potentiel.les justiciables et de celui des policier.ières et des magistrat.es sur les prises de décision de ces dernier.ières et, plus généralement, sur la mise en visibilité des femmes dans les statistiques de la délinquance. Le protocole méthodologique a associé méthodes quantitatives (dépouillements et analyses critiques des bases de données policières et judiciaires) et qualitatives (entretiens avec des policier.ières et magistrat.es). Certaines des propositions avancées dans la thèse seront détaillées ici à partir du lien qu’elles entretiennent avec l’usage de Sonal, utilisé à chaque étape de la recherche : archivage des bandes sonores, retranscription intégrale et codage des entretiens, tri et analyse des données, exportation des extraits et citations mobilisés pour la rédaction de la thèse.
La thèse de Romain Juston porte sur les médecins légistes et les expertises médico-légales qu’ils effectuent sur réquisitions du procureur. Cette recherche repose sur un dispositif d’enquête empirique associant des observations ethnographiques, des entretiens et un travail documentaire. Différents sites ont été étudiés (salles d’autopsies, cabinets médicaux, directions ministérielles, administrations déconcentrées, permanences-parquet, cours d’assises, congrès de médecine légale) selon une double logique d’enquête : suivre, des ministères aux services, les projets qui visent à organiser et cadrer les activités médico-légales ; étudier ensuite des rapports d’expertise établis par les médecins légistes, qu’il s’est agi de suivre depuis les services de médecine légale jusqu’aux tribunaux (Juston, 2017b). Tout au long de la thèse, Romain a utilisé Atlas.ti pour compiler l’ensemble de ses comptes-rendu écrits (de terrain de lecture, d’analyse, de textes sociologiques variés), et y conduire l’opération d’analyse de matériaux par certains bricolages qui seront restitués dans les encadrés suivants.
Ce que l’on y met
Atlas.ti et Sonal peuvent être mobilisés dès les premières étapes du processus de recherche pour archiver la multitude d’ingrédients hétérogènes récoltés sur le terrain (textes, sons, images ou vidéos) ou produits en parallèle par le chercheur dans son laboratoire (comptes-rendus divers, notes de séminaire, notes de lectures, etc.).
Atlas.ti : pas de chiffres mais des lettres
Chaque projet de recherche conduit depuis le logiciel accueille les divers documents mobilisés (textes, images, bandes sonores ou vidéos 7 ) au sein d’« unités herméneutiques » (UH). Une manière de construire ces UH est de les considérer comme des projets de recherche nécessitant de mettre en rapport l’ensemble des documents. Une autre possibilité est de faire évoluer ces UH en fonction de l’avancée d’une recherche, en optant au départ pour un travail au sein d’une pluralité d’UH correspondant aux différents projets attenant à la thèse (tel terrain, telle communication, tel article, par exemple) avant de les intégrer progressivement les unes aux autres au moment d’entamer la rédaction du manuscrit final (Encadré 2).
De la thèse par projets à la thèse comme objet
D’emblée, j’ai eu un rapport de l’ordre du bricolage avec ce logiciel, puisque je n’ai pas construit une UH relative à ma thèse sur la médecine légale, mais une myriade d’UH correspondant à tel ou tel service de médecine légale – correspondant à plusieurs phases de terrains – ou bien à tel ou tel projet de textes intermédiaires – documents à destination de mes directeurs, supports de communication ou projets d’articles.
On peut trouver une trace de la façon par laquelle j’envisageais chacun de ces projets dans certains « mémos » que j’y ai rédigés. En effet, Atlas.ti offre la possibilité d’adjoindre des mémos à chacune des opérations conduites sur le logiciel (de la création d’une UH au codage d’un bout de texte, en passant par des mémos attachés à tel ou tel code généré par le chercheur). Ces mémos sont précieux en tant qu’ils constituent, à l’instar d’un journal de terrain constitué lors de la phase de recueil des matériaux, un véritable journal d’analyse permettant de contrôler chacune des montées en généralité. J’ai par exemple rédigé le texte suivant dans un mémo adossé à un projet ouvert en septembre 2015 : « Je lance un projet entièrement dédié à la médecine légale du vivant à un moment de la thèse où je veux m’approprier mon terrain de cet été [Cet été-là, j’ai effectué deux enquêtes sur un mois dans deux Unités médico-judicaires]. Voici comment je procède : Je lis chaque doc, je les mets en forme et ensuite je les enregistre sur Atlas.ti ». Une chose qui ressort de ce court récit d’analyse est que je ne traite pas du matériau brut, mais des comptes-rendus ethnographiques travaillés en amont. Cette étape préparatoire à l’analyse globale de ces différents comptes-rendus m’a permis de mener un premier travail d’analyse selon plusieurs modalités. D’abord, en ajoutant au fil du texte des commentaires que telle ou telle séquence observée m’inspirait. Ensuite, en cherchant un titre pour chacune des séquences (une consultation, ou un temps d’observation de la vie du service comme un staff médical ou un déjeuner convivial, par exemple). Cela m’a permis, au-delà d’enclencher une véritable analyse, de fixer sur les documents, et donc dans ma mémoire, des choses qui auraient pu m’échapper (j’ai parfois observé une dizaine de consultations dans la même journée).
Dans un autre mémo adossé à cette UH, j’ai noté ceci : « Peut-être coder moins de choses – et faire émerger peu de nouveaux codes – et se concentrer sur les codes que j’ai déjà identifiés. Les choses qui sont déjà connues, ce n’est pas la peine, je les ai en tête ou bien je les ai codées ailleurs. » De même les choses très descriptives comme « j’ai été experte en 2000 » ; car je sais où trouver l’information dans les documents sources. » Ainsi, on voit que mon objectif était d’avancer vite plutôt que d’être exhaustif dans le codage de ces documents – d’abord, car j’en ai déjà codés d’autres et que j’ai donc déjà mis au jour un certain nombre de catégories ; ensuite, car je cherche à ce moment-là à stabiliser certains résultats de ma thèse, plutôt qu’à œuvrer, dans l’optique d’un codage ouvert, à formuler de nouvelles catégories. Ainsi, il me semble, avec du recul, que ma technique de codage sur ce document correspondait au codage axial qui se distingue du codage ouvert en tant qu’il est plus de l’ordre de la déduction et qu’il vise à déterminer des conditions en les mettant de façon répétée à l’épreuve des faits qui vont permettre de densifier la théorie. Il cherche autrement dit moins à faire émerger des formes de conceptualisation qu’on n’aurait pas découvertes jusque-là, qu’à « boucher les trous » et constater des variations pour solidifier et densifier la théorie en travaillant à l’adhérence des faits à celle-ci.
Cette façon de concevoir la thèse par projets a perduré jusqu’à la rédaction, où j’ai fait le choix de créer autant d’UH que de chapitres, dans la mesure où mon plan de thèse était assez peu transversal aux différents terrains, à l’exception de l’introduction et du chapitre pivot à l’intersection de la socialisation des médecins légistes et de leurs pratiques concrètes. Cette pratique a alors occasionné plusieurs doublons dans l’analyse, alors même que j’envisageais l’usage du logiciel comme une manière de gagner du temps dans la conduite de cette opération. D’abord, recréer des UH propres à la phase de rédaction m’a, dans les faits, conduit à recoder à nouveau frais mes matériaux. Cela dit, je crois que cela m’a permis de produire des catégories plus à même d’enclencher une phase heuristique d’interprétation, aidé en cela par un recul sur les matériaux récoltés. Ensuite, le fait de créer autant d’UH qu’il y a de chapitres dans la thèse a impliqué qu’un même compte-rendu – d’entretien par exemple – se trouvait analysé autant de fois qu’il était convoqué par un chapitre. Là encore, cette perte de temps ne fut pas vaine car elle s’est faite au profit d’un gain dans l’analyse : un même entretien, voire un même verbatim, peut s’éclairer sous la pluralité des types de questionnements qui lui étaient adressés. Par exemple, coder un entretien avec un médecin légiste plusieurs fois (plutôt qu’une fois pour toute) a permis d’être précis sur l’analyse qu’on peut en faire pour éclairer des « bouts » différents de la thèse, portant par exemple sur la socialisation des médecins légistes ou sur l’effet des organisations de travail dans lesquelles ils exercent.
Les textes importés dans Atlas.ti diffèrent donc selon leur degré de formalisation mais aussi, et surtout, selon leur degré de problématisation, depuis un compte-rendu d’entretien ou d’observation par exemple, jusqu’à un support de communication ou un article scientifique. Cette hétérogénéité n’est a priori pas problématique, étant donné qu’un compte-rendu ethnographique peut initier la formation de propositions théoriques amenées à gagner en robustesse par le travail d’analyse, de même qu’un article scientifique peut donner à voir du matériau brut à fin d’illustration d’un raisonnement sociologique. Surtout, il semble que cette hétérogénéité des supports puisse être un moteur puissant de l’analyse. Ainsi, si les UH créées peuvent correspondre à des projets – du compte-rendu de tel terrain à la rédaction d’un chapitre de thèse – chacun de ces projets peut bénéficier d’une analyse de supports de natures différentes s’éclairant les uns les autres de façon dynamique.
Dans la continuité de l’idée selon laquelle Atlas.ti peut traiter toutes sortes de documents tapuscrits, l’expérience de l’usage de ce logiciel montre également l’intérêt à y charger des notes non directement liées au recueil de matériaux mais qui en informent l’analyse, comme des notes de lectures ou des notes prises lors d’un séminaire. Ce faisant, la mise en vis-à-vis du travail des autres et de son terrain suggère des formes de rapprochements imprévus, favorisant une dynamique heuristique entre le terrain et les concepts (Encadré 3).
Peut-on analyser les textes des autres ? Ma thèse sur la médecine légale face à la littérature sur I’expertise judiciaire
Pour illustrer l’intérêt que j’ai eu à intégrer les diverses notes bibliographiques dans le cadre de ma thèse sur les médecins légistes, on peut dire que celle-ci s’est constituée comme un apport à la sociologie de l’expertise. En effet, mon intérêt pour l’expertise judiciaire m’a amené vers la médecine légale et m’a conduit à formuler le constat selon lequel les travaux français sur la question portaient davantage sur les profils des experts et sur l’usage de leurs rapports d’expertises que sur les pratiques par lesquelles s’élaboraient les preuves médico-légales. Rien d’étonnant alors à ce que j’adjoigne un code relatif à « l’activité » à ma liste de codes mobilisés pour ordonner mes notes sur ces travaux sur l’expertise. Or, le fait que ce code soit resté quasiment vide après plusieurs années d’usage du logiciel confirme et objective l’existence d’un vide sur ces questions que ma recherche doctorale s’est efforcé de combler.
Sonal : du son et/ou des lettres
Sonal est spécifiquement conçu pour accompagner le chercheur dans la réalisation d’une enquête de terrain basée sur la collecte de matériaux audio/vidéo. Il est donc très orienté vers le travail (sur) des entretiens enregistrés et/ou filmés, qu’il regroupe dans un « corpus » et présente visuellement. L’utilisateur peut attribuer à chaque fichier diverses caractéristiques, en créant librement des variables dans une base de données 8 . Un corpus est donc une sorte de base de données audio, renseignée, dont on peut facilement connaître la composition (nombre d’entretiens avec tel ou tel type de répondants, durée des entretiens, etc.). Cette bibliothèque sonore peut être construite dès les premières étapes de la recherche et alimentée au fur et à mesure de la réalisation du terrain, pouvant elle-même être « guidée » par le logiciel puisqu’il permet de connaître en permanence l’évolution de la composition de son échantillon. Avant toute approche analytique, Sonal apporte donc une aide précieuse à l’organisation du terrain en donnant un aspect concret à la collecte des matériaux par la vue d’ensemble sur le corpus en voie de construction qu’il offre. Celui-ci peut ensuite s’enrichir de contenus textuels, comme les retranscriptions (totales ou partielles) des bandes stockées. En cela, Sonal « permet de mieux articuler retranscriptions et analyses, en accompagnant le sociologue dans toutes les étapes de sa recherche, de la construction à l’analyse de son corpus » (Alber, 2010 : 2), là où les autres logiciels combinent rarement fonctionnalités de retranscription et d’analyse. À noter qu’il est également possible d’importer ou de créer d’autres types de fichiers textuels (comptes-rendus, notes, coupures de presse, revues de littérature, etc.) et de les traiter de la même manière que les bandes audio/vidéo (Encadré 4).
Un terrain, deux corpus
Pour la gestion des entretiens réalisés dans le cadre de ma thèse sur le traitement pénal des infractions à la législation sur les stupéfiants, j’ai commencé la construction de mon corpus Sonal le jour de mon premier entretien, tout simplement en en important la bande sonore, en la nommant et en lui associant des premières caractéristiques décrivant l’enquêté.e (sexe, âge, fonction, service). Au fur et à mesure de la réalisation des entretiens, j’ai réitéré ces opérations, enrichissant donc progressivement mon corpus d’entretiens et la base de données descriptives des policier.ières et magistrat.es interviewé.es. Celle-ci fut également alimentée au fil des retranscriptions par de nouvelles informations que je jugeais utiles et dont je n’avais pas nécessairement un souvenir très précis au moment d’importer la bande : l’ancienneté dans le service, l’ancienneté dans l’institution, le ou les postes occupés précédemment, etc. La consultation régulière de cette base de données (par tris à plat et tris croisés) m’a permis de visualiser concrètement mon échantillon en voie de construction et d’éviter une trop forte homogénéité des profils d’enquêté.es, souvent induite par le recrutement en « boule de neige » qui fut la méthode employée sur le terrain.
Parallèlement, j’ai détourné l’usage classique de Sonal en construisant un second corpus « bibliographique » composé de mes notes de lecture. Cette idée a découlé de mon manque d’organisation bibliographique lors de ma recherche de Master sur les éducateurs de la Protection Judiciaire de la Jeunesse, que je dois en grande partie à ma (dommageable) réticence à utiliser Zotero (logiciel de gestion de références bibliographiques). L’objectif de ce second corpus était d’éviter, au moment de l’analyse et de la rédaction, d’ouvrir simultanément sous Word les nombreuses notes de lecture des articles et ouvrages consultés, de les parcourir en passant de l’une à l’autre et de réitérer l’opération à chaque changement de thème. Sonal m’a donc permis de tirer un meilleur profit de mes fiches de lecture, en en facilitant la consultation et en me faisant gagner un temps précieux. Concrètement, je travaillais toujours initialement dans un document Word mais cette fois, je l’importais dans Sonal et utilisais ses fonctionnalités pour trier mes notes. J’ai d’abord trié, en les découpant, les contenus de mes documents Word par thématiques plus ou moins fines 9 , et la fonction de synthèse proposée par Sonal 10 me permettait ensuite, en deux clics, de faire apparaître sur mon écran toutes les notes issues de plusieurs documents mais relatives à un même sujet. J’ai de plus classé mes notes selon qu’il s’agissait de citations, de résumés, de commentaires ou encore de « notes de route » que le texte lu pouvait m’inspirer (réflexions personnelles, idées de plan, questions à éclaircir…). Avec le recul, ce détournement de la fonction initiale de Sonal s’est non seulement avéré un gain de temps considérable lors de la phase d’écriture de ma thèse mais il m’a offert un indéniable confort de travail en m’évitant de « switcher » constamment d’un document Word à un autre.
À l’orée de la phase d’analyse, Atlas.ti et Sonal centralisent et permettent d’organiser l’ensemble du matériau glané. En découle une base de données qualitatives qui permet de maximiser l’analyse en ne perdant aucune miette de ce qui a mis du temps à être récolté par le chercheur.
Ce que l’on y fait
Une fois les documents textuels ou sonores chargés dans les logiciels, ceux-ci offrent une pluralité d’outils permettant de coder les matériaux et ce faisant, d’initier un processus d’analyse dynamique liant, de manière itérative, le niveau de l’élaboration théorique à travers les codes, et celui du terrain à partir des différents fragments de matériaux. Le processus d’analyse est ici dynamique car le système de codage ne consiste pas uniquement à classer thématiquement chacune des récurrences : il permet également à ses utilisateurs de faire évoluer les codes au fil de l’exploration du corpus.
Atlas.ti : découper, coller, assembler, relier et naviguer pour monter en généralité
Atlas.ti est très directement inspiré des travaux issus de la Grounded Theory Method (par la suite GTM) – ou méthode par théorisation ancrée, développée initialement par Barney Glaser et Anselm Strauss (1967). Au cœur de cette démarche particulière d’enquête se trouve le principe d’abduction selon lequel il faut viser autant que possible une simultanéité entre formulation des hypothèses et mise à l’épreuve empirique : « Il n’y a pas deux phases, l’une de formulation, l’autre de falsification des hypothèses, mais un double mouvement d’engendrement des codes, des catégories, de leurs propriétés et de leurs relations dans l’analyse des données, et simultanément, de mise à l’épreuve de leur validité, d’élimination des cas négatifs, de modification des échantillons qualitatifs, de raffinement contrôlé des identités et des différences jusqu’à saturation. Découverte et justification vont ensemble » (Corbin et Strauss, 2003 : 365).
Atlas.ti opérationnalise ce précepte grâce à une interface permettant de coder ses données de façon systématique, et ainsi, de séparer, interpréter et connecter ses données à des formes plus conceptualisées. Il s’agit de monter en généralité mais sans jamais décoller de son matériau 11 . Pour ce faire, le logiciel offre des possibilités multiples selon différents niveaux, des documents au corpus qu’ils constituent. Au niveau des documents, il s’agit de les coder, c’est-à-dire d’attribuer une ou plusieurs catégories à des extraits, devenant alors des cas d’espèce d’une catégorie analytique (concepts, thématiques). Une fois que l’on a attribué une catégorie aux différents extraits des documents considérés comme pertinents, Atlas.ti est un formidable outil de navigation. Plutôt que de passer d’un document à l’autre selon leur nature (retranscription d’entretien, fiche de lecture, note de séminaires…), Atlas.ti permet de naviguer à vitesse grand V entre tous ces documents hétérogènes par l’entrée nouvellement offerte par les codes. Quel chercheur ou étudiant n’a jamais été confronté, lors de l’étape de l’écriture, à l’énervement consécutif à la multitude des documents ouverts sur son ordinateur ? Atlas.ti, en centralisant ces documents, permet donc d’atteindre un niveau de coordination supérieur à celui de la bureautique et offre une interface où l’on navigue facilement entre les extraits de chaque code dans une interface unique. De plus, il est possible de produire, pour chacune des catégories, des documents (Word) regroupant chacune des récurrences rassemblées sous le code. La conjonction des pratiques au niveau des documents (le codage) et au niveau du corpus (la navigation) produit un troisième type de pratique effectué au niveau des codes eux-mêmes. On peut dénommer cette pratique la conceptualisation puisqu’elle vise à transformer chaque rubrique pour lui faire épouser précisément les contours des cas d’espèce considérés comme suffisamment homogènes par le chercheur pour être subsumés sous la même rubrique. Pour prendre un exemple concret de cette réversibilité, imaginons un code qui s’avère peu pertinent, soit parce qu’il regroupe trop peu d’éléments et qu’on peine à en tirer une interprétation heuristique 12 , soit parce que ces derniers ne présentent pas entre eux un air de famille assez fort. Il est alors possible de passer en revue l’ensemble de ces occurrences et de les regrouper sous de nouvelles catégories. Au terme de cette étape, le chercheur dispose donc de catégories à la fois plus fines et plus pertinentes pour penser son matériau. Mieux, le logiciel permet de définir des relations entre les différents codes (des causalités, des appartenances, etc.) et de représenter ces relations sous forme de réseaux.
De manière transversale s’ajoutent et se combinent d’autres fonctionnalités qui permettent d’épauler le processus d’analyse, comme le système de mémos, utile pour centraliser ses réflexions au cours du processus d’analyse, pour raconter la genèse d’un code et la raison de sa pertinence à un moment donné, ou encore pour formuler des hypothèses émises à la lecture du corpus. Les mémos aident ainsi à lutter contre le « syndrome de la boîte noire » en permettant d’« expliciter les opérations réalisées sur ses matériaux : production, structuration, codification, réduction, exploration, interprétation, etc. » (Demazière et al., 2006 : 15). Ils permettent ainsi d’opérationnaliser la réflexivité en gardant sous la main le récit d’enquête, conçu ici non pas comme un récit de terrain, mais comme un véritable récit d’analyse (Encadré 5).
Le cheminement d’une idée : I’émergence des catégories d’analyse au plus près des opérations de codage
Il est difficile après coup de savoir quelles sont les propositions avancées dans ma thèse qui n’auraient pas pu émerger sans le recours au logiciel Atlas.ti. Cela dit, un rapide détour vers les mémos rédigés pendant l’analyse fournit quelques indications précises sur l’émergence de concepts, d’idées, ou, pour le dire de façon générale, de propositions théoriques avancées dans la thèse, et qui laissent alors penser que Atlas.ti a favorisé leur formation. Je m’appuie ici sur les mémos que j’ai rédigés, non pas au niveau général des différents projets comme dans l’encadré 2, mais des mémos attachés aux codes, et à certaines de leurs occurrences. En effet, les mémos permettent aussi d’expliciter le lien entre un code et une citation, entre la catégorie et l’extrait, et, ce faisant, de décrire précisément l’opération d’analyse. Ces mémos nous apprennent ainsi, et sans surprise, que « le code ‘théorie’ est très mauvais » et « qu’il faut diffuser chacune de ses récurrences dans d’autres codes ». On peut ensuite détailler un résultat central de la thèse, publié dans un article qui porte notamment sur certaines caractéristiques typiques des médecins légistes adossées à des segments professionnels de l’expertise médico-légale (Juston, 2017a).
Dans cet article, je distingue les modes d’entrée dans la médecine légale « selon que chez certains, dès le plus jeune âge, la lecture de romans policiers stimule des vocations, là où d’autres ont croisé des réquisitions dans l’exercice routinier de la médecine ou ont obtenu un poste à la faveur de la création d’une unité médico-judiciaire dans le contexte de la réforme de la médecine légale » (Juston, 2017a : 398). Dans un mémo attaché à une partie d’entretien avec un médecin légiste au cours duquel celui-ci cite un livre policier que son père lui a offert étant jeune comme étant un premier déclic vers la vocation de médecine légiste, on trouve la note suivante : « Il faut créer un code pour saisir ce qui est relatif avec la ‘rencontre’ avec la médecine légale. En effet, ici on peut la rattacher à ses parents, à son parcours scolaire mais aussi ses loisirs, à travers le rôle que le livre policier offert par son père a joué dans la reconstitution de son histoire ». Depuis le codage de cet entretien, j’ai alors été particulièrement vigilant aux parties des récits recueillis en entretien dans lesquels se manifeste la « rencontre » avec la discipline, et j’ai même rajouté cette question dans mon guide d’entretien – selon la logique des allers-retours entre empirie et théorie comme moteur de l’analyse selon la GTM.
Cette prise en compte du moment de la rencontre avec la discipline a été un premier pas vers l’un des résultats principaux de la thèse, à savoir que la médecine légale n’étant pas une spécialité médicale instituée, les médecins interrogés ont pu la rencontrer dans une diversité de situations, et que les modes de rencontres déterminent le segment professionnel investit par ces derniers. Ainsi, comme je le note dans un autre mémo relatif au code « rencontre avec la médecine légale » appliqué à un entretien ultérieur : « il faut distinguer ce qui relève des études et de l’apprentissage formel de la médecine et de la formation sur le tas dont je peux montrer comme résultat qu’elle est très fréquemment citée comme essentielle par les médecins légistes ». Cette idée sera finalement au cœur de la thèse qui étudie avec la médecine légale les possibilités d’une socialisation professionnelle plus ou moins en rupture ou en continuité avec les études médicales, la médecine légale étant une sur-spécialité médicale qui s’ajoute et se combine à une autre formation d’internat. En bref, ce mémo est la première trace de l’idée que je formaliserai dans la thèse, selon laquelle, alors que la sociologie de la médecine a traditionnellement étudié le passage de l’autre côté du miroir au terme duquel un étudiant devient médecin (Hughes, 1958 ; Becker et al., 1961), la médecine légale invite à analyser l’ensemble des séquences qui, à l’université, à l’hôpital, et au tribunal, accompagnent la fabrique du médecin légiste. Celui-ci se retrouve être en effet le produit de processus de socialisation inscrits à la fois dans l’apprentissage d’une spécialité médicale et dans l’exercice d’une activité d’expertise encadrée par un système d’attentes suscitées par l’institution judiciaire. Ce « second passage de l’autre côté du miroir » que constitue l’entrée en expertise mérite dès lors qu’on prenne au sérieux le rapport au droit et à la justice des médecins légistes, tout en le saisissant de manière relationnelle avec les attributs forgés au long de la carrière d’étudiant et de professionnel en médecine.
Sonal : stocker, coder, retranscrire et décompter
Sur le plan du codage, Sonal s’apparente largement à ce que propose Atlas.ti, avec toutefois quelques différences dans la construction des catégories interprétatives puisqu’il propose deux niveaux de codage, celui des « thématiques » et celui des « mots-clés » (ou tags). Les thématiques (signifiées par un code couleur) sont faites pour être attribuées à des extraits (passages sonores ou textuels définis par l’utilisateur pour partitionner ses entretiens en parties cohérentes). La logique du logiciel étant de représenter graphiquement ces parties, ce premier niveau de codage est assez global car, pour rester visibles, les extraits ne doivent pas être trop courts. Cette grille thématique peut ensuite être affinée grâce au second niveau de codage qui permet d’associer des mots-clés aux extraits et qui s’apparente en cela beaucoup plus au système des codes d’Atlas.ti. Tout au long de l’enquête, Sonal permet de recoder, renommer ou fusionner les thématiques et les tags indéfiniment. Il s’inscrit en cela au croisement d’une démarche hypothético-déductive (puisqu’il est très adapté à un codage thématique préétabli qui reproduit, sur les matériaux, les grandes parties du guide d’entretien pour, dans un second temps, extraire et comparer les discours des différents répondants) et inductive (puisqu’il est possible de partir du matériau lui-même et d’élaborer progressivement sa grille d’encodage modifiable à souhait).
Concernant l’opération de codage en tant que telle, la segmentation des matériaux peut s’opérer sur les bandes sonores, au moment de l’écoute
13
. Le chercheur divise ses bandes en extraits
14
, auxquels il attribue une/des thématique(s) et/ou un/des mot(s)-clé(s). Chaque extrait est alors représenté par un ou plusieurs marqueurs colorés, « collés » sur la bande, qui apparait comme surlignée aux Stabilo® (Figure 1)
15
. Bande sonore avant et après codage dans Sonal
25
. Entretien découpé en plusieurs extraits dont certains ont plusieurs thématiques dans Sonal.


Un corpus dans Sonal avec les différentes thématiques à gauche et les entretiens superposés (les bandes) découpés en extraits thématisés au centre.
Si le découpage en extraits a été réalisé lors de l’écoute de l’entretien, le chercheur peut ensuite ajouter du texte à chacun des extraits (retranscription totale ou partielle, commentaires, etc.). Ces deux opérations peuvent également être réalisées simultanément. En outre, le texte est systématiquement « synchronisé » avec la bande et le système de retranscription 16 laisse automatiquement des repères chronométriques tout au long de la saisie du texte. Ainsi, lorsque l’on redécoupe ou fusionne des extraits, les modifications s’appliquent également au texte associé, qui peut lui aussi être modifié à souhait et à plusieurs endroits du logiciel. L’intérêt de ce fonctionnement est que l’on peut procéder de diverses manières pour enrichir son corpus : se contenter d’une collection de bandes simplement annotées et/ou retranscrites par endroits ou construire un corpus intégralement retranscrit et thématisé 17 .
L’utilisateur est donc libre de s’organiser comme il l’entend : en commençant par découper et coder la bande avant de retranscrire (ou pas) son contenu, en commençant par retranscrire intégralement les entretiens avant de les découper thématiquement, ou en encodant la bande directement en cours de retranscription (Encadré 6).
Tout faire en même temps (ou pas) dans Sonal : un choix important pour la définition des catégories d’analyse
Pour la gestion et l’analyse des entretiens réalisés dans le cadre de ma thèse sur le traitement pénal des infractions à la législation sur les stupéfiants (ILS), j’ai réalisé simultanément le découpage des bandes, l’attribution de thématique(s) aux extraits définis et la retranscription intégrale des entretiens. Ce choix résulte des « leçons » tirées lors de ma recherche de Master. Utilisant déjà Sonal, j’avais en effet commencé par retranscrire intégralement mes entretiens pour ensuite procéder au découpage en extraits et à leur encodage. Je me suis rapidement aperçue du caractère chronophage d’une telle démarche et j’ai pris le parti, pour ma thèse, d’essayer de « tout faire en même temps ». L’économie de temps réalisée grâce à ce processus de travail a alors montré tout l’intérêt de Sonal. En outre, les fonctionnalités d’assistance à la retranscription (le « mode dictée » et le système de raccourcis clavier) 18 se sont avérées être un vrai plus. Toutefois, ne plus être obligé.e d’avoir fini de retranscrire pour commencer à réaliser le travail de codage et d’analyse (ou d’avoir choisi de le faire) a présenté des inconvénients beaucoup moins prégnants lorsque j’avais distingué les temps de retranscription et d’encodage. Malgré une grille d’entretien systématiquement utilisée, encoder au fil de la retranscription a impliqué des choix thématiques un peu « à l’aveugle », dont la pertinence fut rapidement remise en cause au fur et à mesure que je (re)découvrais les propos de mes enquêtés. Après près d’une dizaine d’entretiens retranscris et encodés, j’ai en effet pris conscience (ou accepté de constater) que les thématiques très globales construites sur la base d’une poignée d’entretiens n’étaient pas adaptées à l’ensemble du corpus et qu’il allait falloir les affiner avant d’entamer le travail sur les entretiens restants. Le codage par « mots-clés » m’a en outre évité de reprendre les entretiens déjà traités : pour chaque thématique, j’ai créé plusieurs mots-clés, comme autant de sous-thématiques très utiles lors de la navigation analytique dans mes données. Cette possibilité d’affiner progressivement et indéfiniment mon codage au fil des retranscriptions m’a également amenée à (re)définir mes catégories d’analyse, en élaborant notamment un tableau de correspondance thématiques/mots-clés que j’ai scrupuleusement suivi dans la suite de l’opération de retranscription et sur lequel je me suis basée pour modifier mon guide d’entretien.
Synthétiser et analyser les matériaux
Comme Atlas.ti, Sonal propose un inventaire des extraits qui répondent à des critères définis (fonction « synthèse ») et permet donc de réécouter et/ou relire les passages filtrés en fonction de leur(s) thème(s), et/ou de leur(s) mot(s)-clé(s), et/ou du/des mot(s) qu’ils contiennent, et/ou des caractéristiques du répondant, etc. 19 . Par ailleurs, un système de « pondération qualitative » permet, lors de la retranscription ou de la relecture des entretiens, d’augmenter la police des passages considérés comme les plus illustratifs d’un thème donné et jugés dignes d’être cités dans l’écrit final. En plus de ressortir graphiquement, ces phrases sont repérées par le logiciel qui, si on le lui demande, peut les isoler et les exporter, avant ou après une opération de tri 20 (Encadré 7).
Comment accélérer et structurer le processus d’analyse grâce au tri sélectif dans Sonal
Dans ma thèse, j’interrogeais notamment l’effet des représentations de la délinquance et des représentations de genre chez les policier.ières et les magistrat.es sur la mise en visibilité des femmes dans les statistiques de la délinquance. Grâce à Sonal, j’ai pu très facilement retrouver et exporter toutes les citations qui illustraient les différents points de vue sur le sujet. Le système de tri permettant de distinguer les prises de parole sur la base des caractéristiques des enquêté.es m’a permis de comparer les propos tenus, les subdiviser et les organiser dans mon manuscrit. Il a par exemple été très facile d’illustrer, s’agissant des propos tenus sur la délinquance liée aux stupéfiants et la place qu’y tiennent les femmes, les points communs et dissemblances constatés entre les dires des policier.ières et ceux des magistrat.es, ou encore, plus fondamentalement, de rendre compte des divergences sexuées en matière de représentations du féminin et du masculin et comment celles-ci orientaient les façons de penser « les femmes dans les stups ». Concrètement, j’ai par exemple réalisé des synthèses successives sur des thématiques préétablies telles que « représentations de la délinquance en général », « représentations de la délinquance liée aux stupéfiants », « représentations des femmes délinquantes » ou encore « représentations de genre » en extrayant, pour chaque sous-population, les propos jugés les plus illustratifs avant de les exporter et de les intégrer dans mon mémoire de thèse. La possibilité de trier et de (me) retrouver rapidement (dans) mes données a donc été d’une grande aide lors de la phase d’écriture.
En outre, ce sentiment d’avoir été « aidée » par le logiciel provient également du fait que les catégories thématiques et analytiques produites ont contribué à structurer le mémoire de thèse lui-même et nourri le travail rédactionnel. Par exemple, en comparant les temps de parole relatifs à une affirmation spontanément évoquée par une grande majorité de mes enquêté.es en tout début d’entretien (i.e. le trafic de stupéfiants et la délinquance d’usage de stupéfiants sont une « affaire d’hommes »), j’ai constaté que ce sujet semblait plus déterminé par l’appartenance de sexe du répondant que par son métier : les hommes interrogés ont passé beaucoup plus de temps que leurs homologues féminins à nier l’existence des femmes dans les affaires de stupéfiants. Même s’il s’est davantage agi d’une régularité révélée par le logiciel plutôt que d’une preuve parfaitement administrée, ce constat m’a aidée à construire le plan de ma seconde partie intitulée « Des façons de penser la délinquance des femmes sexuellement et/ou professionnellement situées ? ». J’ai en effet entamé mon analyse et ma démonstration en entrant d’abord par le genre des enquêté.es (comparaison des propos féminins et des propos masculins) et dans un second temps, par leur appartenance institutionnelle. Ce choix ne m’a pas été totalement induit par le logiciel, qui m’a plutôt permis de conforter la pertinence d’un de mes questionnements directeurs : si les deux catégories de sexe pensent différemment les femmes et leur délinquance et, sachant que les officier.ières de police judiciaire sont majoritairement des hommes et les magistrat.es majoritairement des femmes, dans quelle mesure les rapports hiérarchiques entre les deux groupes professionnels (le premier étant sous l’autorité du second) impactent-ils l’effet des représentations de genre sur la dynamique de visibilisation des femmes (potentiellement) justiciables ? Et il est effectivement ressorti de ce chapitre que la variable « sexe » n’était pas sans effet sur les façons de penser puisque le processus d’attribution de la responsabilité pénale s’est avéré sexuellement contrasté (une tendance masculine, chez les policiers comme chez les magistrats, à déresponsabiliser les femmes délinquantes croisées non seulement dans des affaires de stupéfiants mais également dans la délinquance en général). La fonction chronométrique de Sonal m’a donc aidée à asseoir mon plan et m’a confortée dans le choix d’analyser les propos sous l’angle de l’inscription institutionnelle dans un second temps pour in fine interroger l’articulation de l’effet des cultures professionnelles et de l’effet de l’appartenance de sexe sur les façons de penser les femmes et leur délinquance.
Un exemple de dénombrement heuristique proposé par Sonal ou quel usage peut-on faire des fonctions lexicométriques ?
L’un des résultats de mon travail a été de montrer que les représentations de la délinquance féminine en matière de stupéfiants s’appuient sur des profils types de délinquantes, avec cinq figures idéales-typiques (mules, « femmes de voyou », nourrices, consommatrices, trafiquantes) qui sont revenues presque systématiquement dans les entretiens – et ce, malgré la négation initiale presque collective de la présence des femmes dans les affaires de stupéfiants. J’ai en effet utilisé le logiciel pour dénombrer, dans les entretiens, les occurrences des différents termes utilisés pour qualifier les cinq catégories partagées et en quelques clics, j’ai pu consolider mon impression initiale, en montrant que les cinq figures apparaissaient bien dans la quasi-totalité des entretiens réalisés (Barbier, 2016 : 95). Grâce à la base de données permettant de filtrer les enquêté.es selon leurs caractéristiques, il m’a même été très simple d’expliquer pour quelles raisons (très probables) tel.le enquêté.e n’avait pas évoqué tel profil de délinquante (il semble par exemple logique qu’un.e officier.ière de police judiciaire travaillant à l’Office central de répression du trafic illicite de stupéfiants n’ait pas évoqué les consommatrices puisque la répression de l’usage ne fait pas partie de la mission de son service, en charge de traiter les trafics internationaux).
Entrer par les catégories renseignées dans la base de données m’a également permis de caractériser les discours sur chaque profil de femmes, en comparant le vocabulaire spécifique ou exclusif des policier.ières et magistrat.es des deux sexes. Le logiciel a alors fait ressortir des spécificités langagières illustratives des façons de penser les femmes et leur délinquance sexuellement différenciées ; des termes ou expressions particulièrement stéréotypés (« nanas », « gonzesses », « poupées », « crêpage de chignons », « heure des mamans ») n’étant pas unanimement partagés mais majoritairement (si ce n’est exclusivement) mobilisés par des hommes (policiers et magistrats). De plus, l’assertion selon laquelle les femmes seraient moins capables de violence que les hommes (car naturellement douces) et moins enclines à s’adonner à des comportements délinquants a aussi été retrouvée quasi exclusivement dans les propos masculins. Plus fondamentalement, le recours à la qualification de « victime » ou de « profiteuse » est lui aussi apparu très corrélé au sexe du répondant, plus qu’à sa position dans la chaîne pénale : les femmes policières et magistrates qualifiant par exemple souvent de « profiteuses » les mules ou les nourrices, et les hommes policiers et magistrats leur associant plus volontiers le statut de « victimes » – différence corrélée principalement aux représentations de genre sexuellement situées. C’est finalement un processus de responsabilisation sexuellement contrasté qui a pu être mis en lumière, avec une tendance masculine, chez les policiers comme chez les magistrats, à déresponsabiliser les femmes délinquantes croisées dans les affaires de stupéfiants mais également dans la délinquance en général. Par ailleurs, l’analyse lexicométrique a également pointé du doigt une tendance plus féminine à condamner moralement certains profils de femmes, comme les mères consommatrices de produits stupéfiants (souvent présentées par les femmes policières et magistrates comme « pires que des mauvaises mères ») ou les « femmes de voyou », souvent accusées par ces mêmes policières et magistrates de s’unir sciemment à des trafiquants précisément parce que l’activité de trafic augure un niveau de vie aisé.
Ces différentes « formes de dire » repérées grâce au logiciel ont ainsi mis au jour un des résultats principaux de mon travail : les façons de penser la culpabilité et la responsabilité pénale des femmes sont plus sexuellement que professionnellement situées et cela n’est pas sans conséquence sur la mise en visibilité des femmes dans la délinquance, étant donné d’une part la surreprésentation des hommes parmi les policier.ières et d’autre part, l’autonomie dont ces dernier.ières bénéficient, malgré leur position de subordonné.es aux magistrat.es du parquet (qui sont majoritairement des femmes). C’est finalement à la conclusion d’une moindre effectivité des représentations féminines des femmes et de leur délinquance que j’ai abouti et par là même, à l’invisibilisation de certains profils de femmes du phénomène délinquant au stade policier de la chaine pénale.
Ce serait exagéré d’affirmer que je ne serais pas arrivée à de tels résultats sans Sonal, mais c’est sans aucun doute ce logiciel qui m’a aidée à naviguer dans mes données au moment de l’analyse, en attirant mon regard vers des pistes que je n’aurais peut-être pas empruntées si rapidement.
Sonal propose également des fonctions d’analyse lexicométrique 21 et chronométrique 22 ainsi qu’une analyse de la dynamique de conversation sur la base d’un calcul de ratio des questions / réponses ou de la longueur moyenne des interventions de l’enquêteur et de ses enquêté.es. La diversité des fonctionnalités de ce logiciel permet ainsi aux utilisateurs de passer d’une analyse descriptive (que disent les répondants ?) à une analyse statistique plus inductive basée sur le vocabulaire (avec quels mots ?), sur les temps de parole (en combien de temps ?) ou sur la dynamique des conversations (avec quelle spontanéité ?). Ces différents outils ne servent cependant pas tant à administrer la preuve qu’à assister l’analyse compréhensive en faisant ressortir des singularités statistiques. Il va par exemple de soi que les résultats d’une analyse chronométrique dépendent de la situation d’enquête et de l’enquêteur lui-même. Les fonctionnalités de dénombrements proposées par Sonal ne font donc pas vraiment de lui un logiciel qui « trouve » en offrant à ses utilisateurs des preuves objectives à intégrer à leur raisonnement. Il n’en demeure pas moins un outil précieux, qui peut aider le chercheur à évaluer ses intuitions et lui suggérer des pistes d’analyses, en pointant de son doigt informatique des régularités, des originalités ou des improbabilités que le chercheur n’aurait pas de lui-même forcément envisagées ou alors bien plus tard dans le temps de sa recherche. Il permet en d’autres termes de « lire entre les lignes » (Lejeune, 2017). Au chercheur ensuite de faire le choix ou non d’emprunter les pistes suggérées pour son analyse et pour la confirmation (ou l’infirmation) de ses hypothèses.
Atlas.ti et Sonal habilitent donc le chercheur en accroissant l’efficacité des opérations de recherche qu’il accomplît ordinairement. Toutefois, à l’usage, il apparaît qu’ils ne font pas seulement plus, ou mieux qu’une paire de ciseaux et un tube de colle, mais différemment. Qu’elle tienne à un mot ne signifie pas pour autant que cette nuance soit superflue. Elle nous parait au contraire importante à explorer afin de préciser les risques potentiels qui découlent de l’usage de ces logiciels.
Ce que ces outils logiciels font aux processus de recherche : avantages et inconvénients de l’équipement technique du sociologue qualitatif
La compréhension des potentialités de ces logiciels est indissociable de celle des présupposés embarqués dans ces outils, dont la prise en compte permet d’entamer une discussion critique sur leurs usages. Ces logiciels font autrement qu’une paire de ciseaux et un tube de colle car leur fonctionnement repose sur un cadre théorique spécifique, la GTM (Glaser et Strauss, 1967), et notamment, en ce qui concerne Atlas.ti, sur l’idée selon laquelle l’établissement d’un rapport dynamique entre les codes et le matériau est un moteur efficace de l’analyse. Si Atlas.ti a été explicitement créé en référence à cette méthode par théorisation ancrée, ce n’est pas le cas s’agissant de Sonal (Alber, 2010 ; 2018) et c’est là un élément différenciant sensiblement ces deux logiciels, qui se ressemblent pourtant sur de nombreux autres aspects. Cela étant, selon l’utilisation que l’on fait de Sonal, il peut, au même titre qu’Atlas.ti, inscrire la démarche scientifique dans une « approche inductive par laquelle l’immersion dans les données empiriques sert de point de départ au développement d’une théorie sur un phénomène et par laquelle le chercheur conserve toujours le lien d’évidence avec les données de terrain » (Guillemette, 2006 : 33).
Cette méthode de recherche commune aux deux logiciels promeut ainsi une circulation permanente entre le terrain et les catégories par lesquelles on le saisit de manière moins inductive qu’abductive. En effet, alors que la méthode inductive fait émerger les propositions à partir d’une régularité des données, l’abduction permet d’envisager ces dernières dans une plus grande hétérogénéité, notamment en fonction de leur nature – verbatim, extrait de journal de terrain, extrait d’un « mémo » sur Atlas.ti et toutes sortes d’« indices » (Ginzburg, 1980) – avant d’être, dans un second temps, intégrées au sein d’une catégorie. Ces allers-retours entre les constructions théoriques et l’épreuve empirique sont alors le moteur de la recherche, par lequel on cherche à produire des concepts qui adhèrent au matériau récolté. De ces concepts, on réoriente nos façons de récolter et d’organiser le matériau (par exemple, en créant une nouvelle rubrique dans ses grilles d’observation ou de nouvelles questions dans son guide d’entretien). Le matériau nouvellement accumulé invite alors à redéfinir les concepts préalablement mis au jour.
Néanmoins, cette méthode permet in fine de produire des catégories d’analyse « ancrées » dans le terrain, au risque toutefois d’un hyper-empirisme. Les nombreuses occurrences auxquelles ces logiciels permettent d’accéder en quelques clics – au risque de conduire à une « folie analytique » (Seidel, 1992) – peuvent en effet rendre difficile le choix des exemples empiriques, qui ne repose alors plus seulement sur la mémoire du chercheur qui, d’ordinaire, suffit à sélectionner un exemple de terrain. De façon plus générale, la manipulation des catégories risque d’induire une naturalisation des codes attribués et de faire perdre de vue le caractère inévitablement subjectif du travail de qualification des matériaux opéré par le chercheur. Il ne faut pas perdre de vue que les logiciels ne font que traiter ce que les chercheurs leur « donnent à manger », que le processus de codage informatique ne fait que refléter le codage manuel (Kelle, 1997) et que cela relativise la portée probante des analyses qu’on en tire. Plus précisément, si la volonté de proposer des analyses qui reposent de manière stricte sur du matériau préalablement codé est optimale du point de vue de la rigueur scientifique, peut-être que le prix à payer est une frilosité à proposer des hypothèses imparfaitement étayées. Ce problème peut se conceptualiser dans l’alternative entre dépendance au sentier et sérendipité, définie comme découverte fortuite. On l’a dit, dans Atlas.ti comme dans Sonal, les codes, une fois qu’ils existent, peuvent toujours être révisés. Néanmoins, par le fait d’exister dans une base de données et de subsumer un ensemble d’extraits de documents méticuleusement (et souvent péniblement) codés, ces codes offrent au chercheur un confort qui pourra le conduire à emprunter un sentier de dépendance aux dépens de la rigueur que permet le logiciel 23 . Par exemple, face à un extrait d’entretien qui cadre à peu près avec un code existant, l’analyste pourra choisir de le lui attribuer plutôt que de recréer une catégorie, certes plus pertinente, mais qui se surajouterait et demanderait un travail rétroactif sur les précédents documents déjà codés et auxquels le nouveau code pourrait également s’appliquer. Ce sentier de dépendance jalonné par les codes existants ne favorise donc pas nécessairement l’inventivité du sociologue. Pire, la sérendipité risque d’être fortement mise à mal par un travail trop hâtivement cadré par des codes tout juste satisfaisants, à défaut d’être optimaux. Avec ces logiciels, on n’oublie rien, mais peut-être explore-t-on moins, du fait du confort des codes existants.
Si l’on met de côté ces limites, que l’on peut contourner par un travail de rigueur constante tout au long du processus d’analyse, il n’en demeure pas moins que ces logiciels transforment considérablement les pratiques ordinaires de recherche. Ainsi, certains écueils de ces outils sont relatifs aux effets-retours de ces logiciels d’analyse sur les moments de la recherche qui ne sont pas des moments d’analyse. Pour ne prendre qu’un exemple, le fait que le matériau soit codé peut inciter à anticiper ces codes dans les notes que le chercheur prend (sur le terrain, en séminaire, ou face à un ouvrage). Le chercheur habitué à ces logiciels se surprend ainsi à pré-formater ses documents pour faciliter le travail à venir sur le logiciel, ou à mener ses entretiens en anticipant la manière dont en seront thématisés les différents passages. Les paragraphes peuvent également tendre à épouser la forme de la citation à laquelle on attribuera un code. Enfin, peut-être a-t-on aussi moins tendance à noter dans notre carnet de terrain les éléments qui ne cadrent pas avec les codes tels qu’on les a déjà pensés. Nous ne prétendons pas que les précautions à prendre pointées ici sont exhaustives, et encore moins qu’elles rendent ces logiciels inefficaces. Nos expériences respectives de ces deux outils nous permettent plutôt d’affirmer que, si les opérations assistées par ordinateur sont faites rigoureusement et de manière réflexive, elles sont un réel atout dans le travail de recherche.
Conclusion. Pour une attention collective au processus d’analyse
Nous avons cherché dans ce texte à confronter, à travers nos recherches doctorales, nos manières d’équiper par des logiciels la phase d’analyse des données. Il ressort de notre analyse systématique des apports et des risques associés à l’usage concret de ces outils quelques grandes séries de remarques ou questions relatives aux corpus, aux interfaces et aux fonctionnalités. Concernant la constitution des corpus, d’abord : que faire des données issues de matériaux hétérogènes ? Est-il pertinent de classer, dans une même catégorie thématique, des données qui ont pour seul point commun d’évoquer des sujets identiques ? Qu’induit finalement l’abstraction de la nature des données au moment de l’analyse ? Ces questions se posent avec d’autant plus d’acuité pour Sonal, qui permet de travailler au plus près de l’oral, en ancrant l’analyse dans le son, là où Atlas.ti permet surtout de coder du texte. Sur le plan des interfaces, on a noté qu’il était possible, dans Atlas.ti, d’envisager des codes multiples pour un même segment de matériaux, quand Sonal produit des partitions à partir de deux niveaux de codages distincts (les thématiques et les mots-clés). Mais derrière ces manières différentes de rendre visibles les codes, ce sont deux façons de conceptualiser la phase d’analyse fondée sur deux définitions différentes des extraits et des codes. Enfin, les fonctionnalités des logiciels ouvrent vers des manières diverses d’opérationnaliser la réflexivité du chercheur en l’ancrant dans la phase d’analyse des données. Ainsi, les « mémos » dans Atlas.ti accompagnent l’élaboration sociologique d’un récit de recherche tout à fait original permettant d’envisager à nouveau frais l’analyse des données qualitatives en sciences sociales.
Ce vis-à-vis entre ces deux logiciels a également permis de synthétiser quelques différences entre analyse manuelle et analyse outillée pour comprendre les caractéristiques spécifiques des CAQDAS sur la conduite des opérations d’analyse. Au-delà de ce que la littérature a déjà montré, c’est à partir des opérations d’analyses concrètes, sur nos terrains de recherche, que ce texte a cherché à expliciter ce que Sonal et Atlas.ti peuvent faire, et ce que nous, sociologues, avons pu faire avec ces outils. En écoutant des enseignants peu familiers de ces outils, nous aurions pu craindre que ces logiciels autonomisent la phase d’analyse des matériaux – à la façon d’un pilote automatique – aux dépens d’une réflexivité que nous, jeunes chercheurs, aurions pu déployer lors de cette opération centrale qu’est l’analyse. Il semble finalement que l’inverse se soit produit, et que nos usages de ces logiciels nous aient rendus particulièrement vigilants quant à la façon de conduire une analyse en sciences sociales.
Ce paradoxe est d’autant plus saisissant qu’il nous semble finalement assez rare de s’arrêter sur l’opération d’analyse des matériaux pour relater le processus mis en œuvre à cette étape clé d’une recherche sociologique. Or, c’est pourtant dans cet exercice que peuvent s’effectuer des modifications d’ordres méthodologique et théorique, comme en atteste le retour sur l’usage de logiciel d’analyse qualitative qui, nous l’avons vu, a permis de clarifier quelques principes de cette analyse et de ses modalités concrètes dans nos travaux de thèse. Contrairement aux séminaires de recherche dont le format veut qu’on en vienne souvent d’emblée à l’exposé d’une démarche de recherche et à la formulation de résultats, cet article est aussi un plaidoyer pour inventer des espaces dans lesquels ralentir le regard et envisager des séances de travail autour de données « brutes » et du cheminement de leurs interprétations. Échanger collectivement et méthodiquement sur les façons dont les données ont été analysées, sur les façons dont elles ont été connectées à une littérature, à d’autres éléments de leur corpus, à des hypothèses ou encore à un cadre théorique, permettrait d’évoquer concrètement les problèmes, notamment méthodologiques, soulevés par l’analyse. Le développement de tels ateliers d’analyse dans lesquels les participants échangeraient autour de la pertinence des interprétations exposées et proposeraient d’autres voies / voix pour « faire parler le terrain », offrirait aux chercheurs un élargissement des champs des possibles analytiques. Ces espaces seraient aussi l’occasion de réfléchir collectivement aux systèmes qui structurent les connaissances et leur processus de production, et donc plus généralement, aux enjeux de l’interprétation des données en sciences sociales 24 .
Footnotes
Déclaration de conflit d’intérêts
Les auteurs déclarent n’avoir aucun conflit d’intérêt potentiel pour tout ce qui concerne le déroulement de la recherche, les droits d’auteur et/ou la publication de cet article.
Financement
Les auteurs n’ont bénéficié d’aucun soutien financier particulier relatif au déroulement de la recherche, à leurs droits d’auteur et/ou à la publication de cet article.
