Saisie des données

Jusqu’ici nous avons examiné des données présentes dans notre ordinateur.
Mais malheureusement, une grande partie du travail d’historien est la recherche, ingrate, dans les archives, l’examen de documents anciens exhumés des fonds, (quelquefois en vieil allemand gothique - horreur), la consultation de formulaires administratifs, 100 ou 200, peut-être 1000 ou 2000 exemplaires.

Donc, avant tout traitement informatique, il faut que les informations à traiter soient d’abord numérisées. Même dans les cas utilisés précédemment, il y a bien eu une Hélène Georger-Vogt qui a passé des années à réaliser l’inventaire des archives De Dietrich, de même que l’équipe de la SHARE a passé des années à constituer le fonds photothèque, les photos, mais aussi et surtout à assurer l’identification précise de chaque photo.

En résumé, pour tout corpus d’avant les années 1960, il y a nécessairement une opération de saisie (ou numérisation).

L’exemple que nous examinons dans ce chapitre date des années 50, et il est typique des recherches dans les archives :
« Enquête sur les enfants "bien doués", mais qui n’ont pas poursuivi des études. »
Cette étude concerne les enfants qui avaient une réussite scolaire excellente ou bonne et qui furent néanmoins mis directement au travail. Elle faisait partie de la politique de l’époque qui visait à faire entrer tous les enfants en 6ième.

En 2023 a été proposé une étude secondaire des matériaux de l’enquête de l’INED (1955) [1].

Basée sur les données de cette enquête, cette deuxième étude s’efforce de déterminer les motifs profonds, d’ordre matériel et psychologique, qui ont pu empêcher ces adolescents de recevoir l’instruction qu’ils semblaient mériter par leurs aptitudes.

Nous n’examinons pas ici les résultats des analyses, qui sont du domaine de la sociologie et des sciences de l’éducation, mais les moyens mis en œuvre pour assurer la saisie des informations.

On été sélectionnés 940 dossiers des 1646 du corpus, composés des pages du questionnaire, remplies manuellement, par des instituteurs ou des inspecteurs de l’Éducation Nationale.
Il faut remarquer que la construction du questionnaire n’est pas très pratique, dans ces années-là l’informatique existait à peine, et les promoteurs de cette enquête en étaient assez loin, ils étaient peut-être bon instit, mais piètre statisticien (voir contenu détaillé du questionnaire).

Aide à la saisie

Comme tous les dossiers sont identiques, et basés sur un seul document (formulaire), la meilleure solution est une grille de saisie construite sur un tableur. Chaque questionnaire devient une ligne du tableur, chaque question une colonne et pour faciliter la manipulation chaque type de page du questionnaire est une feuille du tableur.

Exemple de feuille "enquête"
Exemple feuille "enfant observé"

Par formulaire, environs 80 « champs » de saisie, certains à plusieurs lignes (ex : composition de la famille), mais beaucoup peuvent être standardisés oui/non, position famille, dates etc., ce qui permet de réaliser des aides à la saisie par les fonctions du tableur. En effet, le tableur utilisé dispose de multiples fonctions de contrôle et d’aide de la saisie.
Exemple : Contrôles de dates : contrôler des plages de dates (de/à en général)

Exemple : Liste de choix  : proposer une liste de valeurs pouvant être saisies

Liste composition famille
Saisie niveau d’études

Exemple : guide de saisie (ci_dessus) : Au minimum, des indications peuvent être fournies pour guider la personne qui effectue la saisie.

Ces aides peuvent, en général, être mises en œuvre sur plus de la moitié des champs de saisie, et à la fois aider la saisie, guider la personne qui réalise la saisie, mais aussi contrôler les informations.

Commentaires (notes)

Dans tout corpus d’avant 1960, questionnaire, fonds d’archive, etc., donc manuel (manuscrit), le rédacteur (enquêteur…) insère en général des commentaires, ou notes, donnant des informations complémentaires ou pour préciser certaines informations. Souvent, il s’agit aussi d’appréciations ou opinions personnelles du rédacteur.
Ces notes sont primordiales, car elles donnent souvent des informations plus importantes que la simple réponse à un questionnaire.

En général, les tableurs ont une fonction permettant d’attacher une note à chaque cellule des tableaux. Dans l’exemple ci-dessus, sur une douzaine de lignes de formulaire, nous avons 28 notes (petits triangles rouges).

Attention : les notes ci-dessous en exemple ne sont pas des commentaires de celui qui saisit de nos jours (Jérôme Krop), mais les notes manuscrites de l’enquêteur qui réalise l’entretien dans les années 1950.

Quelquefois trois notes résument une vie : uniquement sur la base des informations saisies dans les champs, on sait que cette petite fille est devenue ouvrière agricole, sans orientation extérieure ni avis ou conseil.
Par les notes, on a la vision d’une vie peut-être gâchée.

Ce sont souvent les notes qui donnent une consistance, une réalité, à des enquêtes comme celle-ci, et qui peuvent être à la source de recherche plus précises ou « d’affinage » des conclusions.
Remarque : Par expérience, tout système de saisie de fonds doit obligatoirement comporter un dispositif de saisie de notes.


[1Girard Alain, Bastide Henri. Orientation et sélection scolaires : une enquête sur les enfants à la sortie de l’école primaire. In :
Population, 10 ? année, n°4, 1955. pp. 605-626 ;
doi : 10.2307/1525255
https://www.persee.fr/doc/pop_0032-4663_1955_num_10_4_4487