La recherche en milieu polaire : corpus documentaires et méthodologie

Publié le 06.08.2007

Portant sur près de 50 000 références bibliographiques, avec une antériorité de vingt ans, les données bibliométriques sont issues d’articles de chercheurs publiés entre 1987 et 2006, dans 2 500 journaux scientifiques.

Les références bibliographiques sont issues de la base de données Web of Science qui est produite par Thomson Scientific - ISI et qui couvre tous les domaines de la science.

 Interrogation de la base de données :

Pour chaque corpus, les recherches de documents ont été réalisées à l’aide de termes géographiques (et du nom des ethnies pour le domaine des sciences humaines). Près de 500 noms de régions, îles, mers, massifs montagneux, glaciers, formations géologiques diverses, ont été utilisés.

 Préparation des données :

Après reformatage en XML, les références bibliographiques ont été ventilées dans l’un des cinq domaines de recherches :

  • Astronomie - Recherche spatiale
  • Climatologie - Océanographie - Glaciologie
  • Géologie
  • Biologie (sauf l’Homme)
  • L’Homme : Sciences humaines et sociales, Médecine

Plusieurs approches complémentaires ont été nécessaires pour effectuer cette ventilation :

  • un premier filtrage a consisté à utiliser la classification des revues scientifiques de l’ISI par thématiques de recherche : les "Journal Subject Categories" (environ 110 catégories)
  • un second filtrage a permis de classifier les données en grands domaines grâce à des termes spécifiques à chacun d’entre eux
  • enfin, des spécialistes de chaque domaine ont relu les titres des articles pour valider les attributions des domaines.

Les deux corpus documentaires regroupent 47 295 références dont :

  • 30 477 références bibliographiques pour le pôle Nord issues de 2 412 revues ;
  • 17 318 références bibliographiques pour le pôle Sud issues de 1 344 revues.

Le nombre total de titres de revues dans les deux corpus est de 2 879.