La technologie de l’hypertexte Analyse bibliométrique de brevets
Mis à jour le 25 octobre 2018
logo imprimer     

Communication dans un colloque national avec actes (C-ACTN)

PILLET V., LEVEILLE V., QUONIAM L. & ROSTAING H. (1999). "La technologie de l’hypertexte Analyse bibliométrique de brevets". Actes du colloque: Journées sur l’Information élaborée, Ile Rousse, France : Société Française de la Bibliométrie Appliquée, 27 sept - 01 oct  

Membre(s) IRSIC impliqué(s) :
 
Résumé :

L’hypertexte est un mode de présentation de l’information aujourd’hui très répandu. Qu’il soit utilisé en tant que structuration de la documentation technique ou présentation des données sur Internet, l’hypertexte est utilisé dans de nombreux domaines. Son application à la gestion des informations de veille est très séduisante par sa capacité à produire de l’information endogène : information non présente dans le dossier mais issue du croisement de deux informations. Deux freins majeurs ont cependant retardé la généralisation de l’utilisation d’hypertextes en veille :
- Les limites liées à l’édition manuelle des liens. D’une part, lier manuellement deux documents impose une bonne connaissance du contenu de la base. D’autre part, le temps utilisé pour la création manuelle serait inacceptable dans un processus de veille.
- Le manque de vision globale. Le manque de vue d’ensemble du corpus est à l’encontre de ce qui est requis d’un outil de veille. L’hypertexte classique présente uniquement des liens entre documents, sans outils de cartographie ou de classement du corpus.
De nombreuses recherches s’effectuent dans le domaine de la génération automatique d’hypertextes. L’objet de cet article est de préciser ce que la notion d’hypertexte recouvre dans le domaine technologique et industriel.
Après avoir brièvement rappelé les différentes notions se rapportant à l’hypertexte, nous présenterons une étude portant sur un ensemble de plus de 200 brevets extrait de la base de données WPIL. Tous ces brevets traitent des différentes technologiques utilisées dans le domaine de l’hypertexte. Pour cela, nous utiliserons une méthode originale de réduction du vocabulaire (phase de lemmatisation) sur plusieurs champs du corpus. Celle-ci est faite à l’aide d’un dictionnaire comportant plus de 50 000 termes édité par le producteur de la base de données Derwent. L’homogénéisation des champs étudiés est nécessaire car les résultats des analyses statistiques sont souvent erronés à cause des variétés des formes graphiques présentes dans les corpus. La préparation des données, notamment le découpage du titre en deux parties, permettra d’extraire les notions se rapportant à la description et à l’application des brevets, deux notions que ne différencient pas Derwent dans son champ TT. Après cette phase préliminaire, l’étude bibliométrique proprement dite portera sur les champs Title (TI1 : decription, et TI2 application), Use and Advantage (UA) et Patent Assignee (PA). Nous terminerons notre étude par une analyse des réseaux sémantiques de chacun de ces champs. Nous tenterons ainsi de faire émerger les thématiques principales se rapportant à l’hypertexte tant du point de vue descriptif, applicatif que des revendications contenues dans les brevets.
Nous présenterons enfin ce corpus sous l’interface Regate. En intégrant les champs lemmatisés Description, Application et Revendication, l’utilisateur pourra ainsi naviguer entre ces trois univers documentaires. Ceci serait difficilement possible avec des brevets bruts fournis par Derwent ou avec des hypertextes construits après analyse classificatoire


Mots-clés :

Hypertexte, analyse bibliométrique, réseaux sémantiques, analyse brevet, lemmatisation


puce Contact puce Espace rédacteurs puce RSS puce SPIP puce ESCAL-V3
Institut de Recherche en Sciences de l'Information et de Communication
21, rue Virgile Marron - 13392 Marseille Cedex 05
2012 - Aix Marseille Université - Tous droits réservés