Ce travail a pour objectif de construire des LGG-graphes représantant des structures lexico-syntaxiques de textes donnés, qui jouent un rôle crucial dans l'extraction d'information sémantique à partir de pages web de domaines spécifiques. La méthodologie nommée LGG(Local-Grammar Graph) a été conçue par le linguiste Maurice Gross au LADL/IGM: c'est un modèle linguistique proposé pour décrire des phénomènes locaux au niveau lexico-syntaxique, mais aussi c'est un cadre méhodologique adapté à l'application de ressources linguistiques au traitement informatique, notamment à l'analyse morpho-syntaxique ou à l'extraction de terminologie ou d'information grâce à un outil qui transforme ces ressources en automates(ou transducteurs) finis. UNITEX est un outil spécialement développé pour cette procédure à l'Université de Marne-la-Vallée(S. Paumier 2003).
Dans ce travail, nous avons étudié d'abord les caractéristiques lexico-syntaxiques de textes d'un journal électronique JUNJA SINMUN spécialisé dans les domaines de l'Informatique & Technologie: le vocabulaire et les structures syntaxiques des expressions s'observent de nature extrêmement limitée. Ensuite après une introduction rapide de la méthodologie LGG et du système UNITEX, nous avons montré comment construire des LGG graphes pour les textes donnés. Pour l'instant, notre travail est concentré à discuter sur la procédure de la construction des LGG graphes représentant des aspects lexico-syntaxiques, mais dans un travail ultérieur si on examine un résultat d'application de ces LGGs à un traitement automatique comme l'extraction d'information, on pourra évaluer de façon plus concrète l'avantage de cette approche sur d'autres méthodologies basées sur un calcul statistique ou un apprentissage automatique.