Document viewer » josDBlog

Archives du tag : Document viewer

Principes d’une chaîne de traitements UIMA

par Laurent publié le 21 mars 2012

L’objectif d’une chaîne de traitements UIMA est d’extraire de façon automatique des informations structurées à partir d’un document non structuré (texte, image, vidéo, etc.). Une chaîne de traitements UIMA respecte généralement les étapes suivantes :

Charger un document non structuré (comme le texte du Petit Prince de Saint-Exupéry dans l’illustration ci-dessous).
Générer le schéma d’annotation commun (Common Analysis Structure ou CAS) qui encapsulera toutes les annotations concernant le document analysé, ainsi que le document lui-même.
Enchaîner les composants d’annotation (un segmenteur, un analyseur d’entités nommées et un annalyseur morpho-syntaxique dans l’illustration ci-dessous).
Générer une sortie (généralement un fichier xmi) à partir des annotations contenues dans le CAS (le fichier xmi généré est visualisé dans l’outil UIMA Document Viewer dans l’illustration ci-dessous).

Introduction au TALN, aux plateformes d’annotations linguistiques et à UIMA
Sommaire UIMA sur ce blog

Publié dans UIMA, TALN | Tagué Analysis engine, CAS, Document viewer | Laisser un commentaire

josDBlog

le blog de Laurent (Informatique, Domotique…)

Archives du tag : Document viewer

Principes d’une chaîne de traitements UIMA

Livres

National Geographic

Chercher un article

Liste des Catégories

Archives

A propos de l’auteur

Méta