[go: up one dir, main page]

WO2006032735A1 - Systeme et procede automatique de recherche d'informations dans une base de connaissances - Google Patents

Systeme et procede automatique de recherche d'informations dans une base de connaissances Download PDF

Info

Publication number
WO2006032735A1
WO2006032735A1 PCT/FR2004/002386 FR2004002386W WO2006032735A1 WO 2006032735 A1 WO2006032735 A1 WO 2006032735A1 FR 2004002386 W FR2004002386 W FR 2004002386W WO 2006032735 A1 WO2006032735 A1 WO 2006032735A1
Authority
WO
WIPO (PCT)
Prior art keywords
suggestions
dialogue
user
links
information
Prior art date
Application number
PCT/FR2004/002386
Other languages
English (en)
Inventor
Carole Manquillet
Jean-Pierre Le Pape
Philippe Bretier
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Priority to PCT/FR2004/002386 priority Critical patent/WO2006032735A1/fr
Publication of WO2006032735A1 publication Critical patent/WO2006032735A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation

Definitions

  • the present invention relates to an automatic system and method, as well as the associated software product, for searching information in a knowledge base by dialogue between a user and the system.
  • a knowledge base is a structured set of data in which the data is grouped into classes and subclasses, which are linked together by semantic relations.
  • a "human being” class is defined as well as a "date” class. Between these two classes, it is possible to define a "birth date” relationship such that an entity, or instance, of the "human being” class is linked to a date, corresponding to the date of birth of that entity.
  • the grouping by classes and subclasses is such that, for example, if "stock object” is a class then the possible subclasses are “stock”, “index” and “currency”, the US dollar and the euro being then instances of the subclass "currency”.
  • the first search mode uses keywords. It has been popularized by Internet search engines like Google (trademark of Google, Inc.). It is based on the indexing of knowledge objects (for example web documents) based on keywords mentioned. In general, the documents found are ordered according to their relevance to the keywords mentioned or to a Boolean combination of them.
  • the second mode of research is directed research.
  • the search for the user is guided by the system that unfolds one of the pre-established sequences and offers him to choose among the proposed attribute values to reach an object or a subset of objects.
  • the object of the invention is therefore to overcome this disadvantage.
  • the object of the invention is an automatic system for searching information in a knowledge base by dialogue between a user and the system comprising
  • man-machine interface means capable of enabling the exchange of information between the user and the system in the form of a dialogue, connected to
  • storage means able to preserve the history of the dialogue between the user and the system, characterized in that it also comprises
  • Another object of the invention is an automatic process for searching information in a knowledge base by dialogue between a user and a system comprising the steps of
  • Another object is a software product recorded on a storage medium for implementation by a computer acting as a dedicated equipment of the system and the automatic process of searching for information.
  • the ontological views are stored in the form of a logical tree structure such that, seen from a node corresponding to a class, the link between the corresponding class and its subclasses corresponds to links Exclusive OR and the relations between this node and other classes of the knowledge base correspond to AND links, the root of the tree being the focus object of the ontological view;
  • the means for projecting the dialogue on the ontological view comprise first means for traversing the tree representing the ontological view of the focus object towards the semantic guidance objects and second means for traversing the tree from the objects. guiding identify and lower all AND links from the current node and down the exclusive OR links corresponding to elements listed in the dialog;
  • the means for storing the history of the dialogue comprise structured storage means capable of memorizing in the form of a graph all the semantic concepts referenced in the current state of the search dialog;
  • the means of formatting the suggestions are able to sort the suggestions into a first category of closed questions and into a second category of open questions. According to other characteristics of the process
  • an ontological view being structured in the form of a logical tree whose root is the focus object, the links between the classes and their subclasses of the OR knowledge base and the relationships of the knowledge base of the AND links, the projection of the dialog information on the ontological view includes the steps of:
  • the formatting of suggestions includes the step of sorting the suggestions into a first category of closed questions and a second category of open questions.
  • FIG. 1 is the diagram of an automatic system according to the invention
  • FIG. 2 is the representative graph of an exemplary knowledge base
  • FIG. 3 is the representative graph of an ontological view extracted from the knowledge base of FIG. 2;
  • FIG. 4 is a flowchart for projecting the dialogue on an ontological view
  • FIG. 5 is a process flow chart according to the invention.
  • An automatic system 1 for searching information of a knowledge base by dialogue between a user and the system comprises, in FIG. 1, classically means 2 of human-machine interface allowing the user to ask his question as well as to clarify it as the dialogue progresses and, on the other hand, allow the system to present the answers found and, if necessary, to ask questions to clarify the purpose of research.
  • this human-machine interface comprises an input keyboard and a display screen. It can also be voice-based with a voice recognition module capable of interpreting user-spoken sentences and a speech synthesis module capable of phonetically generating the system feedback sentences.
  • these interface means 2 are connected to means 3 for analyzing the sentence making it possible to detect the focus of the latter, as well as the properties of that -this.
  • the focus is the intention of the speaker. It is determined by the syntactic and semantic analysis of the sentence.
  • the focus search is described in the application FR 2 787 902 of the applicant.
  • the focus concretely translates into a word. It differs from a keyword in that the focus may not appear as such in the sentence. For example, in the middle of a dialogue, the question "what is the age of this person? Has as a focus "Mr Dupont" who is the person referenced by the "this” and therefore known by a previous sentence of this dialogue.
  • the properties of the focus correspond to the precisions provided by the user. In the above example, the focus property is the age of the focus.
  • the automatic information retrieval system constructs a dialogue with the user in order to specify his request and thus best meet his expectations.
  • the storage of this history is done in the form of a graph of which each node is a property.
  • the graph is called the state of the dialogue or semantic sharing graph.
  • the system also includes means 5 for storing at least one ontological view of the knowledge base 6.
  • An ontological view is a partial view of the ontology of the domain of knowledge.
  • ontology is the representation of the sum of knowledge and the definition of all categories by a single set of logical relationships.
  • an ontological view is a partial representation of a knowledge base from a certain point of view. It is therefore an extraction of classes and relationships from the knowledge base from a theme, or a focus or focus object. The classes and relationships of the knowledge base are then reorganized as a tree structure whose focus object is the root.
  • figure 2 gathering information on finance and geography, it is possible to define an ontological view, figure 3, in relation to the topic "course” by extracting and organizing knowledge base information on this issue.
  • An ontological view is therefore defined in relation to its focus, that is to say the theme on which the extraction and organization of this one is based.
  • "course" is the focus of the created ontological view.
  • the ontological view can be represented, figure 3, in the form of a tree whose focus is the starting point, the root.
  • the links between classes and their subclasses and relationships correspond to tree links with particular properties and are noted differently in a graphical representation of the tree.
  • the subclass link is noted as an arrow pointing to the main class while the relationship link is non-directional.
  • Another representation of an ontological view uses a description language.
  • FIG. 3 can be described by: km_model_vers (1.0, 'stock market application'). km_focus (course).
  • index_bourse index, city
  • index_country index, country
  • pad_in city, country
  • km_object__restrict stock object, 1).
  • km_priorite_restrict index, [index, city, country]
  • km_rest_forbidden [broker_object, instances]).
  • km_profondeur_rest (1).
  • km_nb_restrict (2).
  • km_view_model (node, expression) defines the links in "expression" of the node “node” with the other nodes or leaves.
  • the node "index” has logical relationships with “city” and “country” knowing that "city” has a logical relation of type "paddock-in” with “country”.
  • the logical links are thus branches of the tree connecting two nodes. These links are of two types: the first type is defined by the link between the classes and their subclasses and the second type is defined by the logical relations between the instances of these classes.
  • Each ontological view also includes a certain number of parameters allowing an optimal use thereof by the tools described hereinafter.
  • the scanning depth of the graph is restricted to a single level.
  • the scan is limited to the nodes "index”, “city” and “country”.
  • Selection means 7, FIG. 1, look for the relevant ontological view (s) according to the request of the user.
  • the selection is made by searching ontological views whose focus corresponds to the focus entered.
  • the system comprises means 8 for projection of the dialogue on this ontological view.
  • the projection of the dialogue on the ontological view is understood to mean the operation of scanning and traversing the ontological view from the focus node, for the purpose of unification, which, in FIG. 4, in a first step in search of the object semantic guidance, that is to say the objective deduced by the process of the intention of the user, so the focus. As a rule, the focus and the semantic guidance object are therefore merged. Then, in a second step, steps 11 to 15, and from the semantic guidance node, the projection traverses the node tree in a node, recursively. For each node encountered, the projection identifies and descends all relationship links, considered as AND links, possible from the current node.
  • the means 8 of projection of the dialogue on the ontological view thus generate a list of objects of suggestion.
  • the settings of the ontological view are used by the projection means to refine and limit the path in the nodes of the ontological view. This is the parameter that limits the search depth in the graph or the semantic guidance object.
  • the list of suggestion objects provided by the projection means includes all possible suggestions.
  • This list of suggestions includes, in the form of a data structure, for each suggestion, the object to which the suggestion relates, the list of possible responses for the user, as well as the extension of the dialogue to be performed, c ' that is, the new semantic element to share with the user, if this message is to be really proposed.
  • This list must be sorted so as to respect the priorities attached to the ontological view, if such a parameterization exists, and also so as to be as relevant as possible with respect to the present state of the dialogue.
  • the list is divided into three sub-lists: - a first sub-list contains suggestions where choices can be declined in an exhaustive way. This corresponds to closed questions, that is, questions containing the answer in the form of a list of choices such as "Are you interested in A, B or C? ". Suggestions in this sub-list therefore have possible responses stored in memory corresponding to subclasses or instances of the class.
  • a second sub-list contains, among the remaining suggestions, those which, if retained, correspond to sheets of semantic sharing graph. This corresponds to open questions, that is, questions whose answer is not a choice in a list, dealing with elements of which nothing is known in the current context of the dialogue.
  • the third sub-list corresponds to the suggestions not classified in the previous sub-lists.
  • the first sub-list is used in priority to define the possible questions, then the second sub-list and finally the third sub-list so as to keep only a predefined maximum number of simultaneous suggestion messages which are then presented to the user by the man / machine interface
  • This example uses the knowledge base of FIG. 2 and the ontological view associated with it represented in FIG. 3.
  • This ontological view has as its focus object “COURSES” and as an ontological guidance object “STOCK OBJECT”.
  • the other parameters of the ontological view are the scanning depth set at 1 level and the prohibition to make suggestions on instances of "OBJECT STOCK”.
  • Index being fixed, it corresponds to a descent of a level in the ontological view.
  • the parameters of the dialogue defining the maximum number of questions to 2 (km_nb_restrict (2)) the process retains the first two suggestions: the set of instances of "index” corresponding to a first open question and all instances of "City” for a second open question. «User: Paris»
  • the system thus proposes all instances of "index” corresponding to the city "Paris”.
  • the automatic process for searching information in a knowledge base by dialogue between a user and the system comprises the steps of

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

Ce système (1) automatique de recherche d'informations dans une base de connaissance par dialogue entre un utilisateur et le système comporte des moyens (2) d'interface connectés à des moyens (3) d'analyse des phrases pour détecter le focus et ses propriétés, connectés à des moyens (4) de stockage de l'historique du dialogue entre l'utilisateur et le système, et des moyens (5) de stockage d'au moins une vue ontologique de la base de connaissances (6), connecté à des moyens (7) de sélection d'une vue ontologique à partir du focus, connectés à des moyens (8) de projection du dialogue sur la vue ontologique sélectionnée pour fournir une liste de suggestions possibles, connectés à des moyens (9) de sélection et de mise en forme des suggestions pour trier la liste des suggestions en au moins deux catégories, la première catégorie étant les suggestions dont les choix sont déclinables de façon exhaustive et la seconde catégorie étant les suggestions correspondant à des éléments non connus.

Description

Système et procédé automatique de recherche d'informations dans une base de connaissances.
La présente invention concerne un système et un procédé automatiques, ainsi que le produit logiciel associé, de recherche d'informations dans une base de connaissances par dialogue entre un utilisateur et le système.
De manière classique, on appelle base de connaissances un ensemble structuré de données dans lequel les données sont regroupées par classes et sous-classes, celles-ci étant reliées entre elles par des relations sémantiques. Par exemple, dans une base de connaissances, une classe « être humain » est définie ainsi qu'une classe « date ». Entre ces deux classes, il est possible de définir une relation « Date de Naissance » telle qu'une entité, ou instance, de la classe « être humain » est reliée à une date, correspondant donc à la date de naissance de cette entité. Le regroupement par classes et sous- classes est tel que, par exemple, si « objet boursier » est une classe alors les sous-classes possibles sont « action », « indice » et « devise », le dollar américain et l'euro étant alors des instances de la sous-classe « devise ».
Parmi les différentes techniques de recherche d'informations dans des bases de connaissances et, plus généralement, dans un ensemble de données, par un utilisateur, dans un environnement interactif, deux modes sont privilégiés :
Le premier mode de recherche utilise des mots-clés. Il a été popularisé par des moteurs de recherche sur Internet comme Google (marque déposée de Google, Inc). Il est basé sur l'indexation des objets de connaissance (par exemple des documents Web) à partir de mots clés cités. En général, les documents trouvés sont ordonnés selon leur pertinence par rapport aux mots clés cités ou à une combinaison booléenne de ceux-ci.
Le second mode de recherche est celui de la recherche dirigée.
Pour la recherche dirigée, des enchaînements pré-établis sont définis pour un périmètre donné d'applications telles que des assistants déroulant des étapes. Ces enchaînements reposent sur des données prédéfinies qualifiant les objets de connaissances. Ces données sont soit des classifications plus ou moins rigides telles qu'une hiérarchie de rubriques et de sous rubriques de recherche ou des menus et sous menus, soit des attributs spécifiques éventuellement accompagnés de leurs valeurs possibles (recherche par formulaires / sous formulaires).
La recherche de l'utilisateur est guidée par le système qui déroule l'un des enchaînements pré-établis et lui propose de choisir parmi les valeurs d'attributs proposées pour atteindre un objet ou un sous-ensemble d'objets.
Ces deux modes de recherche ont l'inconvénient de n'offrir qu'un guide très limité pour aider l'utilisateur. Dans le cas des mots clés, la pertinence des documents trouvés est basée sur une représentation de l'espace de recherche limitée à une liste non structurée de mots clés. Dans le cas d'une recherche dirigée, le questionnement de l'utilisateur et sa progression sont limités par la structure et l'organisation pré-établie.
Le but de l'invention est donc de remédier à cet inconvénient. L'objet de l'invention est un système automatique de recherche d'informations dans une base de connaissance par dialogue entre un utilisateur et le système comportant
- des moyens d'interface homme-machine aptes à permettre l'échange d'informations entre l'utilisateur et le système sous forme d'un dialogue, connectés à
- des moyens d'analyse des phrases saisies par l'utilisateur aptes à détecter dans lesdites phrases le focus et ses propriétés, connectés à
- des moyens de stockage aptes à conserver l'historique du dialogue entre l'utilisateur et le système, caractérisé en ce qu'il comporte en outre
- des moyens de stockage d'au moins une vue ontologique de la base de connaissances, connectés à
- des moyens de sélection d'au moins une vue ontologique stockée à partir d'au moins un focus saisi par l'utilisateur et stocké dans les moyens de stockage du dialogue, connectés à
- des moyens de projection du dialogue sur la vue ontologique sélectionnée aptes à fournir une liste de suggestions possibles, connectés à
- des moyens de sélection et de mise en forme des objets de suggestions aptes à trier la liste des suggestions en au moins deux catégories, la première catégorie étant les suggestions dont les choix sont déclinables de façon exhaustive et la seconde catégorie étant les suggestions correspondant à des éléments non connus, et à fournir aux moyens d'interfaces homme-machine une liste triée de questions à présenter à l'utilisateur.
Un autre objet de l'invention est un procédé automatique de recherche d'informations dans une base de connaissances par dialogue entre un utilisateur et un système comportant les étapes de
- acquisition des informations en provenance de l'utilisateur,
- analyse de ces informations pour en extraire le focus et ses propriétés,
- sélection d'une vue ontologique à partir d'au moins un focus provenant de l'utilisateur, cette sélection étant faite sur un ensemble de vues ontologiques préalablement définies,
- projection des informations du dialogue sur la vue ontologique sélectionnée pour obtenir une liste de toutes les suggestions possibles,
- sélection des suggestions à présenter par tri de la liste des suggestions en au moins deux catégories, la première catégorie étant les suggestions dont les choix sont déclinables de façon exhaustive et la seconde catégorie étant les suggestions correspondant à des éléments non connus,
- mise en forme des suggestions, et
- présentation des suggestions à l'utilisateur. Un autre objet est un produit logiciel enregistré sur un support de mémorisation pour la mise en œuvre par un ordinateur faisant office d'équipement dédié du système et du procédé automatique de recherches d'informations.
Suivant d'autres caractéristiques du système : - les vues ontologiques sont stockées sous forme d'une structure logique arborescente telle que, vu d'un nœud correspondant à une classe, le lien entre la classe correspondante et ses sous-classes correspond à des liens OU exclusif et les relations entre ce nœud et d'autres classes de la base de connaissances correspondent à des liens ET, la racine de l'arbre étant l'objet focus de la vue ontologique ;
- les moyens de projection du dialogue sur la vue ontologique comportent des premiers moyens de parcours de l'arbre représentant la vue ontologique de l'objet focus vers les objets de guidage sémantique et des seconds moyens de parcours de l'arbre à partir des objets de guidage aptes à identifier et descendre tous les liens ET à partir du nœud courant et à descendre les liens OU exclusif correspondant à des éléments cités dans le dialogue ;
- si les seconds moyens de parcours de l'arbre rencontrent des liens OU exclusif dont aucun ne découle de la requête, alors une suggestion de choix sur ces liens est proposée, et si aucun lien OU exclusif n'est rencontré dans une branche de l'arbre, alors une suggestion de choix est proposée sur les instances de la classe courante ;
- les moyens de stockage de l'historique du dialogue comportent des moyens de stockage structurés, aptes à mémoriser sous forme d'un graphe tous les concepts sémantiques référencés dans l'état courant du dialogue de recherche ;
- les moyens de mise en forme des suggestions sont aptes à trier- les suggestions en une première catégorie de questions fermées et en une seconde catégorie de questions ouvertes. Suivant d'autres caractéristiques du procédé
- une vue ontologique étant structurée sous forme d'un arbre logique dont la racine est l'objet focus, les liens entre les classes et leurs sous-classes de la base de connaissance des liens OU exclusif et les relations de la base de connaissances des liens ET, la projection des informations de dialogue sur la vue ontologique comporte les étapes de :
- recherche à partir de la racine de l'objet de guidage,
- parcours récursif de l'arbre à partir de l'objet de guidage de façon à identifier et descendre tous les liens ET à partir du nœud courant et identifier et descendre les seuls liens OU exclusif correspondant à des éléments du dialogue ;
- lors du parcours de l'arbre, la rencontre d'une classe possédant des liens OU exclusif vers ses sous-classes dont aucune ne correspond à un élément du dialogue génère la création d'une suggestion de choix sur ces liens et la rencontre d'aucun lien OU exclusif sur une branche de l'arbre génère la création d'une suggestion de choix sur les instances de la classe courante ;
- après l'analyse des informations en provenance de l'utilisateur, les concepts sémantiques de celles-ci sont stockés dans un historique de dialogue structuré sous forme d'un graphe représentant l'état courant du dialogue de recherche ; - la mise en forme des suggestions comporte l'étape de tri des suggestions en une première catégorie de questions fermées et une seconde catégorie de questions ouvertes.
L'invention sera mieux comprise à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple, et faite en se référant aux dessins annexés sur lesquels :
- la figure 1 est le schéma d'un système automatique selon l'invention ;
- la figure 2 est le graphe représentatif d'un exemple de base de connaissances ; - la figure 3 est le graphe représentatif d'une vue ontologique extraite de la base de connaissances de la figure 2 ;
- la figure 4 est un ordinogramme de projection du dialogue sur une vue ontologique ;
- la figure 5 est un ordinogramme de procédé selon l'invention. Un système 1 automatique de recherche d'informations d'une base de connaissances par dialogue entre un utilisateur et le système comporte, figure 1 , classiquement des moyens 2 d'interface homme-machine permettant d'une part à l'utilisateur de poser sa question ainsi que de préciser celle-ci au fur et à mesure de l'avancement du dialogue et permettant, d'autre part, au système de présenter les réponses trouvées ainsi que, si nécessaire, de poser des questions permettant de préciser l'objet de la recherche.
Classiquement, cette interface homme-machine comprend un clavier de saisie et un écran de visualisation. Elle peut aussi être basée sur la voix avec un module de reconnaissance vocale capable d'interpréter les phrases prononcées par l'utilisateur et un module de synthèse vocale capable de générer phonétiquement les phrases en retour du système.
Quel que soit le mode d'entrée des informations provenant de l'utilisateur, ces moyens 2 d'interface sont connectés à des moyens 3 d'analyse de la phrase permettant de détecter le focus de celle-ci, ainsi que les propriétés de celui-ci.
Le focus correspond à l'intention du locuteur. Il est déterminé par l'analyse syntaxique et sémantique de la phrase.
Un exemple de recherche du focus est décrit dans la demande FR 2 787 902 de la demanderesse. Le focus se traduit concrètement par un mot. Il se différencie d'un mot- clé dans la mesure où le focus peut ne pas apparaître en tant que tel dans la phrase. Par exemple, au milieu d'un dialogue, la question « quel est l'âge de cette personne ? » a comme focus « Mr Dupont » qui est la personne référencée par le « cette » et donc connue par une phrase précédente de ce dialogue. Les propriétés du focus correspondent aux précisions apportées par l'utilisateur. Dans l'exemple ci-dessus, la propriété du focus concerne l'âge de celui-ci.
Comme expliqué ci-après, le système automatique de recherche d'informations construit un dialogue avec l'utilisateur afin de préciser sa demande et de répondre ainsi au mieux à l'attente de celui-ci.
Il comporte donc des moyens 4 de stockage des différentes phrases, et plus particulièrement des différents focus et de leurs propriétés, utilisés par l'utilisateur au cours de ce dialogue, le stockage de cet historique permettant, entre autres, d'éviter de poser à l'utilisateur une question pour laquelle celui-ci a déjà fourni une réponse.
De façon préférentielle, le stockage de cet historique est fait sous forme d'un graphe dont chaque nœud est une propriété. Le graphe est appelé état du dialogue ou graphe de partage sémantique.
Le système comporte également des moyens 5 de stockage d'au moins une vue ontologique de la base de connaissances 6.
Une vue ontologique est une vue partielle de l'ontologie du domaine de connaissances. Classiquement, dans le domaine des bases de connaissances, on appelle ontologie la représentation de la somme des connaissances et la définition de toutes les catégories par un ensemble unique de relations logiques.
Dans le cas présent, une vue ontologique est une représentation partielle d'une base de connaissances selon un certain point de vue. C'est donc une extraction des classes et des relations de la base de connaissances à partir d'un thème, ou d'un objet focus ou focus. Les classes et les relations de la base de connaissance sont alors réorganisées sous forme d'une structure arborescente dont l'objet focus est la racine.
Ainsi, dans une base de connaissances, figure 2, regroupant des informations sur la finance et la géographie, il est possible de définir une vue ontologique, figure 3, par rapport au thème « cours » en extrayant et en organisant l'information de la base de connaissances par rapport à cette problématique.
On conçoit aisément qu'une base de connaissances unique puisse ainsi donner lieu à une pluralité de vues ontologiques différentes. Une vue ontologique se définit donc par rapport à son focus, c'est-à- dire le thème sur lequel sont basées l'extraction et l'organisation de celle-ci. Dans l'exemple précédent, « cours » est le focus de la vue ontologique créée.
La vue ontologique peut se représenter, figure 3, sous forme d'une arborescence dont le focus est le point de départ, la racine. Les liens entre les classes et leurs sous-classes et les relations correspondent à des liens de l'arbre ayant des propriétés particulières et sont notés différemment dans une représentation graphique de l'arbre. Par exemple, le lien sous-classe est noté sous forme d'une flèche pointant vers la classe principale alors que le lien relation est non directionnel. Une autre représentation d'une vue ontologique utilise un langage de description.
A titre d'exemple, la figure 3 peut être décrite par : km_model_vers (1.0, 'application bourse'). km_focus (cours).
km_view_model (cours,
[ objet_cote (cours, objet_boursier), OR (objet_boursier, [action, indice, devise])
]) km_view_model ( indice,
[ indice_bourse (indice, ville) , indice_pays (indice, pays) , enclos_dans (ville, pays)
]) • km_object__restrict (objet_boursier, 1) . km_priorite_restrict (indice, [indice, ville, pays]) km_rest_forbidden ([objet_boursier, instances] ) . km_profondeur_rest (1) . km_nb_restrict (2) .
La déclaration km_view_model (noeud, expression) définie les liens dans « expression » du nœud « nœud » avec les autres nœuds ou feuilles.
Par exemple, le nœud « indice » a des relations logiques avec « ville » et « pays » sachant que « ville » a une relation logique de type « enclos-dans » avec « pays ».
Dans la structure arborescente de la vue ontologique, les liens logiques sont donc des branches de l'arbre reliant deux nœuds. Ces liens sont de deux types : le premier type est défini par le lien entre les classes et leurs sous- classes et le second type est défini par les relations logiques entre les instances de ces classes.
Chaque vue ontologique comporte également un certain nombre de paramètres permettant une utilisation optimale de celle-ci par les outils décrits ci- après.
Ainsi, dans l'exemple ci-dessus, on restreint la profondeur de balayage du graphe à un seul niveau. De même, pour « indice », le balayage est limité aux nœuds « indice », « ville » et « pays ». Des moyens 7 de sélection, figure 1 , recherchent la ou les vues ontologiques pertinentes en fonction de la demande de l'utilisateur.
La sélection s'effectue en recherchant les vues ontologiques dont le focus correspond au focus saisi.
Puis, pour chaque vue ontologique sélectionnée, le système comporte des moyens 8 de projection du dialogue sur cette vue ontologique.
On entend par projection du dialogue sur la vue ontologique l'opération de balayage et de parcours de la vue ontologique à partir du nœud focus, dans un but d'unification, qui, figure 4, dans un premier temps en 10 recherche l'objet de guidage sémantique, c'est-à-dire l'objectif déduit par le procédé de l'intention de l'utilisateur, donc du focus. En règle générale, le focus et l'objet de guidage sémantique sont donc confondus. Puis, dans un second temps, étapes 11 à 15, et à partir du nœud de guidage sémantique, la projection parcourt l'arbre de nœud en nœud, récursivement. Pour chaque nœud rencontré, la projection identifie et descend tous les liens de relations, considérés comme des liens ET, possibles depuis le nœud courant. Parallèlement, si des liens de sous-classes sont possibles, la projection vérifie que l'une d'elles découle des éléments de la requête. Les liens de sous-classes sont donc considérés comme des liens OU exclusif. Cette projection du dialogue sur la vue ontologique permet de définir une liste d'objets de suggestion, ou de suggestions selon l'algorithme suivant. Pour chaque classe, correspondant donc à un nœud, en 11 , à partir de l'objet de guidage, si des sous-classes sont définies dans la vue ontologique en 12 et qu'aucune ne découle de la requête en 13, alors une suggestion de choix sur les sous-classes, et / ou sur les instances est définie en 14. Mais si, des sous- classes étant définies dans la vue ontologique en 12, au moins une de celles-ci découle du dialogue en 13, alors on descend le lien correspondant et recommence la recherche en partant de cette sous-classe, en 11. Enfin, si aucune sous-classe n'est définie en 12, alors une suggestion de choix est définie sur les instances de la classe courante, en 15.
Les moyens 8 de projection du dialogue sur la vue ontologique génèrent ainsi une liste d'objets de suggestion.
Il est à noter que les paramétrages de la vue ontologique sont utilisés par les moyens de projection pour raffiner et limiter le parcours dans les nœuds de la vue ontologique. Il en est ainsi du paramètre qui limite la profondeur de recherche dans le graphe ou de l'objet de guidage sémantique.
La liste des objets de suggestion fournie par les moyens de projection comprend toutes les suggestions possibles.
Cette liste est alors transmise à des moyens 9 de sélection, figure 1 , et de mise en forme des messages de suggestion.
Cette liste de suggestions comporte, sous forme d'une structure de données, pour chaque suggestion, l'objet sur lequel porte la suggestion, la liste des réponses possibles pour l'utilisateur, ainsi que l'extension du dialogue à réaliser, c'est-à-dire le nouvel élément sémantique à partager avec l'utilisateur, si ce message doit être réellement proposé.
Cette liste doit donc être triée de manière à respecter les priorités attachées à la vue ontologique, si un tel paramétrage existe, et également de façon à être le plus pertinent possible par rapport à l'état présent du dialogue.
La liste est donc divisée en trois sous listes : - une première sous liste contient les suggestions où des choix peuvent être déclinés de façon exhaustive. Cela correspond à des questions fermées, c'est-à-dire à des questions contenant la réponse sous forme d'une liste de choix du type « Etes-vous intéressé par A, B ou C ? ». Les suggestions de cette sous liste ont donc des réponses possibles mémorisées correspondant à des sous-classes ou à des instances de la classe.
- une deuxième sous liste contient, parmi les suggestions restantes, celles qui, si elles sont retenues correspondent à des feuilles de graphe de partage sémantique. Cela correspond à des questions ouvertes, c'est-à-dire des questions dont la réponse n'est pas un choix dans une liste, portant sur des éléments dont on ne connaît rien dans le contexte actuel du dialogue.
- la troisième sous liste correspond aux suggestions non classées dans les sous listes précédentes.
La première sous liste est utilisée en priorité pour définir les questions possibles, puis la deuxième sous liste et enfin la troisième sous liste de façon à ne garder qu'un nombre maximum prédéfini de messages de suggestion simultanés qui sont alors présentés à l'utilisateur par l'interface homme / machine
2 .
Le fonctionnement du système va maintenant être expliqué en utilisant un exemple de dialogue.
Cet exemple utilise la base de connaissances de la figure 2 et la vue ontologique qui lui est associée représentée en figure 3. Cette vue ontologique a comme objet focus « COURS » et comme objet de guidage ontologique « OBJET BOURSIER ». Les autres paramètres de la vue ontologique sont la profondeur de balayage fixée à 1 niveau et l'interdiction de faire des suggestions sur les instances d' « OBJET BOURSIER ».
« Utilisateur : je cherche une cotation »
Le focus est "cotation" qui renvoie à « cours» qui est l'objet focus de la vue ontologique. L'objet de guidage ontologique étant « objet_boursier », le parcours de l'arbre fait apparaître trois sous-classes : « indice », « action » et « devise ». Comme la profondeur de balayage est fixée à 1 , le parcours s'arrête à ce niveau. « Réponse : La valeur d'une information boursière. Par quelle information boursière êtes-vous intéressé? Un indice, une action ou une devise ? »
« Utilisateur : un indice. » « Réponse : la valeur de l'indice. Par quel indice êtes- vous intéressé?
Par quelle ville êtes- vous intéressé ? »
Indice étant fixé, cela correspond à une descente d'un niveau dans la vue ontologique. On obtient une liste complète de suggestions sous forme de 3 questions ouvertes portant sur "indice", "ville" et "pays". Les paramètres du dialogue définissant le nombre maximal des questions à 2 (km_nb_restrict (2)), le procédé retient les deux premières suggestions : l'ensemble des instances d'"indice" correspondant à une première question ouverte et l'ensemble des instances de « ville » pour une seconde question ouverte. « Utilisateur : Paris »
« Réponse : la valeur de l'indice de Paris. Par quel indice de Paris êtes-vous intéressé ? L'indice SBF250, l'indice SBF120 ou l'indice CAC 40 ? »
Le système propose ainsi toutes les instances d' « indice » correspondant à la ville « Paris ».
« Utilisateur : le premier »
« Réponse : l'indice SBF250 valait 2128 euros 94 à 11h40. Voulez- vous une autre information ? »
Dans ce dernier échange, il n'est plus nécessaire de préciser la question. En conséquence, l'analyse et la recherche telles que décrites précédemment ne sont pas effectuées et une simple recherche de l'information demandée a lieu de façon classique.
Ainsi, figure 4, le procédé automatique de recherche d'informations dans une base de connaissances par dialogue entre un utilisateur et le système comporte les étapes de
- acquisition des informations en provenance de l'utilisateur, en 20.
- analyse de ces informations pour en extraire le focus et ses propriétés, en 21. - sélection d'une vue ontologique à partir d'au moins un focus provenant de l'utilisateur, cette sélection étant faite sur un ensemble de vues ontologiques préalablement définies, en 22.
- projection des informations du dialogue sur la vue ontologique sélectionnée pour obtenir une liste de toutes les suggestions possibles, en 23 ;
- sélection des suggestions, en 24, à présenter par tri de la liste des suggestions en au moins deux catégories, la première catégorie étant les suggestions dont les choix sont déclinables de façon exhaustive et la seconde catégorie étant les suggestions correspondant à des éléments non connus. - mise en forme des suggestions, en 25, et
- présentation des suggestions à l'utilisateur, en 26.
On constate ainsi qu'en utilisant la sémantique du domaine considéré par l'utilisation des vues ontologiques, il est possible d'offrir à l'utilisateur des suggestions particulièrement pertinentes pour l'aider dans sa recherche d'informations.

Claims

REVENDICATIONS
1. Système automatique (1) de recherche d'informations dans une base de connaissance par dialogue entre un utilisateur et le système comportant
- des moyens (2) d'interface homme-machine aptes à permettre l'échange d'informations entre l'utilisateur et le système sous forme d'un dialogue, connectés à
- des moyens (3) d'analyse des phrases saisies par l'utilisateur aptes à détecter le focus et ses propriétés desdites phrases, connectés à
- des moyens (4) de stockage aptes à conserver l'historique du dialogue entre l'utilisateur et le système, caractérisé en ce qu'il comporte en outre
- des moyens (5) de stockage d'au moins une vue ontologique de la base de connaissances (6), connectés à
- des moyens (7) de sélection d'au moins une vue ontologique stockée à partir d'au moins un focus saisi par l'utilisateur et stocké dans les moyens de stockage du dialogue, connectés à
- des moyens (8) de projection du dialogue sur la vue ontologique sélectionnée aptes à fournir une liste de suggestions possibles, connectés à
- des moyens (9) de sélection et de mise en forme des objets de suggestions aptes à trier la liste des suggestions en au moins deux catégories, la première catégorie étant les suggestions dont les choix sont déclinables de façon exhaustive et la seconde catégorie étant les suggestions correspondant à des éléments non connus, et à fournir aux moyens d'interfaces homme-machine une liste triée de questions à présenter à l'utilisateur.
2. Système automatique de recherche d'informations dans une base de connaissance par dialogue entre un utilisateur et le système selon la revendication 1 , caractérisé en ce que les vues ontologiques sont stockées sous forme d'une structure logique arborescente telle que, vu d'un nœud correspondant à une classe, le lien entre la classe correspondante et ses sous- classes correspond à des liens OU exclusif et les relations entre ce nœud et d'autres classes de la base de connaissances correspondent à des liens ET, la racine de l'arbre étant l'objet focus de la vue ontologique.
3. Système automatique de recherche d'informations dans une base de connaissance par dialogue entre un utilisateur et le système selon la revendication 2, caractérisé en ce que les moyens (8) de projection du dialogue sur la vue ontologique comportent des premiers moyens de parcours de l'arbre représentant la vue ontologique de l'objet focus vers les objets de guidage sémantique et des seconds moyens de parcours de l'arbre à partir des objets de guidage aptes à identifier et descendre tous les liens ET à partir du nœud courant et à descendre les liens OU exclusif correspondant à des éléments cités dans le dialogue.
4. Système automatique de recherche d'informations dans une base de connaissance par dialogue entre un utilisateur et le système selon la revendication 3, caractérisé en ce que si les seconds moyens de parcours de l'arbre rencontrent des liens OU exclusif dont aucun ne découle de la requête, alors une suggestion de choix sur ces liens est proposée, et si aucun lien OU exclusif n'est rencontré dans une branche de l'arbre, alors une suggestion de choix est proposée sur les instances de la classe courante.
5. Système de recherche d'informations selon l'une quelconque des revendications précédentes, caractérisé en ce que les moyens (4) de stockage de l'historique du dialogue comportent des moyens de stockage structurés, aptes à mémoriser sous forme d'un graphe tous les concepts sémantiques référencés dans l'état courant du dialogue de recherche.
6. Système de recherche d'informations selon l'une quelconque des revendications précédentes, caractérisé en ce que les moyens (9) de mise en forme des suggestions sont aptes à trier les suggestions en une première catégorie de questions fermées et en une seconde catégorie de questions ouvertes.
7. Procédé automatique de recherche d'informations dans une base de connaissances par dialogue entre un utilisateur et un système comportant les étapes de
- acquisition (20) des informations en provenance de l'utilisateur,
- analyse (21) de ces informations pour en extraire le focus et ses propriétés,
- sélection (22) d'une vue ontologique à partir d'au moins un focus provenant de l'utilisateur, cette sélection étant faite sur un ensemble de vues ontologiques préalablement définies, - projection (23) des informations du dialogue sur la vue ontologique sélectionnée pour obtenir une liste de toutes les suggestions possibles,
- sélection (24) des suggestions à présenter par tri de la liste des suggestions en au moins deux catégories, la première catégorie étant les suggestions dont les choix sont déclinables de façon exhaustive et la seconde catégorie étant les suggestions correspondant à des éléments non connus,
- mise en forme (25) des suggestions, et
- présentation (26) des suggestions à l'utilisateur.
8. Procédé automatique de recherche d'informations selon la revendication 7, caractérisé en ce que une vue ontologique étant structurée sous forme d'un arbre logique dont la racine est l'objet focus, les liens entre les classes et leurs sous-classes de la base de connaissance des liens OU exclusif et les relations de la base de connaissances des liens ET, la projection des informations de dialogue sur la vue ontologique comporte les étapes de : - recherche à partir de la racine de l'objet de guidage,
- parcours récursif de l'arbre à partir de l'objet de guidage de façon à identifier et descendre tous les liens ET à partir du nœud courant et identifier et descendre les seuls liens OU exclusif correspondant à des éléments du dialogue.
9. Procédé automatique de recherche d'informations selon la revendication 8, caractérisé en ce que lors du parcours de l'arbre, la rencontre d'une classe possédant des liens OU exclusif vers ses sous-classes dont aucune ne correspond à un élément du dialogue génère la création d'une suggestion de choix sur ces liens et l'absence de rencontre d'un lien OU exclusif sur une branche de l'arbre génère la création d'une suggestion de choix sur les instances de la classe courante.
10. Procédé automatique de recherche d'informations selon l'une, quelconque des revendications 7 à 9, caractérisé en ce que après l'analyse des informations en provenance de l'utilisateur, les concepts sémantiques de celles-ci sont stockés dans un historique de dialogue structuré sous forme d'un graphe représentant l'état courant du dialogue de recherche.
11. Procédé automatique de recherche d'informations selon l'une quelconque des revendications 7 à 10, caractérisé en ce que la mise en forme des suggestions comporte l'étape de tri des suggestions en une première catégorie de questions fermées et en une seconde catégorie de questions ouvertes.
12. Produit logiciel enregistré sur un support de mémorisation pour la mise en oeuvre par un ordinateur faisant office d'équipement dédié du système et du procédé automatique de recherches d'informations selon les revendications 1 à 6, respectivement les revendications 7 à 11.
PCT/FR2004/002386 2004-09-22 2004-09-22 Systeme et procede automatique de recherche d'informations dans une base de connaissances WO2006032735A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/FR2004/002386 WO2006032735A1 (fr) 2004-09-22 2004-09-22 Systeme et procede automatique de recherche d'informations dans une base de connaissances

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FR2004/002386 WO2006032735A1 (fr) 2004-09-22 2004-09-22 Systeme et procede automatique de recherche d'informations dans une base de connaissances

Publications (1)

Publication Number Publication Date
WO2006032735A1 true WO2006032735A1 (fr) 2006-03-30

Family

ID=34959236

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2004/002386 WO2006032735A1 (fr) 2004-09-22 2004-09-22 Systeme et procede automatique de recherche d'informations dans une base de connaissances

Country Status (1)

Country Link
WO (1) WO2006032735A1 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002073331A2 (fr) * 2001-02-20 2002-09-19 Semantic Edge Gmbh Environnement interactif en langage naturel, dependant du contexte et a base de connaissances pour applications dynamiques et flexibles de recherche et de presentation de produits, services et informations
US6487545B1 (en) * 1995-05-31 2002-11-26 Oracle Corporation Methods and apparatus for classifying terminology utilizing a knowledge catalog

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6487545B1 (en) * 1995-05-31 2002-11-26 Oracle Corporation Methods and apparatus for classifying terminology utilizing a knowledge catalog
WO2002073331A2 (fr) * 2001-02-20 2002-09-19 Semantic Edge Gmbh Environnement interactif en langage naturel, dependant du contexte et a base de connaissances pour applications dynamiques et flexibles de recherche et de presentation de produits, services et informations

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
STAAB S ET AL: "A System for Facilitating and Enhancing Web Search", LECTURE NOTES IN COMPUTER SCIENCE, SPRINGER VERLAG, NEW YORK, NY, US, vol. 1607, 2 June 1999 (1999-06-02), pages 1 - 10, XP002295461, ISSN: 0302-9743 *

Similar Documents

Publication Publication Date Title
Park et al. Systematic Review on Chatbot Techniques and Applications.
US7711672B2 (en) Semantic network methods to disambiguate natural language meaning
US7526466B2 (en) Method and system for analysis of intended meaning of natural language
US9323842B2 (en) Detecting correlations between data representing information
US20020133347A1 (en) Method and apparatus for natural language dialog interface
CN113392305B (zh) 关键词的提取方法及装置、电子设备、计算机存储介质
WO2006120352A1 (fr) Dispositif et procede d'analyse semantique de documents par constitution d'arbres n-aire et semantique
EP2317507B1 (fr) Compilation d'un corpus pour la génération d'un modèle de langage
KR102765363B1 (ko) 생성형 ai 기반 도메인 특화 보고서 생성 시스템
FR3017474A1 (fr) Saisie assistee de regles dans une base de connaissance
Prem et al. Library book recommendation chatbot using Rasa NLU
Turunen et al. AthosMail–a multilingual adaptive spoken dialogue system for E-mail domain
WO2006032735A1 (fr) Systeme et procede automatique de recherche d'informations dans une base de connaissances
EP4300326A1 (fr) Procédé d'appariement d'un ensemble à évaluer et d'une liste de référence, moteur d'appariement et programme d'ordinateur correspondants
WO2016116459A1 (fr) Procédé de lemmatisation, dispositif et programme correspondant
US20240185847A1 (en) Bit Vector-Based Content Matching for Third-Party Digital Assistant Actions
CA2880554C (fr) Systeme et methodes permettant d'ameliorer la precision de reconnaissance de la parole
FR2878050A1 (fr) Systeme et procede de dialogue pour la recherche d'informations dans un ensemble de ressources textuelles
Pargellis et al. Automatic application generator matches user expectations to system capabilities
Streit et al. Emotion analysis and emotion-handling subdialogues
US20250252124A1 (en) System and method for integrating artificial intelligence assistants with website building systems
Grigorov Building Advanced Applications Powered by LLMs with LangChain and Python
FR3136298A1 (fr) Procede d’association d’une donnee a un document numerique, systeme associe
WO2020079109A1 (fr) Dispositif de traitement automatique de texte par ordinateur
Thymé-Gobbel et al. Reaching Understanding

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase