KR20100125682A - Semantic search method and system integrating multiple classification systems - Google Patents
Semantic search method and system integrating multiple classification systems Download PDFInfo
- Publication number
- KR20100125682A KR20100125682A KR1020090044508A KR20090044508A KR20100125682A KR 20100125682 A KR20100125682 A KR 20100125682A KR 1020090044508 A KR1020090044508 A KR 1020090044508A KR 20090044508 A KR20090044508 A KR 20090044508A KR 20100125682 A KR20100125682 A KR 20100125682A
- Authority
- KR
- South Korea
- Prior art keywords
- classification
- category
- categories
- resources
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화함으로써 사용자 접근성이 향상된 분류 카테고리의 추천 및 의미론적 리소스 검색 서비스를 실현할 수 있는 시멘틱 검색 방법 및 시스템에 관한 것이다. 본 발명에 따른 시멘틱 검색 방법은, 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 데이터베이스화하고, 각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하며, 입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공할 수 있다. The present invention integrates databased resources into different classification systems in various fields, and uses an ontology classification schema to map the database according to the degree of association with other classification concepts in other fields. The present invention relates to a semantic search method and system capable of realizing a recommendation and semantic resource search service of a classification category with improved user accessibility. In the semantic search method according to the present invention, a database corresponding to each classification category is divided into two or more classification systems having a plurality of classification categories, and the resources corresponding to each classification category are databased. An association relationship between the two classification categories is set based on the similarity values of the first classification category of the classification scheme and the second classification category of the second classification scheme. On the basis of this, the search results may be provided by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category.
Description
본 발명은 시멘틱(semantic) 검색 방법 및 시스템에 관한 것으로서, 특히, 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화함으로써 사용자 접근성이 향상된 분류 카테고리의 추천 및 의미론적 리소스 검색 서비스를 실현할 수 있는 시멘틱 검색 방법 및 시스템에 관한 것이다.The present invention relates to a semantic search method and system, and in particular, by using the ontology classification scheme by integrating the database database in different classification schemes in various fields, different classification concepts in different fields. The present invention relates to a semantic search method and system that can implement a semantic resource retrieval service and recommendation of a classification category with improved user accessibility by mapping and mapping the database according to the degree of association.
오늘날 각종 정보의 홍수 속에서 사용자가 찾고자 하는 정보를 신속하고 정확하게 검색할 수 있는 시스템이 많은 분야에서 요구되고 있다. 예를 들어, 도서관의 도서 검색 시스템, 웹(web) 사이트의 정보 검색 시스템, LAN으로 연결된 소규모 네트워크나 개인용 PC의 저장 장치에 관리되는 리소스들에 대한 검색 시스템 등 검색에 유용한 시스템이 관리되는 많은 정보, 예를 들어, 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 텍스트 데이터 등 다양한 형태의 정보를 보다 빠르고 지능화된 방법으로 검색하기 위한 많은 방법들이 개발되고 있다.In today's flood of information, a system that can quickly and accurately search for information that a user wants to find is required in many fields. For example, a lot of information managed by a system that is useful for searching, such as a book search system in a library, an information search system on a web site, a search system for resources managed on a small network connected to a LAN or a storage device of a personal PC. For example, many methods for retrieving various types of information such as document files, image files, video files, database information, and text data in a faster and more intelligent manner have been developed.
일반적인 검색 시스템에서는 하나의 분류 체계 내에서 검색 대상 자료로부터 검색어에 해당하는 문자열을 추출하고 추출된 문자열에 대한 검색어와의 일치도 비교를 통하여 검색 결과를 제공할 수 있다. 예를 들어, 인터넷 서점이나 도서관에서 사용하는 검색 시스템에서는 KDC(Korea Decimal Classification) 분류 체계에 따른 도서의 목록이나 요약 정보를 제공할 수 있다. 이와 같은 검색 시스템은 인터넷 쇼핑몰이나 학술 정보 제공 사이트에서도 유사하게 검색어에 유사한 각종 자료를 제공할 수 있다.In a general search system, a string corresponding to a search word may be extracted from a search target material within a classification system, and the search result may be provided by comparing the matched word with the search word. For example, a search system used in an internet bookstore or a library may provide a list of books or summary information according to the Korea Decimal Classification (KDC) classification system. Such a search system may similarly provide various materials similar to a search word in an internet shopping mall or an academic information providing site.
그러나, 다양한 분류 체계에 따라 데이터베이스화된 리소스들을 운영하는 경우에, 검색 대상 범위가 증가하여 일일이 리소스들을 검색하여 검색어에 해당하는 유사 자료를 제공하는 데에는 어려움이 있다. 예를 들어, 도서 검색 시스템의 경우에, 사용자에 따라서는 KDC의 분류 체계뿐만 아니라, 학진(한국학술진흥재단: KRF: Korea Research Foundation), DDC(Dewey Decimal Classification), UDC(Univeral Decimal Classification) 등의 분류 체계에 따른 검색 결과를 희망할 수 있다. 그러나, 이와 같은 각각의 분류 체계에 따른 리소스들은 서로 산재되어 있어서 검색어에 해당하는 리소스를 일일이 검색하는 시간이 많이 소요될 수 있으며, 분류 체계별로 일목 요연한 검색 결과를 제공하지 못하므로, 사용자로서는 쉽게 필요한 정보에 접근할 수 없는 문제점이 있다. However, in the case of operating the database resources according to various classification schemes, it is difficult to provide a similar material corresponding to the search word by searching the resources by increasing the search target range. For example, in the case of a book search system, not only the classification system of KDC, but also the academic institutions (Korea Research Foundation: KRF: Korea Research Foundation), DDC (Dewey Decimal Classification), UDC (Universal Decimal Classification), etc. The search results according to the classification system of can be hoped. However, the resources according to each classification scheme are interspersed with each other, so it may take a long time to search for resources corresponding to the search terms, and it is not easy to provide a clear search result for each classification scheme. There is a problem with inaccessible information.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 사용 자 접근성이 향상된 풍부하고 정확한 검색결과를 제공하기 위하여, 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화하여 효율적으로 분류 카테고리를 추천하며 의미있는 리소스 검색 결과를 서비스할 수 있는 시멘틱 검색 방법 및 시스템을 제공하는 데 있다.SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and an object of the present invention is to integrate ontologies by integrating database data in different classification systems in various fields in order to provide rich and accurate search results with improved user accessibility. Semantic retrieval method that can recommend classification categories and service meaningful resource search results by mapping them according to the degree of association with classifications in different classification concepts of other fields using classification schemas. To provide a system.
먼저, 본 발명의 특징을 요약하면, 상기의 목적을 달성하기 위한 본 발명의 일면에 따른 시멘틱 검색 방법, 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 데이터베이스화하고, 각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하며, 입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공하는 것을 특징으로 한다.First, to summarize the features of the present invention, the semantic search method according to an aspect of the present invention for achieving the above object, for each classification system divided into two or more classification systems having a plurality of classification categories Databases of resources corresponding to each classification category are generated, and for each keyword, an association relation between the two classification categories is based on similarity values of the first classification category of the first classification scheme and the second classification category of the second classification scheme. And provide a search result by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category, based on the correlation.
상기 연관 관계는, 제1 분류 체계와 제2 분류 체계 중 어느 하나의 리소스에 포함된 각 키워드를 추출하여, 상기 각 리소스의 미리 정해진 분류 정보에 기초하여 상기 각 키워드가 상기 제1 분류 체계의 분류 카테고리에 대하여 갖는 제1 유사도값과 상기 제2 분류 체계의 분류 카테고리에 대하여 갖는 제2 유사도값을 계산하 며, 각 분류 카테고리의 레벨을 고려한 상기 제1 유사도값과 상기 제2 유사도값의 차이에 기초하여 설정될 수 있다.The association relationship is to extract each keyword included in any one resource of the first classification scheme and the second classification scheme, the classification of each keyword is the first classification scheme based on the predetermined classification information of each resource. Compute a first similarity value for a category and a second similarity value for a category of the second classification scheme, and calculate the difference between the first similarity value and the second similarity value considering the level of each category. Can be set based on this.
상기 시멘틱 검색 방법은, 각 분류 카테고리에 포함된 키워드의 집합을 미리 추출해 두고, 각 키워드에 대하여 문서 파일, 데이터베이스 정보, 텍스트 데이터, 이미지, 또는 동영상을 포함한 리소스에 대한 메타 데이터에서 추출되는 키워드와 매칭되는 분류 카테고리들의 연관 관계를 설정하여 조합함으로써 시멘틱 검색을 제공할 수 있다. The semantic search method extracts a set of keywords included in each classification category in advance, and matches each keyword with keywords extracted from metadata about a resource including a document file, database information, text data, an image, or a video. A semantic search may be provided by setting and associating associations of classification categories.
상기 각 리소스의 미리 정해진 분류 정보는 리소스 또는 해당 메타데이터에 포함된 해당 분류 체계의 분류 카테고리에 대한 정보를 포함하고, 상기 분류 카테고리는 적어도 한 레벨 이상의 세부 카테고리를 포함한 계층 구조를 갖는다. The predetermined classification information of each resource includes information on a classification category of a corresponding classification scheme included in a resource or corresponding metadata, and the classification category has a hierarchical structure including at least one level or more detailed categories.
상기 제1 유사도 값 또는 상기 제2 유사도 값은, 키워드가 각 분류 카테고리의 리소스에서 출현하는 빈도수와 해당 리소스가 속하는 분류 카테고리에 대하여 미리 설정한 가중치의 곱에 기초하여 계산될 수 있다. The first similarity value or the second similarity value may be calculated based on a product of a frequency in which a keyword appears in a resource of each classification category and a weight previously set for the classification category to which the resource belongs.
상기 해당 리소스가 속하는 분류 카테고리가 없는 경우에 상기 키워드가 해당 리소스에서 출현하는 빈도수만을 이용하기 위하여, 상기 분류 카테고리들에 대하여 미리 설정한 가중치를 모두 같은 값으로 하여 다른 분류 체계와 연관 관계를 채택할 수 있다. If there is no classification category to which the corresponding resource belongs, in order to use only the frequency in which the keyword appears in the resource, an association relationship with another classification scheme may be adopted by setting all the weights set in advance for the classification categories as the same value. Can be.
상기 검색 결과의 제공 시에, 상기 입력 키워드가 포함된 해당 분류 체계의 리소스들을 우선적으로 디스플레이 수단에 각 분류 카테고리별로 표시하고, 상기 우선하여 표시된 리소스들과 인접하게 상기 해당 분류 체계와 상기 연관 관계가 가 장 많이 설정된 다른 분류 체계의 리소스들을 각 분류 카테고리별로 표시할 수 있다. When providing the search result, the resources of the classification system including the input keyword are preferentially displayed on the display means for each classification category, and the association system is associated with the classification system adjacent to the resources displayed first. The resources of the different classification systems that are set the most can be displayed for each category.
그리고, 본 발명의 다른 일면에 따른 시멘틱 검색 시스템은, 복수의 분류 카테고리를 갖는 분류 체계를 두 가지 이상으로 구분하여 구분된 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들을 저장하고 관리하는 데이터베이스; 각 키워드에 대하여 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리가 갖는 유사도 값에 기초하여 두 분류 카테고리 사이의 연관 관계를 설정하는 관계 모델 설정 수단; 및 입력 키워드에 대한 검색 결과의 제공 시에, 상기 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공하는 검색 결과 제공 수단을 포함할 수 있다. In addition, the semantic search system according to another aspect of the present invention, a database for storing and managing resources corresponding to each classification category for each classification system divided into two or more classification systems having a plurality of classification categories ; Relationship model setting means for setting an association relationship between two classification categories for each keyword based on similarity values of the first classification category of the first classification scheme and the second classification category of the second classification scheme; And a search result providing means for providing a search result by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category, based on the association, when providing a search result for an input keyword. have.
본 발명에 따른 시멘틱 검색 방법 및 시스템에 따르면, 다양한 분야에서 각기 다른 분류 체계로 데이터베이스화된 리소스들을 통합하여 온톨로지(ontology) 분류 스키마(schema)를 이용하여 다른 분야의 다른 분류 개념에 있는 분류와도 연관성 정도에 따라 매핑시켜서 데이터베이스화하여 효율적으로 분류 카테고리를 추천하며 의미론적 리소스 검색 서비스를 수행함으로써, 사용자에게 쉽고 편리하게 풍부하고 정확한 검색 결과를 제공할 수 있다.According to the semantic retrieval method and system according to the present invention, it is possible to integrate resources databased into different classification systems in various fields, and to use the ontology classification schema to separate classifications from other classification concepts in other fields. By mapping the database according to the degree of association and efficiently recommending the classification categories and performing the semantic resource search service, the user can easily and conveniently provide rich and accurate search results.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. In order to fully understand the present invention, the operational advantages of the present invention, and the objects achieved by the practice of the present invention, reference should be made to the accompanying drawings which illustrate preferred embodiments of the present invention and the contents described in the accompanying drawings.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
이하에서 언급하는 본 발명의 일실시예에 따른 시멘틱 검색 시스템은, 컴퓨터, PDA, 셀룰러 폰이나 기타 전용 기기 등에서 하드웨어, 소프트웨어 또는 이들의 조합으로 동작되도록 구현될 수 있으며, 또한, 인터넷, 이동 통신망, 무선 인터넷 망 등을 통하여 웹(WEB)서버, 왑(WAP)서버 등에서 사용자에게 쉽고 편리하게 풍부하고 정확한 검색 결과를 제공하도록 동작할 수 있다.The semantic search system according to an embodiment of the present invention described below may be implemented to operate in hardware, software, or a combination thereof in a computer, PDA, cellular phone, or other dedicated device, and also may include the Internet, a mobile communication network, Through a wireless Internet network, such as a web (WEB) server, a WAP (WAP) server can be operated to provide a rich and accurate search results easily and conveniently to the user.
도 1은 본 발명의 일실시예에 따른 시멘틱 검색 시스템을 설명하기 위한 도면이다.1 is a diagram illustrating a semantic search system according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일실시예에 따른 시멘틱 검색 시스템은, 학진 분류, KDC, DCC, UCC, 인터넷 포털의 상품이나 기사의 분류, 인터넷 서점에서의 도서 분류 등 서로 다른 분류 체계를 갖는 리소스들이 저장 관리된 데이터베이스의 정보에 대하여, 소정 연관 관계 설정 수단을 통하여 서로 다른 분류 체계의 분류 카테고리들 간의 연관 관계를 미리 설정하여 구축하여 둠으로써, 입력 키워드에 대한 검색 결과의 제공 시에, 위와 같은 연관 관계에 기초하여 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공할 수 있다. Referring to FIG. 1, the semantic search system according to an embodiment of the present invention has a different classification system such as school classification, KDC, DCC, UCC, classification of products or articles of an Internet portal, and classification of books in an internet bookstore. With regard to the information of the database in which the resources are stored and managed, by establishing and establishing an association relationship between classification categories of different classification systems through a predetermined association setting means, when providing a search result for an input keyword, Based on the same association, a search result may be provided by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category.
예를 들어, 학진 분류는 A000000인문학, B000000사회과학, C000000자연과학, D000000공학, E000000의약학, F000000농수해양, G000000예술체육, H000000복합학 등으로 학문 기타 관련 분야의 리소스들을 데이터베이스화하여 관리하기 위하여 사용되고 있으며, KDC 분류는 000 총류, 100 철학, 200 종교, 300 사회과학, 400 순수과학, 500 기술과학, 600 예술, 700 어학, 800 문학, 900 역사 등으로 도서 기타 관련 분야의 리소스들을 데이터베이스화하여 관리하기 위하여 사용되고 있고, DDC 분류는 000 서지정보학, 총서, 전집, 100철학, 200 종교, 300 사회과학, 400 언어학, 500 자연과학, 600 기술과학(의학, 공학, 농학, 가정학 등), 700 예술, 800 문학, 900 역사, 지리, 인물 등으로 도서 기타 관련 분야의 리소스들을 데이터베이스화하여 관리하기 위하여 사용되고 있다. 이외에도, 인터넷 포털이나 서점 등에서도 위와 같은 분류 체계를 응용하여 사이트 운영 목적에 맞는 독자적인 분류 체계를 갖추어 사용자의 키워드 검색에 필요한 검색 결과를 용이하게 제공하고자 하고 있다. For example, the academic classification is A000000 Humanities, B000000 Social Sciences, C000000 Natural Sciences, D000000 Engineering, E000000 Medicine, F000000 Agriculture, Ocean, G000000 Arts, Sports, H000000 Complex, etc. The KDC classification includes 000 resources, 100 philosophies, 200 religions, 300 social sciences, 400 pure sciences, 500 technical sciences, 600 arts, 700 languages, 800 literatures, 900 history, etc. It is used to manage the DDC classification, 000 bibliography, collections, collections, 100 philosophy, 200 religions, 300 social sciences, 400 linguistics, 500 natural sciences, 600 technical sciences (medicine, engineering, agriculture, family studies, etc.), 700 arts. It is used to manage and manage resources of books and related fields such as 800 literature, 900 history, geography and people. In addition, the above-described classification system is applied to Internet portals and bookstores to provide a unique classification system suitable for the purpose of site operation, thereby easily providing search results necessary for a user's keyword search.
이와 같은 각 분야의 리소스들은 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 또는 텍스트 데이터 형식을 취할 수 있는 데, 각 분류 체계에 따라 위와 같은 대분류 하위에 세부 분류 카테고리가 적어도 한 레벨 이상, 예를 들어, 중분류, 소분류, 세분류 등으로 구분되는 계층(hierarchical) 구조의 분류 카테고리에 대하여 미리 정해진 분류 정보가 해당 리소스나 해당 리소스의 메타데이터에 대응되어 데이터베이스에 관리되고 있다. 해당 리소스의 속성 정보를 지칭하는 메타데이터는 위와 같은 해당 분류 체계의 분류 카테고리에 대한 정보를 포함할 뿐만 아니라, 리소스의 위치, 키워드, 타입(텍스트, 이미지, 비디오 등), 작성자 정보, 권리조건, 이용조건, 이용로그 등에 관한 정보가 포함될 수 있다. Resources in each of these areas may take the form of document files, image files, video files, database information, or text data. Depending on the classification scheme, there may be at least one level of subcategories under the subcategories above. For example, predetermined classification information for a classification category having a hierarchical structure divided into a subclass, a subclass, and a subclass is managed in a database corresponding to the resource or metadata of the resource. The metadata referring to the attribute information of the resource includes not only the information about the classification categories of the corresponding classification scheme, but also the resource's location, keywords, types (text, image, video, etc.), author information, rights conditions, Information regarding usage conditions, usage logs, and the like may be included.
특히, 본 발명에서는 각 분야의 해당 분류 체계에서 리소스들은 RDF/OWL(Resource Description Framework /Web Ontology Language) 구문에 기초한 온톨로지(ontology) 형태로 구축될 수 있다. 문서, 이미지, 비디오(동영상), 데이터베이스 정보, 텍스트 데이터 등의 다양한 리소스들은 메타데이터를 제공하고 있으며, 이러한 메타데이터들은 분류나 키워드 컨셉(concept)을 중심으로 한 의미론적 연관 관계의 맵(map)으로 연결되어 온톨로지로 구축될 수 있으며, 본 발명에 따른 연관 관계 설정에 따라 통합적으로 시멘틱한 검색을 통하여 보다 사용자에게 정확하고 풍부한 정보를 제공할 수 있다.In particular, in the present invention, resources in the corresponding classification system of each field may be constructed in an ontology based on RDF / OWL (Resource Description Framework / Web Ontology Language) syntax. Various resources such as documents, images, videos (videos), database information, and text data provide metadata, and these metadata are maps of semantic relationships centered on classification and keyword concepts. It can be connected to the ontology, and can provide more accurate and rich information to the user through an integrated semantic search in accordance with the association setting according to the present invention.
한편, 도 1의 점선과 같이, 본 발명의 일실시예에 따른 시멘틱 검색 시스템은, 소정 연관 관계 설정 수단을 통하여 각각의 분류 체계에 대하여 각 분류 카테고리에 대응된 리소스들이 저장 관리되는 데이터베이스의 정보로부터 각 키워드에 대하여 분류 체계가 다른 분류 카테고리 간의 연관 관계를 미리 설정하여 구축할 수 있다. On the other hand, as shown in the dotted line of Figure 1, the semantic search system according to an embodiment of the present invention, from the information of the database in which the resources corresponding to each classification category is stored and managed for each classification scheme through a predetermined association setting means; For each keyword, an association relationship between classification categories having different classification schemes may be set in advance.
도 2와 같이, 각 분류 체계에는 계층구조를 가진 분류 카테고리를 지니고 있으며, 다수의 분류 체계를 모두 열거하였을 때에도 서로 다른 분류체계의 카테고리 간에 연관관계가 나타남을 알 수 있다. 본 발명에서는 이러한 연관관계를 시맨틱한 관계 알고리즘을 통하여 다양한 성격의 연관관계를 생성시켜주는 시스템을 제안하는 것이다. 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서는, 각 분류 카테고리에 자주 이용되는 키워드의 집합을 미리 추출해 두고, 각 키워드에 대하여 문서 파일, 데이터베이스 정보, 텍스트 데이터, 이미지, 또는 동영상을 포함한 리소스에 대한 메타 데이터에서 추출되는 키워드와 매칭되는 분류 카테고리들의 연관 관계를 설정하여 조합한다. 예를 들어, 도 2와 같이 각 분류 카테고리마다 포함하고 있는, 예를 들어, 인명을 포함한 키워드 집합이 생성될 수 있으며, 동일한 키워드가 여러 분류 카테고리에도 포함될 수 있다. 이들 간의 의미적 관계가 연관 관계로 설정 부여되어 시맨틱 검색을 제공하도록 한다. As shown in FIG. 2, each classification system has a classification category having a hierarchical structure, and even when all of a plurality of classification systems are enumerated, it can be seen that an association relationship between categories of different classification systems appears. The present invention proposes a system for generating associations of various characteristics through a semantic relation algorithm. In the semantic search system according to an embodiment of the present invention, a set of keywords frequently used for each category is extracted in advance, and for each keyword, a resource including a document file, database information, text data, an image, or a video is extracted. The association relationship between the classification categories matched with the keywords extracted from the metadata is set and combined. For example, as shown in FIG. 2, a keyword set including, for example, a human name included in each classification category may be generated, and the same keyword may be included in various classification categories. Semantic relationships between them are assigned as associations to provide semantic search.
예를 들어, 입력될 각각의 키워드가 제1 분류 체계의 제1 분류 카테고리와 제2 분류 체계의 제2 분류 카테고리에서 갖는 연관성 정도에 따라 두 카테고리 간의 연관 관계를 미리 설정해 놓을 수 있다. 각 분류 체계에서는 해당 분야에 적합한 컨셉(concept)으로 접근하여 각 분류 카테고리를 정해놓고 있으며, 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서는 이와 같은 분류 카테고리간 연관성을 미리 파악하여 스키마를 설정 구성해 놓음으로써 입력 키워드에 대하여 해당 검색 대상 리소스의 접근성을 향상시킬 수 있고, 검색 결과에 대한 유사도, 정확도, 상하위 개념 등 관계 모델 설정이 용이하여 분류 카테고리의 추천 서비스에도 크게 기여할 수 있다. For example, an association relationship between the two categories may be preset according to the degree of association between each keyword to be input in the first classification category of the first classification scheme and the second classification category of the second classification scheme. In each classification system, each classification category is determined by approaching a concept suitable for the relevant field. In the semantic search system according to an embodiment of the present invention, the schema is established by identifying the associations between the classification categories in advance. In this case, it is possible to improve the accessibility of the corresponding search target resource with respect to the input keyword, and it is easy to set up a relation model such as similarity, accuracy, upper and lower concepts for the search result, and greatly contribute to the recommendation service of the classification category.
예를 들어, 위와 같이 각 키워드에 대하여 분류 체계가 다른 분류 카테고리 간의 연관 관계가 미리 설정되어 구축되면, 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서는 소정의 검색 결과 제공 수단(예를 들어, 검색 엔진)을 통하여, 입력 키워드에 대하여 위와 같은 연관 관계를 적용한 시멘틱 검색을 이용해 복수의 분류 체계에 속한 리소스들을 각 분류 체계별 또는 각 분류 카테고리별로 구분하여 검색 결과를 제공할 수 있게 된다. 일례로, 검색할 키워드가 입력되면, 입력 키워드에 해당하는 각 분류 체계의 해당 분류 카테고리를 우선적으로 검색하고, 이에 따라 각 분류 체계별로 구분하여 디스플레이 수단에 검색 결과를 제공하되, 해당 키워드에 대한 일치도가 높은 리소스를 갖는 분류 카테고리의 리소스에 대한 정보를 우선적으로 추천하여 검색 결과를 제공하는 것이 가능하다. 또한, 검색 결과의 제공 시에, 해당 입력 키워드가 가장 많이 포함된 해당 분류 체계의 리소스들을 각 분류 카테고리별로 가장 먼저 표시하고, 해당 분류 체계와 위와 같은 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 각 분류 카테고리별로 표시할 수도 있다. For example, as described above, when an association relationship between classification categories having different classification schemes is established for each keyword, the semantic search system according to an embodiment of the present invention may provide a predetermined search result providing means (for example, a search). Engine), by using the semantic search to which the above-described correlation is applied to the input keyword, it is possible to provide a search result by dividing resources belonging to a plurality of classification systems by each classification system or by each classification category. For example, if a keyword to be searched is input, the corresponding category of each classification scheme corresponding to the input keyword is searched first, and accordingly, the search result is provided to the display means by dividing the classification scheme by each classification scheme. It is possible to preferentially recommend information about a resource of a classification category having a high resource to provide a search result. In addition, when providing a search result, the resources of the classification system that includes the most input keywords are displayed first for each classification category, and the resources of the other classification systems that have the highest association with the classification system are displayed. It may be displayed for each classification category.
이하, 도 3 내지 도 5을 참조하여, 본 발명의 일실시예에 따른 시멘틱 검색 시스템에서의 분류 카테고리간 연관 관계 설정 방법을 좀더 자세히 설명한다. Hereinafter, a method of setting association relations between classification categories in the semantic search system according to an embodiment of the present invention will be described in detail with reference to FIGS. 3 to 5.
수 많은 리소스들에 대한 검색을 용이하게 할 수 있도록 기본적으로 리소스에는 미리 정해진 분류 정보가 포함될 수 있는데, 이와 같은 분류 정보에는 다양한 분야에서 사용되고 있는 도 1과 같은 각 분류 체계에서 계층 구조의 분류 카테고리에 대한 정보가 포함될 수 있다. 이와 같은 분류 정보는 해당 리소스의 속성 정보 중의 하나로서 리소스에 부여되는 메타데이터에 포함될 수 있다. In order to facilitate searching for a large number of resources, a resource may basically include predetermined classification information. Such classification information may be classified into a classification category of a hierarchical structure in each classification system as shown in FIG. 1 used in various fields. Information may be included. Such classification information may be included in metadata that is assigned to a resource as one of attribute information of the corresponding resource.
이와 같이 리소스 또는 메타데이터에는 분류정보가 포함되지만, 각 분류 체계 상에서는 서로 다른 분류 컨셉을 적용하여 분류 카테고리를 정하고 있기 때문에, 타 분류 체계의 분류 카테고리 간 연관성을 파악하기는 쉽지 않다. 예를 들어, 도서 등의 분류를 위하여 서지학에서 사용하는 KDC나 DDC분류 체계에서, 대분류, 중분류, 소분류, 세분류 등의 해당 분류 카테고리들 간에 정확히 일치되는 동일한 분류 카테고리인지 또는 어느 정도 유사성을 가지고 연관성이 있는 분류 카테고리 인지 여부를 파악하기 위하여, 검색 결과를 보고 사용자가 자신의 지식을 바탕으로 구분해 내야만 하는 어려움이 있다. 따라서, 본 발명에서는 분류 체계를 구분하여 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 검색 결과로서 자동으로 제공하지 못하는 어려움을 극복하고자 하였다. 또한, 본 발명에서는 해당 리소스가 속하는 분류 카테고리가 없는 경우(예를 들어, 분류 정보가 없는 경우)에도 다른 분류 체계의 분류 카테고리와 연관 관계를 맺어 주어 자동 분류함으로써 연관성 있는 검색 결과가 일목 요연하게 정리되어 제시될 수 있도록 지원할 수 있다. As such, although the classification information is included in the resource or the metadata, different classification concepts are applied to each classification system to determine classification categories, and thus it is not easy to grasp the association between classification categories of other classification systems. For example, in the KDC or DDC classification system used in the bibliography for the classification of books, it is the same classification category that is exactly matched between the corresponding classification categories such as major classification, subclassification, subclassification, and subclassification, In order to determine whether a classification category exists, there is a difficulty in that the user must look at the search results and classify based on his or her knowledge. Accordingly, the present invention is intended to overcome the difficulty of automatically classifying the classification system and automatically providing the resources of the other classification system with the most established association as a search result. In addition, in the present invention, even when there is no classification category to which the resource belongs (e.g., when there is no classification information), the relevant search results are clearly arranged by automatically associating with a classification category of another classification system. Can be presented and presented.
도 3 또는 도 4에서, 리소스 또는 해당 메타데이터에는 미리 정해진 분류 카테고리(분류 1-1, 1-2.../분류 2-1, 2-2...)를 포함한 분류 정보가 포함된다. 제1 분류 체계의 각 분류 카테고리(분류 1-1, 1-2...1-n)를 제2 분류 체계의 어느 하나 이상의 분류 카테고리(분류 2-1, 2-2...2-k)와 연관 관계를 설정하기 위하여, 먼저, 소정 관계 모델 설정 수단은 리소스의 언어 정보, 예를 들어, 제목, 주제, 내용 등 형태소 분석이 가능한 정보로부터 필요한 키워드들(키워드 1,2..m)을 추출하여 학습 셋(set)을 준비할 수 있다. 키워드들(키워드 1,2..m)은 각 품사별, 예를 들어, 명사, 부사, 형용사, 동사 등으로 구분하여 대량으로 자동 추출될 수 있다. In FIG. 3 or FIG. 4, the resource or corresponding metadata includes classification information including a predetermined classification category (classification 1-1, 1-2... / Classification 2-1, 2-2...). Each classification category (classifications 1-1, 1-2 ... 1-n) of the first classification system is assigned to one or more classification categories (classifications 2-1, 2-2 ... 2-k) of the second classification system. In order to establish an association relationship, first, a predetermined relationship model setting means includes keywords (keywords 1,2..m) required from language information of a resource, for example, information that can be morphologically analyzed, such as a title, a subject, and a content. We can prepare a learning set by extracting. The keywords (keywords 1,2..m) may be automatically extracted in large quantities by being divided into parts of speech, for example, nouns, adverbs, adjectives, and verbs.
키워드들(키워드 1,2..m)이 추출되면, 관계 모델 설정 수단은 각 키워드가 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)에 대하여 갖는 제1 유사도값(S1)과 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)에 대하여 갖는 제2 유사도값(S2)을 계산하며, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이에 기초하여 연관 관계를 설정할 수 있다.Once the keywords (keywords 1,2..m) are extracted, the relationship model setting means determines that the first similarity value S1 that each keyword has for the classification category (eg, classification 1-1) of the first classification system. And a second similarity value S2 for a classification category (eg, classification 2-1) of the second classification system, and calculates a difference between the first similarity value S1 and the second similarity value S2. You can set up an association based on that.
[수학식 1][Equation 1]
S1 = f1 -1*W1 -1 + f1 -2*W1 -2 + f1 -3*W1 -3 + .. + f1 -n*W1 -n..S1 = f 1 -1 * W 1 -1 + f 1 -2 * W 1 -2 + f 1 -3 * W 1 -3 + .. + f 1 -n * W 1 -n ..
[수학식 2][Equation 2]
S2 = f2 -1*W2 -1 + f2 -2*W2 -2 + f2 -3*W2 -3 + .. + f2 -n*W2 -n..S2 = f 2 -1 * W 2 -1 + f 2 -2 * W 2 -2 + f 2 -3 * W 2 -3 + .. + f 2 -n * W 2 -n ..
제1 유사도값(S1)과 제2 유사도값(S2) 각각은 위의 식들과 같이, 키워드가 각 분류 카테고리의 리소스에서 출현하는 빈도수(f1 -1, f1 -2, f1 -3.. f1 -n/ f2 -1, f2 -2, f2 -3.. f2 -n)와 해당 리소스가 속하는 분류 카테고리에 대하여 미리 설정한 가중치(W1 -1, W1-2, W1 -3.. W1 -n/ W2 -1, W2 -2, W2 -3.. W2 -n)의 곱으로 계산될 수 있다. 각 분류체계에서의 해당 분류 카테고리의 레벨을 고려하여 위와 같은 가중치가 적절히 설정될 수 있다. Each of the first similarity value S1 and the second similarity value S2 is a frequency f 1 -1 , f 1 -2 , f 1 -3 , in which keywords appear in resources of each classification category, as in the above expressions. f 1 -n / f 2 -1 , f 2 -2 , f 2 -3 .. f 2 -n ) and the preset weights (W 1 -1 , W 1-2 ) for the classification category to which the resource belongs. , W 1 -3 .. W 1 -n / W 2 -1 , W 2 -2 , W 2 -3 .. W 2 -n ). The above weights may be appropriately set in consideration of the level of the corresponding classification category in each classification system.
이와 같은 방법으로 각 키워드(키워드 1,2..m)에 대하여 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)와 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)의 연관 관계를 설정할 수 있다. 예를 들어, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이가 임계치(T%), 예를 들어, 10% 이하인 경우에, 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1) 리소스들의 키워드들과 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1) 리소스들의 키워드들 사이에 많은 일치하는 키워드 들이 있는 것으로 보아 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)와 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)는 연관 관계가 있는 것으로 설정된다. 또한, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이가 임계치(T%), 예를 들어, 10%를 초과하는 경우에는, 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1) 리소스들의 키워드들은 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1) 리소스들의 키워드들과 대부분 일치하지 않는 것으로 보아 제1 분류 체계의 분류 카테고리(예를 들어, 분류 1-1)와 제2 분류 체계의 분류 카테고리(예를 들어, 분류 2-1)는 연관 관계가 없는 것으로 결정된다. 여기서, 연관 관계 설정의 기초가 되는 제1 유사도값(S1)과 제2 유사도값(S2)의 차이에 대한 임계치(T%)는 10%에 한정되는 것이 아니라, 경우에 따라서는 그 이상 또는 그 이하의 값으로 설정될 수 있다. In this manner, for each keyword (keywords 1,2..m), the classification category of the first classification system (eg, classification 1-1) and the classification category of the second classification system (eg, classification 2- Association relationship of 1) can be set. For example, when the difference between the first similarity value S1 and the second similarity value S2 is less than or equal to the threshold T%, for example, 10%, the classification category of the first classification scheme (eg, Classification 1-1) As there are many matching keywords between keywords of resources and the classification category of the second classification system (eg, classification 2-1) resources, the classification category of the first classification system (eg For example, classification 1-1) and a classification category (eg, classification 2-1) of the second classification system are set as being related. In addition, when the difference between the first similarity value S1 and the second similarity value S2 exceeds a threshold value T%, for example, 10%, a classification category (eg, Classification 1-1) The keywords of the resources do not match most of the keywords of the classification category (eg, classification 2-1) resources of the second classification system, so that the classification categories of the first classification system (eg, classification 1-1) and the classification category of the second classification system (eg, classification 2-1) are determined to be unrelated. Here, the threshold value (T%) for the difference between the first similarity value S1 and the second similarity value S2, which is the basis for establishing the association, is not limited to 10%, and in some cases, more or more than that. It can be set to the following values.
이와 같은 방식으로 제1 분류 체계의 분류 카테고리와 제2 분류 체계의 분류 카테고리의 연관 관계를 설정할 수 있고, 각 키워드에 대한 위와 같은 유사도값에 기초하여 연관 관계 모델 설정 수단을 통하여 도 5과 같이 두 분류 체계간 카테고리의 연관 관계의 셋을 자동으로 구축하여 데이터베이스화하고 관리하는 것이 가능하다. 이에 따라, 본 발명의 일시예예 따른 시멘틱 검색 서비스 시스템에서는, 다양한 분야에서 각기 다른 분류 체계로 온톨로지(ontology) 분류 스키마에 기초하여 데이터베이스화된 리소스들을 통합하여 다른 분야의 다른 분류 개념에 있는 분류와도 매핑된 연관 관계를 토대로 효율적으로 분류 카테고리를 추천하며 의미론적 리소스 검색 서비스를 수행할 수 있고, 사용자에게 쉽고 편리하게 풍부하고 정확한 검색 결과를 제공할 수 있게 된다.In this manner, an association relationship between the classification category of the first classification scheme and the classification category of the second classification scheme may be set, and through the association model setting means based on the similarity value for each keyword, as shown in FIG. It is possible to automatically establish a set of relations of categories between the classification schemes and to database and manage them. Accordingly, in the semantic search service system according to an exemplary embodiment of the present invention, a database is classified based on an ontology classification scheme in a different classification scheme in various fields, and is classified with a classification in another classification concept in another field. Based on the mapped associations, it is possible to efficiently recommend classification categories, perform semantic resource search services, and provide users with rich and accurate search results easily and conveniently.
도 3 내지 도 5과 같은 방식으로 연관 관계의 설정에 있어서, 해당 리소스가 속하는 분류 카테고리가 없는 경우, 예를 들어, 분류 카테고리와 같은 분류 정보를 포함한 메타 데이터가 없는 경우에도, 키워드가 해당 리소스에서 출현하는 빈도수만을 [수학식 1] 및 [수학식 2]에 적용하여 위와 같은 방식으로 연관 관계를 설정하여 줄 수 있다. 예를 들어, 해당 리소스가 속하는 분류 카테고리들에 대하여 미리 설정한 가중치(W1 -1, W1 -2, W1 -3.. W1 -n/ W2 -1, W2 -2, W2 -3.. W2 -n)를 모두 같은 값으로 하고 키워드가 해당 리소스에서 출현하는 빈도수(f1 -1, f1 -2, f1 -3.. f1 -n/ f2 -1, f2 -2, f2-3.. f2 -n)를 [수학식 1] 및 [수학식 2]에 적용하여 두 분류 카테고리에 대한 제1 유사도값(S1)과 제2 유사도값(S2)을 계산할 수 있다. 이에 따라, 제1 유사도값(S1)과 제2 유사도값(S2)의 차이가 임계치(T%), 예를 들어, 10% 이하인 경우에, 제1 분류 체계의 분류 카테고리에 속한 해당 리소스는 제2 분류 체계의 분류 카테고리와 연관 관계가 있는 것으로 채택되어 설정될 수 있다. 또한, 위와 같이 분류 카테고리가 없는 해당 리소스에서 새로운 키워드를 추출하여 반영하는 경우에도, 해당 새로운 키워드가 포함된 리소스를 위와 같이 채택된 다른 분류 체계와 연관 관계가 설정되도록 포함시킬 수 있다. In the setting of the association in the same manner as in FIGS. 3 to 5, when there is no classification category to which the corresponding resource belongs, even if there is no metadata including classification information such as, for example, the classification category, the keyword is associated with the resource. Only the frequency of appearance can be applied to [Equation 1] and [Equation 2] to establish an association in the above manner. For example, preset weights for the classification categories to which the resource belongs (W 1 -1 , W 1 -2 , W 1 -3 .. W 1 -n / W 2 -1 , W 2 -2 , W 2 -3 .. W 2- n ) all with the same value, and how often the keyword appears in the resource (f 1 -1 , f 1 -2 , f 1 -3 .. f 1 -n / f 2 -1 , f 2 -2 , f 2-3 .. f 2- n ) are applied to Equations 1 and 2 so that the first similarity value (S1) and the second similarity value ( S2) can be calculated. Accordingly, when the difference between the first similarity value S1 and the second similarity value S2 is less than or equal to the threshold value T%, for example, 10%, the corresponding resource belonging to the classification category of the first classification scheme may be determined. 2 It may be adopted and set as being related to the classification category of the classification system. In addition, even when a new keyword is extracted and reflected from a corresponding resource that does not have a classification category as described above, the resource including the new keyword may be included to establish an association relationship with another classification system adopted as described above.
이와 같은 타 분류 체계의 분류 카테고리 간 연관 관계의 설정은 리소스의 추가 시마다 위와 같은 방식으로 학습되도록 업데이트될 수 있으며, 업데이트마다 카테고리 간 연관 관계가 정확해져서 검색의 접근성이 더욱 향상된다. 이에 따라, 검색 결과 제공 수단에서는 입력되는 키워드가 포함된 해당 분류 체계의 리소스들 을 디스플레이 수단에 각 분류 카테고리별로 표시하는 데 있어서, 입력 키워드와 일치도가 높은 분류 체계의 리소스들을 각 분류 카테고리별로 우선적으로 표시하여 추천할 수 있으며, 이때, 해당 분류 체계와 위와 같은 연관 관계가 가장 많이 설정된 다른 분류 체계의 리소스들을 상기 우선하여 표시된 리소스들과 인접하게 각 분류 카테고리별로 표시하여 추천하는 것도 가능하다. The setting of the association between classification categories of other classification systems may be updated to learn in the same manner as the resource is added, and the association between the categories is accurate for each update, thereby further improving search accessibility. Accordingly, in the search result providing means for displaying the resources of the classification system including the input keyword for each classification category on the display means, the resources of the classification system with high agreement with the input keywords are preferentially for each classification category. In this case, it is also possible to display and recommend resources of another classification system in which the above-described association is most frequently established for each classification category adjacent to the resources indicated above.
이상에서와 같이 도면과 명세서에서 최적 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다. As described above, optimal embodiments have been disclosed in the drawings and the specification. Although specific terms have been used herein, they are used only for the purpose of describing the present invention and are not intended to limit the scope of the invention as defined in the claims or the claims. Therefore, those skilled in the art will understand that various modifications and equivalent other embodiments are possible from this. Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.
도 1은 본 발명의 일실시예에 따른 시멘틱 검색 시스템을 설명하기 위한 도면이다.1 is a diagram illustrating a semantic search system according to an embodiment of the present invention.
도2는 분류체계간의 계층구조와 다수분류간의 연관관계 구성을 설명하기 위한 도면이다.2 is a view for explaining the configuration of the relationship between the hierarchical structure and the majority classification between classification systems.
도 3은 제1 분류 체계와 키워드들 간의 연관성 매핑 방법을 설명하기 위한 도면이다.FIG. 3 is a diagram for describing an association mapping method between a first classification scheme and keywords.
도 4은 제2 분류 체계와 키워드들 간의 연관성 매핑 방법을 설명하기 위한 도면이다.4 is a diagram for describing a method for mapping association between a second classification scheme and keywords.
도 5은 키워드들과 분류 카테고리들의 간의 연관성 매핑 결과를 설명하기 위한 도면이다.FIG. 5 is a diagram for describing an association mapping result between keywords and classification categories.
Claims (8)
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020090044508A KR101079769B1 (en) | 2009-05-21 | 2009-05-21 | Semantic Search Method and System for Associating with Plurality of Classifications |
| PCT/KR2010/003156 WO2010134752A2 (en) | 2009-05-21 | 2010-05-19 | Semantic search method and system in which a plurality of classification systems are linked |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020090044508A KR101079769B1 (en) | 2009-05-21 | 2009-05-21 | Semantic Search Method and System for Associating with Plurality of Classifications |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20100125682A true KR20100125682A (en) | 2010-12-01 |
| KR101079769B1 KR101079769B1 (en) | 2011-11-04 |
Family
ID=43126646
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020090044508A Active KR101079769B1 (en) | 2009-05-21 | 2009-05-21 | Semantic Search Method and System for Associating with Plurality of Classifications |
Country Status (2)
| Country | Link |
|---|---|
| KR (1) | KR101079769B1 (en) |
| WO (1) | WO2010134752A2 (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20120118420A (en) * | 2011-04-18 | 2012-10-26 | 팔로 알토 리서치 센터 인코포레이티드 | Method for searching related documents based on and guided by meaningful entities |
| WO2013157712A1 (en) * | 2012-04-17 | 2013-10-24 | Park Suk-Il | Information search device, information search method, and computer-readable recording medium |
| KR20150112352A (en) | 2014-03-27 | 2015-10-07 | 에스케이플래닛 주식회사 | Apparatus and method for providing poi information using poi grouping |
| KR20190140533A (en) * | 2018-05-31 | 2019-12-20 | 가천대학교 산학협력단 | System and method for analysing korean relation using conceptnet |
| KR20190140534A (en) * | 2018-05-31 | 2019-12-20 | 가천대학교 산학협력단 | System and method for analysing a language relation using conceptnet |
| KR20200011028A (en) * | 2018-07-23 | 2020-01-31 | 세종대학교산학협력단 | Multiple-classifier integrated control system and method thereof |
| KR20200032067A (en) | 2014-03-27 | 2020-03-25 | 에스케이텔레콤 주식회사 | Apparatus and method for providing poi information using poi grouping |
| WO2021235617A1 (en) * | 2020-05-20 | 2021-11-25 | 위인터랙트 주식회사 | System for recommending scientific and technical knowledge information, and method therefor |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103761254B (en) * | 2013-12-26 | 2017-01-25 | 清华大学 | Multi-domain service theme matching recommendation method |
| CN110245170B (en) * | 2019-04-19 | 2021-11-16 | 联通数字科技有限公司 | Data processing method and system |
| CN111177412B (en) * | 2019-12-30 | 2023-03-31 | 成都信息工程大学 | Public logo bilingual parallel corpus system |
| CN113722489B (en) * | 2021-09-02 | 2023-10-31 | 珠海市新德汇信息技术有限公司 | Relationship analysis method based on NLP algorithm |
| CN114816763B (en) * | 2022-05-27 | 2024-04-05 | 京闽数科(北京)有限公司 | System and method for distributing computer resources by adopting big data technology |
| CN115098698B (en) * | 2022-06-22 | 2023-04-28 | 中电金信软件有限公司 | Method and device for constructing Schema model in knowledge graph |
| CN114882985B (en) * | 2022-07-11 | 2022-10-18 | 北京泽桥医疗科技股份有限公司 | Medicine multimedia management system and method based on database and AI algorithm identification |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20010104873A (en) * | 2000-05-16 | 2001-11-28 | 임갑철 | System for internet site search service using a meta search engine |
| KR20020069893A (en) * | 2001-02-28 | 2002-09-05 | 주식회사 인터넷과 꿈 | A methode of offer for search service by internet |
| KR100898454B1 (en) * | 2006-09-27 | 2009-05-21 | 야후! 인크. | Integrated Search Service System and Method |
-
2009
- 2009-05-21 KR KR1020090044508A patent/KR101079769B1/en active Active
-
2010
- 2010-05-19 WO PCT/KR2010/003156 patent/WO2010134752A2/en active Application Filing
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20120118420A (en) * | 2011-04-18 | 2012-10-26 | 팔로 알토 리서치 센터 인코포레이티드 | Method for searching related documents based on and guided by meaningful entities |
| WO2013157712A1 (en) * | 2012-04-17 | 2013-10-24 | Park Suk-Il | Information search device, information search method, and computer-readable recording medium |
| KR101347123B1 (en) * | 2012-04-17 | 2014-01-03 | 박석일 | Apparatus and Method for Searching Information, Computer Readable Recording Medium |
| KR20150112352A (en) | 2014-03-27 | 2015-10-07 | 에스케이플래닛 주식회사 | Apparatus and method for providing poi information using poi grouping |
| KR20200032067A (en) | 2014-03-27 | 2020-03-25 | 에스케이텔레콤 주식회사 | Apparatus and method for providing poi information using poi grouping |
| KR20190140533A (en) * | 2018-05-31 | 2019-12-20 | 가천대학교 산학협력단 | System and method for analysing korean relation using conceptnet |
| KR20190140534A (en) * | 2018-05-31 | 2019-12-20 | 가천대학교 산학협력단 | System and method for analysing a language relation using conceptnet |
| KR20200011028A (en) * | 2018-07-23 | 2020-01-31 | 세종대학교산학협력단 | Multiple-classifier integrated control system and method thereof |
| WO2021235617A1 (en) * | 2020-05-20 | 2021-11-25 | 위인터랙트 주식회사 | System for recommending scientific and technical knowledge information, and method therefor |
| KR20210143431A (en) * | 2020-05-20 | 2021-11-29 | 위인터랙트(주) | Scientific and technological information recommendation system and method thereof |
Also Published As
| Publication number | Publication date |
|---|---|
| KR101079769B1 (en) | 2011-11-04 |
| WO2010134752A2 (en) | 2010-11-25 |
| WO2010134752A3 (en) | 2011-03-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101079769B1 (en) | Semantic Search Method and System for Associating with Plurality of Classifications | |
| Tran et al. | Encoded summarization: summarizing documents into continuous vector space for legal case retrieval | |
| Wei et al. | A survey of faceted search | |
| US8051080B2 (en) | Contextual ranking of keywords using click data | |
| Caldarola et al. | An approach to ontology integration for ontology reuse | |
| US20070250487A1 (en) | Method and system for managing single and multiple taxonomies | |
| Im et al. | Linked tag: image annotation using semantic relationships between image tags | |
| Ojha et al. | Metadata driven semantically aware medical query expansion | |
| US9298818B1 (en) | Method and apparatus for performing semantic-based data analysis | |
| Roopak et al. | OntoKnowNHS: ontology driven knowledge centric novel hybridised semantic scheme for image recommendation using knowledge graph | |
| Koperwas et al. | Intelligent information processing for building university knowledge base | |
| Armentano et al. | NLP-based faceted search: Experience in the development of a science and technology search engine | |
| Gladun et al. | Semantics-driven modelling of user preferences for information retrieval in the biomedical domain | |
| Baazaoui Zghal et al. | A system for information retrieval in a medical digital library based on modular ontologies and query reformulation | |
| Xu et al. | Building spatial temporal relation graph of concepts pair using web repository | |
| Wei et al. | DF-Miner: Domain-specific facet mining by leveraging the hyperlink structure of Wikipedia | |
| Abramowicz et al. | Supporting topic map creation using data mining techniques | |
| Rajapoornima et al. | Personalized semantic retrieval of information from large scale blog data | |
| Tabarcea et al. | Framework for location-aware search engine | |
| Yan et al. | A multimodal retrieval and ranking method for scientific documents based on HFS and XLNet | |
| Kopsachilis et al. | Recommending Geo-semantically Related Classes for Link Discovery | |
| Amine et al. | A new semantic similarity approach for improving the results of an Arabic search engine | |
| Stanković et al. | Indexing of textual databases based on lexical resources: a case study for Serbian | |
| Zhang et al. | A semantics-based method for clustering of Chinese web search results | |
| Puustjärvi et al. | The problem of searching interdisciplinary learning objects |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20090521 |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20110120 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20110727 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20111028 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20111031 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| FPAY | Annual fee payment |
Payment date: 20141028 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
Payment date: 20141028 Start annual number: 4 End annual number: 4 |
|
| FPAY | Annual fee payment |
Payment date: 20151028 Year of fee payment: 5 |
|
| PR1001 | Payment of annual fee |
Payment date: 20151028 Start annual number: 5 End annual number: 5 |
|
| FPAY | Annual fee payment |
Payment date: 20161028 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
Payment date: 20161028 Start annual number: 6 End annual number: 6 |
|
| FPAY | Annual fee payment |
Payment date: 20171027 Year of fee payment: 7 |
|
| PR1001 | Payment of annual fee |
Payment date: 20171027 Start annual number: 7 End annual number: 7 |
|
| FPAY | Annual fee payment |
Payment date: 20181029 Year of fee payment: 8 |
|
| PR1001 | Payment of annual fee |
Payment date: 20181029 Start annual number: 8 End annual number: 8 |
|
| FPAY | Annual fee payment |
Payment date: 20191028 Year of fee payment: 9 |
|
| PR1001 | Payment of annual fee |
Payment date: 20191028 Start annual number: 9 End annual number: 9 |
|
| PR1001 | Payment of annual fee |
Payment date: 20201027 Start annual number: 10 End annual number: 10 |
|
| PR1001 | Payment of annual fee |
Payment date: 20211027 Start annual number: 11 End annual number: 11 |
|
| PR1001 | Payment of annual fee |
Payment date: 20221027 Start annual number: 12 End annual number: 12 |
|
| PR1001 | Payment of annual fee |
Payment date: 20231030 Start annual number: 13 End annual number: 13 |
|
| PR1001 | Payment of annual fee |
Payment date: 20241028 Start annual number: 14 End annual number: 14 |