[go: up one dir, main page]

KR102313285B1 - Travel information providing system that provides contents selected by credibility estimation - Google Patents

Travel information providing system that provides contents selected by credibility estimation Download PDF

Info

Publication number
KR102313285B1
KR102313285B1 KR1020190151724A KR20190151724A KR102313285B1 KR 102313285 B1 KR102313285 B1 KR 102313285B1 KR 1020190151724 A KR1020190151724 A KR 1020190151724A KR 20190151724 A KR20190151724 A KR 20190151724A KR 102313285 B1 KR102313285 B1 KR 102313285B1
Authority
KR
South Korea
Prior art keywords
travel
content
related content
reliability
chunk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020190151724A
Other languages
Korean (ko)
Other versions
KR20210063157A (en
Inventor
정성준
정재혁
이도윤
Original Assignee
(주) 미스터멘션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 미스터멘션 filed Critical (주) 미스터멘션
Priority to KR1020190151724A priority Critical patent/KR102313285B1/en
Publication of KR20210063157A publication Critical patent/KR20210063157A/en
Application granted granted Critical
Publication of KR102313285B1 publication Critical patent/KR102313285B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템에 관한 것으로서, 보다 구체적으로는 여행 정보 제공 시스템으로서, 여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠를 수집하는 정보 수집 모듈; 상기 수집된 여행 관련 콘텐츠에 대해 머신러닝을 적용하여, 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성하는 모델 구성 모듈; 상기 구성된 신뢰도 추정 모델을 이용해, 여행 관련 콘텐츠를 선별하는 콘텐츠 선별 모듈; 및 상기 선별된 여행 관련 콘텐츠를 여행자에게 제공하는 콘텐츠 제공 모듈을 포함하는 것을 그 구성상의 특징으로 한다.
본 발명에서 제안하고 있는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템에 따르면, 여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠에 대해 머신러닝을 적용하여 구성한 신뢰도 추정 모델을 이용해 선별된 여행 관련 콘텐츠를 제공함으로써, 잠재 여행자에게 품질 높은 여행 정보를 쉽게 제공하여 만족도를 높일 수 있다.
또한, 본 발명에서 제안하고 있는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템에 따르면, 여행 관련 콘텐츠에서 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성해 이용함으로써, 콘텐츠 자체의 품질과 콘텐츠 작성자의 품질을 모두 고려하여, 다른 검색엔진이나 소셜 미디어 등에 비하여, 신뢰성 있는 정보를 제공할 수 있다.
The present invention relates to a travel information providing system for providing content selected by reliability estimation, and more particularly, to a travel information providing system, comprising: an information collection module for collecting travel-related content including travel course and accommodation reviews; a model configuration module for constructing a reliability estimation model for estimating the reliability of the content based on the extracted keyword's importance, the author's evaluation level, and the recommendation level by applying machine learning to the collected travel-related contents; a content selection module for selecting travel-related content using the constructed reliability estimation model; and a content providing module that provides the selected travel-related content to travelers.
According to the travel information providing system that provides content selected by reliability estimation proposed in the present invention, travel selected using a reliability estimation model constructed by applying machine learning to travel-related content including travel course and accommodation reviews By providing relevant content, you can easily provide high-quality travel information to potential travelers to increase their satisfaction.
In addition, according to the travel information providing system that provides content selected by reliability estimation proposed in the present invention, the reliability of content is estimated based on the importance of keywords extracted from travel-related content, and the rating and recommendation of the author. By constructing and using a reliability estimation model for

Description

신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템{TRAVEL INFORMATION PROVIDING SYSTEM THAT PROVIDES CONTENTS SELECTED BY CREDIBILITY ESTIMATION}TRAVEL INFORMATION PROVIDING SYSTEM THAT PROVIDES CONTENTS SELECTED BY CREDIBILITY ESTIMATION

본 발명은 여행 정보 제공 시스템에 관한 것으로서, 보다 구체적으로는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템에 관한 것이다.The present invention relates to a system for providing travel information, and more particularly, to a system for providing content selected by reliability estimation.

여가 시간이 늘어나고, 소셜 미디어의 활발한 이용을 통해 여행지에 대한 많은 정보가 공유되면서, 여가 활동의 하나로 여행이 크게 인기를 얻고 있다.As leisure time increases and a lot of information about destinations is shared through active use of social media, travel is gaining popularity as one of leisure activities.

이에 따라 여행을 가는 지역이나 그 주변 지역에 대한 정보 수집을 위해 웹사이트 등을 검색하여 여행 코스를 계획하고, 이렇게 계획된 여행 코스를 따라 도보 및 차량을 이용해 관광, 음식, 쇼핑 등 다양한 경험을 하게 된다. 그러나 인터넷의 정보는 너무 광범위하여 사용자가 원하는 여행 정보를 찾는 데 큰 노력이 필요하다.Accordingly, in order to collect information about the area to be traveled or the surrounding area, a travel course is planned by searching a website, and along the planned travel course, various experiences such as sightseeing, food, and shopping can be experienced by walking or using a vehicle. . However, the information on the Internet is so extensive that it takes a lot of effort for users to find the travel information they want.

최근에는 단기 여행이 아닌 1달 살기 등 장기 여행에 관한 관심이 높아지고 있고, 장기 여행의 경우 단기 여행에 비해 고려해야 할 사항이 많으므로, 믿을만한 정보를 수집하는 것이 더욱 중요하다.Recently, interest in long-term travel, such as living for a month rather than short-term travel, is increasing, and in the case of long-term travel, there are many considerations compared to short-term travel, so it is more important to collect reliable information.

그러나 포털사이트나 소셜 미디어 등의 검증되지 않은 무분별한 콘텐츠는, 여행을 계획하고 있는 잠재 여행자에게 오히려 정확도가 낮거나 실질적인 가치가 없는 정보를 제공하며, 직접 경험한 것이 아닌 광고성 정보를 제공하기도 한다. 이처럼 많은 여행자가 정보 수집에 어려움을 겪고 있는바, 많은 양의 콘텐츠 중에서 콘텐츠 자체의 품질을 기준으로 선별하여, 높은 품질의 여행 정보를 제공하기 위한 기술의 개발이 필요하다.However, unverified and indiscriminate contents such as portal sites and social media provide information with low accuracy or no practical value to potential travelers who are planning a trip, and sometimes provide advertising information that is not directly experienced. As such, many travelers have difficulties in collecting information, so it is necessary to develop a technology to provide high-quality travel information by selecting the content itself from among a large amount of content.

한편, 본 발명과 관련된 선행기술로서, 공개특허 제10-2019-0093774호(발명의 명칭: 인터넷 정보 분석을 통한 여행정보제공 시스템, 공개일자: 2019년 08월 12일) 등이 개시된 바 있다.On the other hand, as prior art related to the present invention, Patent Publication No. 10-2019-0093774 (title of invention: travel information providing system through Internet information analysis, publication date: August 12, 2019) has been disclosed.

본 발명은 기존에 제안된 방법들의 상기와 같은 문제점들을 해결하기 위해 제안된 것으로서, 여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠에 대해 머신러닝을 적용하여 구성한 신뢰도 추정 모델을 이용해 선별된 여행 관련 콘텐츠를 제공함으로써, 잠재 여행자에게 품질 높은 여행 정보를 쉽게 제공하여 만족도를 높일 수 있는, 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템을 제공하는 것을 그 목적으로 한다.The present invention has been proposed to solve the above problems of the previously proposed methods, and travel-related content selected using a reliability estimation model constructed by applying machine learning to travel-related content including travel course and accommodation reviews An object of the present invention is to provide a travel information providing system that provides content selected by reliability estimation, which can increase satisfaction by easily providing high-quality travel information to potential travelers.

또한, 본 발명은, 여행 관련 콘텐츠에서 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성해 이용함으로써, 콘텐츠 자체의 품질과 콘텐츠 작성자의 품질을 모두 고려하여, 다른 검색엔진이나 소셜 미디어 등에 비하여, 신뢰성 있는 정보를 제공할 수 있는, 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템을 제공하는 것을 또 다른 목적으로 한다.In addition, the present invention constructs and uses a reliability estimation model for estimating the reliability of content based on the importance of keywords extracted from travel-related content, the rating and recommendation of the creator, and thus the quality of the content itself and the quality of the content creator Another object of the present invention is to provide a travel information providing system that provides content selected by reliability estimation, which can provide more reliable information compared to other search engines or social media in consideration of all of the above.

상기한 목적을 달성하기 위한 본 발명의 특징에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템은,A travel information providing system that provides content selected by reliability estimation according to a feature of the present invention for achieving the above object,

여행 정보 제공 시스템으로서,As a travel information providing system,

여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠를 수집하는 정보 수집 모듈;an information collection module for collecting travel-related content including travel course and accommodation reviews;

상기 수집된 여행 관련 콘텐츠에 대해 머신러닝을 적용하여, 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성하는 모델 구성 모듈;a model configuration module for constructing a reliability estimation model for estimating the reliability of the content based on the extracted keyword's importance, the author's evaluation level, and the recommendation level by applying machine learning to the collected travel-related contents;

상기 구성된 신뢰도 추정 모델을 이용해, 여행 관련 콘텐츠를 선별하는 콘텐츠 선별 모듈; 및a content selection module for selecting travel-related content using the constructed reliability estimation model; and

상기 선별된 여행 관련 콘텐츠를 여행자에게 제공하는 콘텐츠 제공 모듈을 포함하는 것을 그 구성상의 특징으로 한다.It is characterized in that it includes a content providing module that provides the selected travel-related content to travelers.

바람직하게는, 상기 모델 구성 모듈은,Preferably, the model configuration module,

(1) 상기 정보 수집 모듈에서 수집된 여행 관련 콘텐츠에서 키워드를 추출하고, 키워드의 중요도를 포함하는 청크를 구성하는 단계;(1) extracting a keyword from the travel-related content collected by the information collection module, and constructing a chunk including the importance of the keyword;

(2) 상기 여행 관련 콘텐츠를 작성한 작성자의 평가도를 산출하는 단계(2) calculating the rating of the author who wrote the travel-related content

(3) 상기 구성된 청크의 추천도를 산출하는 단계;(3) calculating a recommendation degree of the configured chunk;

(4) 상기 작성자의 평가도, 청크에 포함된 중요도 및 청크의 추천도에 따라, 청크를 클러스터링하는 단계; 및(4) clustering chunks according to the rating of the author, the importance included in the chunk, and the recommendation degree of the chunk; and

(5) 상기 클러스터링 결과에 따라 각 클러스터별 신뢰도를 설정하여 신뢰도 추정 모델을 구성하는 단계를 수행하여 상기 신뢰도 추정 모델을 구성할 수 있다.(5) The reliability estimation model may be configured by performing the step of configuring the reliability estimation model by setting the reliability for each cluster according to the clustering result.

더욱 바람직하게는, 상기 단계 (1)은,More preferably, the step (1) is

(1-1) 상기 정보 수집 모듈에서 수집된 여행 관련 콘텐츠를 주제별로 분류하는 단계;(1-1) classifying the travel-related content collected by the information collection module by subject;

(1-2) 상기 여행 관련 콘텐츠에서 키워드를 추출하고, 추출한 키워드의 중요도를 계산하는 단계; 및(1-2) extracting keywords from the travel-related content and calculating the importance of the extracted keywords; and

(1-3) 상기 키워드의 중요도 정보를 포함하는 청크를 구성하는 단계를 포함할 수 있다.(1-3) may include the step of constructing a chunk including the importance information of the keyword.

더욱 바람직하게는, 상기 단계 (2)에서는,More preferably, in step (2),

상기 여행 관련 콘텐츠가 작성된 플랫폼에서의 상기 작성자의 등급, 레벨, 인기도, 참여도, 지성도, 신뢰도 및 콘텐츠 작성 개수를 포함하는 군에서 선택된 적어도 하나 이상을 이용해 상기 작성자의 평가도를 산출할 수 있다.The rating of the author may be calculated using at least one selected from the group including the rating, level, popularity, participation, intelligence, reliability, and number of content creation of the author on the platform where the travel-related content is written. .

더더욱 바람직하게는, 상기 단계 (2)에서는,Even more preferably, in step (2),

상기 작성자의 성별, 나이 및 직업 중 적어도 하나에 따라 작성자의 신뢰도를 상이하게 설정할 수 있다.The author's reliability may be set differently according to at least one of the author's gender, age, and occupation.

더욱 바람직하게는, 상기 단계 (3)에서는,More preferably, in step (3),

상기 청크와 관련된 여행 관련 콘텐츠에 대한 추천수, 댓글수, 찬반수 및 조회수를 포함하는 군에서 선택된 적어도 하나에 기반하여, 추천, 중립 및 비추천으로 상기 청크를 분류하고, 분류에 따라 추천도를 설정할 수 있다.Based on at least one selected from the group including the number of recommendations, the number of comments, the number of pros and cons, and the number of views for the travel-related content related to the chunk, the chunk is classified into recommended, neutral, and non-recommended, and the degree of recommendation can be set according to the classification have.

더욱 바람직하게는, 상기 단계 (4)에서는,More preferably, in step (4),

응집 계층적 클러스터링(Hierarchical Agglomerative Clustering)을 이용해 상기 청크를 클러스터링하며, 엘보 평가(Elbow Criterion)를 이용하여 클러스터의 개수를 결정할 수 있다.The chunks are clustered using Hierarchical Agglomerative Clustering, and the number of clusters may be determined using Elbow Criterion.

바람직하게는, 상기 콘텐츠 선별 모듈은,Preferably, the content selection module comprises:

입력받은 검색어에 대해 여행 관련 콘텐츠를 검색하고, 상기 신뢰도 추정 모델을 이용해 검색된 여행 관련 콘텐츠 중 신뢰도가 미리 설정된 기준 이상인 콘텐츠를 선별할 수 있다.Travel-related content may be searched for the input search word, and content having a reliability greater than or equal to a preset criterion may be selected from among the searched travel-related content using the reliability estimation model.

본 발명에서 제안하고 있는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템에 따르면, 여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠에 대해 머신러닝을 적용하여 구성한 신뢰도 추정 모델을 이용해 선별된 여행 관련 콘텐츠를 제공함으로써, 잠재 여행자에게 품질 높은 여행 정보를 쉽게 제공하여 만족도를 높일 수 있다.According to the travel information providing system that provides content selected by reliability estimation proposed in the present invention, travel selected using a reliability estimation model constructed by applying machine learning to travel-related content including travel course and accommodation reviews By providing relevant content, you can easily provide high-quality travel information to potential travelers to increase their satisfaction.

또한, 본 발명에서 제안하고 있는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템에 따르면, 여행 관련 콘텐츠에서 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성해 이용함으로써, 콘텐츠 자체의 품질과 콘텐츠 작성자의 품질을 모두 고려하여, 다른 검색엔진이나 소셜 미디어 등에 비하여, 신뢰성 있는 정보를 제공할 수 있다.In addition, according to the travel information providing system that provides content selected by reliability estimation proposed in the present invention, the reliability of content is estimated based on the importance of keywords extracted from travel-related content, and the rating and recommendation of the author. By constructing and using a reliability estimation model that

도 1은 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템을 포함하는 전체 구성을 도시한 도면.
도 2는 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템의 세부적인 구성을 도시한 도면.
도 3은 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템의 모델 구성 모듈에서 처리되는 과정의 세부적인 흐름을 도시한 도면.
도 4는 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템의 모델 구성 모듈이 처리하는 단계 S100의 세부적인 흐름을 도시한 도면.
1 is a view showing an overall configuration including a travel information providing system for providing content selected by reliability estimation according to an embodiment of the present invention.
2 is a diagram illustrating a detailed configuration of a travel information providing system for providing content selected by reliability estimation according to an embodiment of the present invention;
3 is a diagram illustrating a detailed flow of a process processed in a model configuration module of a travel information providing system that provides content selected by reliability estimation according to an embodiment of the present invention.
4 is a diagram illustrating a detailed flow of step S100 processed by a model configuration module of a travel information providing system that provides content selected by reliability estimation according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 바람직한 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예를 상세하게 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 유사한 기능 및 작용을 하는 부분에 대해서는 도면 전체에 걸쳐 동일한 부호를 사용한다.Hereinafter, preferred embodiments will be described in detail so that those of ordinary skill in the art can easily practice the present invention with reference to the accompanying drawings. However, in describing a preferred embodiment of the present invention in detail, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, the same reference numerals are used throughout the drawings for parts having similar functions and functions.

덧붙여, 명세서 전체에서, 어떤 부분이 다른 부분과 ‘연결’ 되어 있다고 할 때, 이는 ‘직접적으로 연결’ 되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 ‘간접적으로 연결’ 되어 있는 경우도 포함한다. 또한, 어떤 구성요소를 ‘포함’ 한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.In addition, throughout the specification, when a part is 'connected' with another part, it is not only 'directly connected' but also 'indirectly connected' with another element interposed therebetween. include In addition, "including" a certain component means that other components may be further included, rather than excluding other components, unless otherwise stated.

도 1은 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)을 포함하는 전체 구성을 도시한 도면이다. 도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)은, 여행 관련 콘텐츠가 게시 및 공유되는 웹/앱 등 다양한 플랫폼을 통해 다수의 여행 관련 콘텐츠를 수집하고, 이를 분석 및 선별하여 사용자 단말기(20)에 제공할 수 있다. 사용자 단말기(20)는, 여행 정보 제공 시스템(10)이 운영하는 웹사이트나 애플리케이션 등에 접속하여, 검색 조건을 입력하여 검색을 요청하거나 원하느 카테고리를 선택하여, 신뢰도 추정에 따라 선별된 품질 높은 여행 관련 콘텐츠를 제공받을 수 있다.1 is a diagram illustrating an overall configuration including a travel information providing system 10 that provides content selected by reliability estimation according to an embodiment of the present invention. As shown in FIG. 1 , the travel information providing system 10 for providing content selected by reliability estimation according to an embodiment of the present invention provides various platforms such as a web/app on which travel-related content is posted and shared. Through this, a plurality of travel-related contents may be collected, analyzed and selected, and provided to the user terminal 20 . The user terminal 20 accesses a website or application operated by the travel information providing system 10, requests a search by inputting search conditions, or selects a desired category, and selects a high-quality travel related according to reliability estimation. content can be provided.

여기서, 사용자 단말기(20)는, 스마트폰, 태블릿(tablet) PC(personal computer), 이동 전화기, 영상 전화기, 전자책 리더기, 데스크탑(desktop) PC, 랩탑(laptop) PC, 넷북(netbook) 컴퓨터, 워크스테이션(workstation), 서버(server), PDA(personal digital assistant), 미디어 박스, 게임 콘솔, 전자사전 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수 있으며, 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트렌즈), 또는 머리 착용형 장치(HMD, head mounted device), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식형 회로(implantable circuit) 중 적어도 하나를 포함할 수 있다.Here, the user terminal 20 is a smartphone, a tablet PC (personal computer), a mobile phone, a video phone, an e-book reader, a desktop PC, a laptop PC, a netbook computer, It may include at least one of a workstation, a server, a personal digital assistant (PDA), a media box, a game console, an electronic dictionary, or a wearable device, and the wearable device is an accessory type (eg, Watches, rings, bracelets, anklets, necklaces, glasses, contact lenses), or head mounted devices (HMDs), integrated with textiles or clothing (e.g. electronic garments), body-worn (e.g. skin pads) pad or tattoo), or at least one of an implantable circuit.

다만, 본 발명의 사용자 단말기(20)가 나열한 바와 같은 단말기의 형태에 한정되는 것은 아니며, 네트워크를 통해 여행 정보 제공 시스템(10)에 접속하여 신뢰도 추정 모델을 이용해 선별된 여행 관련 콘텐츠를 제공받아 출력할 수 있다면, 구체적인 단말기의 형태와 관계없이 본 발명의 사용자 단말기(20)의 역할을 얼마든지 할 수 있다. 또한, 사용자 단말기(20)는 전술한 다양한 장치 중 둘 이상의 조합일 수도 있다.However, the user terminal 20 of the present invention is not limited to the form of the terminal as listed, and the travel information providing system 10 is connected through a network to receive and output selected travel-related content using a reliability estimation model. If possible, the role of the user terminal 20 of the present invention can be freely performed regardless of the specific terminal type. Also, the user terminal 20 may be a combination of two or more of the various devices described above.

한편, 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network), 위성 통신망, 블루투스(Bluetooth), Wibro(Wireless Broadband Internet), HSDPA(High Speed Downlink Packet Access), LTE(Long Term Evolution), 5G(5th Generation Mobile Telecommunication) 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다.On the other hand, the network is a wired network such as a local area network (LAN), a wide area network (WAN) or a value added network (VAN), or a mobile communication network (mobile radio communication network), a satellite communication network, It may be implemented in all types of wireless networks such as Bluetooth, Wireless Broadband Internet (Wibro), High Speed Downlink Packet Access (HSDPA), Long Term Evolution (LTE), and 5th Generation Mobile Telecommunication (5G).

도 2는 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)의 세부적인 구성을 도시한 도면이다. 도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)은, 정보 수집 모듈(100), 모델 구성 모듈(200), 콘텐츠 선별 모듈(300) 및 콘텐츠 제공 모듈(400)을 포함하여 구성될 수 있다.2 is a diagram illustrating a detailed configuration of a travel information providing system 10 that provides content selected by reliability estimation according to an embodiment of the present invention. As shown in FIG. 2 , the travel information providing system 10 for providing content selected by reliability estimation according to an embodiment of the present invention includes an information collection module 100 , a model construction module 200 , and content It may be configured to include a selection module 300 and a content providing module 400 .

정보 수집 모듈(100)은, 여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠를 수집할 수 있다. 보다 구체적으로, 정보 수집 모듈(100)은, 크롤러를 통해 웹상의 여행 관련 콘텐츠를 수집하며, 텍스트, 이미지 및 비디오를 포함하는 다양한 형태의 여행 관련 콘텐츠를 수집할 수 있다. 또한, 여행 관련 콘텐츠는, 여행 코스, 숙소 리뷰뿐 아니라, 음식점 리뷰, 렌터카 리뷰, 항공사 리뷰, 관광지 리뷰, 여행 팁 등 여행과 관련된 내용이라면 그 구체적인 종류와 상관없이 다양한 내용일 수 있다.The information collection module 100 may collect travel-related content including travel course and accommodation reviews. More specifically, the information collection module 100 may collect travel-related content on the web through a crawler, and may collect various types of travel-related content including text, images, and videos. In addition, the travel-related content may be a variety of content regardless of the specific type, as long as it is travel-related, such as a travel course and accommodation review, as well as a restaurant review, car rental review, airline review, tourist destination review, and travel tip.

모델 구성 모듈(200)은, 수집된 여행 관련 콘텐츠에 대해 머신러닝을 적용하여, 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성할 수 있다. 이하에서는, 도 3을 참조하여 모델 구성 모듈(200)이 신뢰도 추정 모델을 구성하는 과정의 구체적인 흐름에 대해 상세히 설명하도록 한다.The model configuration module 200 applies machine learning to the collected travel-related content to construct a reliability estimation model for estimating the reliability of the content based on the importance of the extracted keyword, the author's evaluation degree, and the recommendation degree. have. Hereinafter, with reference to FIG. 3 , a detailed flow of the process in which the model construction module 200 constructs a reliability estimation model will be described in detail.

도 3은 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)의 모델 구성 모듈(200)에서 처리되는 과정의 세부적인 흐름을 도시한 도면이다. 도 3에 도시된 바와 같이, 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)의 모델 구성 모듈(200)은, 여행 관련 콘텐츠에서 키워드를 추출하고 키워드의 중요도를 포함하는 청크를 구성하는 단계(S100), 여행 관련 콘텐츠를 작성한 작성자의 평가도를 산출하는 단계(S200), 청크의 추천도를 산출하는 단계(S300), 작성자의 평가도, 청크에 포함된 중요도 및 청크의 추천도에 따라 청크를 클러스터링하는 단계(S400) 및 각 클러스터별 신뢰도를 설정하여 신뢰도 추정 모델을 구성하는 단계(S500)를 처리하여 신뢰도 추정 모델을 구성할 수 있다.3 is a diagram illustrating a detailed flow of a process processed by the model configuration module 200 of the travel information providing system 10 for providing content selected by reliability estimation according to an embodiment of the present invention. As shown in FIG. 3 , the model configuration module 200 of the travel information providing system 10 that provides content selected by reliability estimation according to an embodiment of the present invention extracts keywords from travel-related content and Composing a chunk including the importance of the keyword (S100), calculating the rating of the author who wrote the travel-related content (S200), calculating the recommendation of the chunk (S300), the author's rating, the chunk The reliability estimation model may be configured by processing the steps of clustering chunks ( S400 ) and configuring the reliability estimation model by setting the reliability for each cluster ( S500 ) according to the importance included in and the recommendation degree of the chunks.

단계 S100에서는, 정보 수집 모듈(100)에서 수집된 여행 관련 콘텐츠에서 키워드를 추출하고, 키워드의 중요도를 포함하는 청크를 구성할 수 있다. 이하에서는, 도 4를 참조하여 단계 S100의 세부적인 흐름에 대해 상세히 설명하도록 한다.In step S100 , a keyword may be extracted from the travel-related content collected by the information collection module 100 , and a chunk including the importance of the keyword may be configured. Hereinafter, the detailed flow of step S100 will be described in detail with reference to FIG. 4 .

도 4는 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)의 모델 구성 모듈(200)이 처리하는 단계 S100의 세부적인 흐름을 도시한 도면이다. 도 4에 도시된 바와 같이, 본 발명의 일실시예에 따른 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)의 단계 S100은, 여행 관련 콘텐츠를 주제별로 분류하는 단계(S110), 여행 관련 콘텐츠에서 키워드를 추출하고 추출한 키워드의 중요도를 계산하는 단계(S120) 및 키워드의 중요도 정보를 포함하는 청크를 구성하는 단계(S130)를 포함하여 구현될 수 있다.4 is a diagram illustrating a detailed flow of step S100 processed by the model configuration module 200 of the travel information providing system 10 for providing content selected by reliability estimation according to an embodiment of the present invention. As shown in FIG. 4 , step S100 of the travel information providing system 10 for providing content selected by reliability estimation according to an embodiment of the present invention is a step of classifying travel-related content by subject (S110). , extracting a keyword from travel-related content, calculating the importance of the extracted keyword (S120), and configuring a chunk including the importance information of the keyword (S130).

단계 S110에서는, 정보 수집 모듈(100)에서 수집된 여행 관련 콘텐츠를 주제별로 분류할 수 있다. 예를 들어, 여행 장소로 먼저 분류를 하고, 여행 코스, 숙소 리뷰 등의 콘텐츠 대상에 따른 분류, 할 일(things to do), 관광 명소, 맛집 등 콘텐츠 특성에 따른 분류 등 다양한 주제별로 분류할 수 있다.In step S110, the travel-related content collected by the information collection module 100 may be classified by subject. For example, you can first classify by travel location, then classify by various topics, such as classifying by content target such as travel courses and accommodation reviews, and classifying by content characteristics such as things to do, tourist attractions, and restaurants. have.

단계 S120에서는, 여행 관련 콘텐츠에서 키워드를 추출하고, 추출한 키워드의 중요도를 계산할 수 있다. 단계 S120에서 키워드는, 여행 관련 콘텐츠의 핵심 내용을 반영한 것으로, 텍스트 마이닝을 통해 키워드를 추출할 수 있다. 보다 구체적으로, 단계 S120에서는, TF(Term Frequency), IDF(Inverse Document Frequency), TF-IDF(Term Frequency-Inverse Document Frequency), 딥러닝을 이용한 추상적 요약(abstractive summarization) 등을 이용해 키워드를 추출하고, 각 키워드의 중요도를 계산할 수 있다. 실시예에 따라서는, 주제별로 핵심 키워드를 미리 설정해 두고, 각 핵심 키워드의 중요도를 TF, IDF, RF-IDF 등의 텍스트 마이닝을 이용해 계산할 수도 있다.In step S120, a keyword may be extracted from the travel-related content, and the importance of the extracted keyword may be calculated. In step S120, the keywords reflect the core contents of travel-related content, and keywords may be extracted through text mining. More specifically, in step S120, keywords are extracted using TF (Term Frequency), IDF (Inverse Document Frequency), TF-IDF (Term Frequency-Inverse Document Frequency), abstract summarization using deep learning, etc. , it is possible to calculate the importance of each keyword. In some embodiments, key keywords may be preset for each subject, and the importance of each key keyword may be calculated using text mining such as TF, IDF, and RF-IDF.

단계 S130에서는, 키워드의 중요도 정보를 포함하는 청크를 구성할 수 있다. 즉, 단계 S130에서는, 단계 S120에서 계산된 키워드의 중요도와 키워드를 청크(chunk)로 구성할 수 있다. 이때, 여행 관련 콘텐츠마다 하나의 청크를 구성함으로써, 각 여행 관련 콘텐츠에 대한 정보가 하나의 청크로 표현되도록 할 수 있다. 또한, 청크에는 여러 키워드의 중요도 정보가 포함되므로, 여러 키워드의 중요도 정보를 종합하여 청크의 중요도를 계산할 수도 있다.In step S130, a chunk including the importance information of the keyword may be configured. That is, in step S130, the importance of the keyword calculated in step S120 and the keyword may be configured in chunks. In this case, by configuring one chunk for each travel-related content, information on each travel-related content may be expressed in one chunk. In addition, since importance information of several keywords is included in a chunk, the importance information of several keywords may be aggregated to calculate the importance of a chunk.

추가적으로, 모델 구성 모듈(200)은, 단계 S130에서 구성된 청크를 전처리(preprocessing)하고, 형태소 단위로 분리할 수 있다. 보다 구체적으로, 청크를 벡터화(vectorization), 정규화(normalization), 누락된 값 처리, 특징 추출(feature extraction)을 통해 전처리하고, 청크를 형태소 단위로 분리할 수 있다.Additionally, the model configuration module 200 may preprocess the chunk configured in step S130 and separate it into morpheme units. More specifically, the chunk may be preprocessed through vectorization, normalization, missing value processing, and feature extraction, and the chunk may be separated into morpheme units.

단계 S200에서는, 여행 관련 콘텐츠를 작성한 작성자의 평가도를 산출할 수 있다. 즉, 단계 S200에서는, 여행 관련 콘텐츠를 작성한 콘텐츠 출처를 평가할 수 있다. 단계 S200에서 산출된 작성자의 평가도가 높으면, 해당 작성자는 높은 품질의 콘텐츠를 작성할 가능성이 높은 것으로 판단할 수 있다.In step S200, it is possible to calculate the evaluation degree of the creator who created the travel-related content. That is, in step S200, the content source that created the travel-related content may be evaluated. If the evaluation degree of the author calculated in step S200 is high, it may be determined that the author is highly likely to create high-quality content.

보다 구체적으로, 단계 S200에서는, 여행 관련 콘텐츠가 작성된 플랫폼에서의 작성자의 등급, 레벨, 인기도, 참여도, 지성도, 신뢰도 및 콘텐츠 작성 개수를 포함하는 군에서 선택된 적어도 하나 이상을 이용해 작성자의 평가도를 산출할 수 있다. 이때, 단계 S200에서는, 작성자의 성별, 나이 및 직업 중 적어도 하나에 따라 작성자의 신뢰도를 상이하게 설정할 수 있다. 즉, 단계 S200에서의 신뢰도는, 콘텐츠의 작성자가 얼마나 믿을만한지에 대한 출처의 신뢰도를 의미하는 것으로서, 여행 관련 콘텐츠의 신뢰도와는 상이한 개념일 수 있다.More specifically, in step S200, the rating of the author using at least one selected from the group including the rating, level, popularity, participation, intelligence, reliability, and the number of content creation on the platform where travel-related content is written can be calculated. In this case, in step S200, the author's reliability may be set differently according to at least one of the author's gender, age, and occupation. That is, the reliability in step S200 means the reliability of the source for how reliable the creator of the content is, and may be a different concept from the reliability of the travel-related content.

단계 S300에서는, 구성된 청크의 추천도를 산출할 수 있다. 즉, 단계 S300에서는, 여행 관련 콘텐츠 자체에 대한 추천도를 평가하되, 여행 관련 콘텐츠에 대한 추천도를 기반으로 청크의 추천도를 산출함으로써, 청크 단위로 학습 및 처리가 가능하도록 할 수 있다.In step S300, a recommendation degree of the configured chunk may be calculated. That is, in step S300 , the recommendation degree of the travel-related content itself is evaluated, but the recommendation degree of the chunk is calculated based on the recommendation degree of the travel-related content, so that learning and processing can be performed in chunks.

보다 구체적으로, 단계 S300에서는, 청크와 관련된 여행 관련 콘텐츠에 대한 추천수, 댓글수, 찬반수 및 조회수를 포함하는 군에서 선택된 적어도 하나에 기반하여, 추천, 중립 및 비추천으로 청크를 분류하고, 분류에 따라 추천도를 설정할 수 있다. 이때, 분류 기준 및 분류에 따른 추천도는 미리 설정될 수 있다.More specifically, in step S300, based on at least one selected from the group including the number of recommendations, the number of comments, the number of pros and cons, and the number of views for travel-related content related to the chunk, the chunk is classified into recommended, neutral, and non-recommended, and the classification is performed. Recommendations can be set accordingly. In this case, the classification criteria and the recommendation degree according to the classification may be preset.

단계 S400에서는, 작성자의 평가도, 청크에 포함된 중요도 및 청크의 추천도에 따라, 청크를 클러스터링할 수 있다. 즉, 단계 S400에서는, 단계 S100에서 계산되어 청크를 구성하도록 한 키워드의 중요도, 단계 S200에서 산출된 작성자의 평가도, 단계 S300에서 산출된 청크의 추천도 등을, 비지도 학습을 하는 머신러닝의 일종인 클러스터링 알고리즘에 입력하여, 청크를 클러스터링할 수 있다. 이때, 청크에는 여러 키워드의 중요도 정보가 포함되므로, 청크에 포함된 여러 키워드의 중요도의 총합, 평균 등을 청크의 중요도로 하여, 클러스터링에 청크의 중요도를 사용할 수 있다.In step S400, the chunks may be clustered according to the rating of the author, the importance included in the chunk, and the recommendation degree of the chunk. That is, in step S400, the importance of the keyword calculated in step S100 to compose the chunk, the evaluation degree of the creator calculated in step S200, the recommendation degree of the chunk calculated in step S300, etc. of machine learning for unsupervised learning By input to a kind of clustering algorithm, chunks can be clustered. At this time, since importance information of several keywords is included in the chunk, the importance of the chunks can be used for clustering by using the sum and average of the importance of several keywords included in the chunk as the importance of the chunk.

보다 구체적으로, 단계 S400에서는, 응집 계층적 클러스터링(Hierarchical Agglomerative Clustering)을 이용해 청크를 클러스터링하며, 엘보 평가(Elbow Criterion)를 이용하여 클러스터의 개수를 결정할 수 있다.More specifically, in step S400, chunks are clustered using Hierarchical Agglomerative Clustering, and the number of clusters may be determined using Elbow Criterion.

계층적 클러스터링(Hierarchical Clustering)은 데이터들을 연결하여 계층적으로 클러스터를 구성해나가는 방법으로, 최초에 클러스터 개수를 가정할 필요가 없다. 계층적 클러스터링에는, 응집형(Agglomerative)과 분리형(Divisive)이 있는데, 응집형 계층적 클러스터링은, 주어진 데이터에서 개별 데이터 하나하나를 독립된 하나의 클러스터로 가정하고, 이들을 알고리즘에 의해 병합하여 상위단계 클러스터를 구성하고, 상위단계 클러스터를 알고리즘에 의해 다시 병합하여 최종적으로 데이터 전체를 멤버로 하는 하나의 클러스터로 구성하는 방법이다. 본 발명에서는, 응집 계층적 클러스터링을 이용해 클러스터를 구성하면서, 최적의 클러스터 개수를 결정하기 위해 엘보 평가를 이용할 수 있다. 따라서 단계 S400에서는, 엘보 평가에 의해 결정된 클러스터의 개수로 모든 청크를 군집화할 수 있다.Hierarchical clustering is a method of constructing clusters hierarchically by connecting data, and there is no need to assume the number of clusters in the first place. In hierarchical clustering, there are Agglomerative and Divisive. Agglomerative hierarchical clustering assumes that each individual data in the given data is an independent cluster, and merges them by an algorithm to form a higher-level cluster. It is a method of constructing a cluster with all data as members by constructing the cluster and merging the upper-level cluster again by an algorithm. In the present invention, while constructing clusters using cohesive hierarchical clustering, elbow evaluation may be used to determine the optimal number of clusters. Accordingly, in step S400, all chunks may be clustered by the number of clusters determined by the elbow evaluation.

단계 S500에서는, 클러스터링 결과에 따라 각 클러스터별 신뢰도를 설정하여 신뢰도 추정 모델을 구성할 수 있다. 즉, 단계 S500에서는, 단계 S400에서 엘보 평가에 의해 결정된 클러스터의 개수에 따라 분류된 각각의 클러스터별 신뢰도를 설정할 수 있다. 이때, 클러스터의 개수가 3개이면, 신뢰도 상, 중, 하로 각각의 클러스터의 신뢰도를 설정할 수 있다.In step S500, a reliability estimation model may be configured by setting the reliability for each cluster according to the clustering result. That is, in step S500, the reliability for each cluster classified according to the number of clusters determined by the elbow evaluation in step S400 may be set. In this case, if the number of clusters is three, the reliability of each cluster may be set to high, medium, or low reliability.

콘텐츠 선별 모듈(300)은, 구성된 신뢰도 추정 모델을 이용해, 여행 관련 콘텐츠를 선별할 수 있다. 보다 구체적으로, 콘텐츠 선별 모듈(300)은, 입력받은 검색어에 대해 여행 관련 콘텐츠를 검색하고, 신뢰도 추정 모델을 이용해 검색된 여행 관련 콘텐츠 중 신뢰도가 미리 설정된 기준 이상인 콘텐츠를 선별할 수 있다. 여기서, 콘텐츠 선별 모듈(300)은, 사용자 단말기(20)로부터 여행자가 검색을 원하는 검색어를 입력받아 검색을 수행할 수 있다.The content selection module 300 may select travel-related content by using the constructed reliability estimation model. More specifically, the content selection module 300 may search for travel-related content with respect to the input search word, and select content having a reliability equal to or greater than a preset criterion among the searched travel-related content using a reliability estimation model. Here, the content selection module 300 may perform a search by receiving a search term that the traveler wants to search from the user terminal 20 .

또한, 콘텐츠 선별 모듈(300)은, 검색된 여행 관련 콘텐츠를 모델 구성 모듈(200)에 입력하여 단계 S100에서 구성된 청크의 형태소 분석을 통해, 분석된 형태소 패턴이 정보 수집 모듈(100)에 의해 수집되어 분석된 기존의 패턴과 일치하지 않는 새로운 패턴이면, 모델 구성 모듈(200)은 검색된 여행 관련 콘텐츠를 학습 데이터로 사용해 클러스터링을 재수행하여, 신뢰도 추정 모델을 업데이트할 수 있다. 즉, 지속적으로 새로운 여행 관련 콘텐츠를 학습 데이터로 추가함으로써, 신뢰도 추정 모델의 정확도를 향상시킬 수 있다.In addition, the content selection module 300 inputs the searched travel-related content into the model configuration module 200, and through the morpheme analysis of the chunk configured in step S100, the analyzed morpheme pattern is collected by the information collection module 100, If it is a new pattern that does not match the analyzed existing pattern, the model configuration module 200 may update the reliability estimation model by re-performing clustering using the searched travel-related content as training data. That is, by continuously adding new travel-related content as training data, it is possible to improve the accuracy of the reliability estimation model.

한편, 콘텐츠 선별 모듈(300)은, 예를 들어 신뢰도가 상, 중, 하로 구분되어 있는 경우, 상에 해당하는 여행 관련 콘텐츠를 선별할 수 있고, 상에 해당하는 콘텐츠가 미리 정해진 개수 미만이면, 상 및 중에 해당하는 콘텐츠를 선별할 수 있다. 이와 같이, 콘텐츠 선별 모듈(300)은, 선별된 콘텐츠의 개수에 따라 미리 설정된 기준을 조정함으로써, 충분한 양의 콘텐츠가 제공되도록 할 수 있다.On the other hand, the content selection module 300, for example, when the reliability is divided into high, medium, and low, may select the travel-related content corresponding to the prize, and if the content corresponding to the prize is less than a predetermined number, You can select the content that corresponds to the top and the middle. In this way, the content selection module 300 may provide a sufficient amount of content by adjusting a preset criterion according to the number of selected content.

콘텐츠 제공 모듈(400)은, 선별된 여행 관련 콘텐츠를 여행자에게 제공할 수 있다. 콘텐츠 제공 모듈(400)은, 도 1에 도시된 바와 같이 네트워크를 통해 사용자 단말기(20)에 선별된 여행 관련 콘텐츠를 제공할 수 있다. 이때, 여행 관련 콘텐츠는, 주제별로 분류하여 제공될 수 있으며, 동일한 신뢰도를 가진 콘텐츠라면 작성 일자가 최신인 순서대로 정렬하여 제공될 수 있다.The content providing module 400 may provide the selected travel related content to the traveler. The content providing module 400 may provide the selected travel-related content to the user terminal 20 through a network as shown in FIG. 1 . In this case, the travel-related content may be provided by being classified by subject, and if the content has the same reliability, the content may be arranged and provided in the order of the latest creation date.

전술한 바와 같이, 본 발명에서 제안하고 있는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)에 따르면, 여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠에 대해 머신러닝을 적용하여 구성한 신뢰도 추정 모델을 이용해 선별된 여행 관련 콘텐츠를 제공함으로써, 잠재 여행자에게 품질 높은 여행 정보를 쉽게 제공하여 만족도를 높일 수 있다.As described above, according to the travel information providing system 10 that provides content selected by reliability estimation proposed in the present invention, machine learning is applied to travel-related content including travel course and accommodation reviews. By providing selected travel-related content using a reliability estimation model, it is possible to easily provide high-quality travel information to potential travelers to increase their satisfaction.

또한, 본 발명에서 제안하고 있는 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10)에 따르면, 여행 관련 콘텐츠에서 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성해 이용함으로써, 콘텐츠 자체의 품질과 콘텐츠 작성자의 품질을 모두 고려하여, 다른 검색엔진이나 소셜 미디어 등에 비하여, 신뢰성 있는 정보를 제공할 수 있다.In addition, according to the travel information providing system 10 that provides content selected by reliability estimation proposed in the present invention, the content of the content is based on the importance of keywords extracted from travel-related content, and the rating and recommendation of the author. By constructing and using a reliability estimation model for estimating reliability, it is possible to provide reliable information compared to other search engines or social media by considering both the quality of the content itself and the quality of the content creator.

이상 설명한 본 발명은 본 발명이 속한 기술분야에서 통상의 지식을 가진 자에 의하여 다양한 변형이나 응용이 가능하며, 본 발명에 따른 기술적 사상의 범위는 아래의 특허청구범위에 의하여 정해져야 할 것이다.Various modifications and applications of the present invention described above are possible by those skilled in the art to which the present invention pertains, and the scope of the technical idea according to the present invention should be defined by the following claims.

10: 여행 정보 제공 시스템
20: 사용자 단말기
100: 정보 수집 모듈
200: 모델 구성 모듈
300: 콘텐츠 선별 모듈
400: 콘텐츠 제공 모듈
S100: 여행 관련 콘텐츠에서 키워드를 추출하고 키워드의 중요도를 포함하는 청크를 구성하는 단계
S110: 여행 관련 콘텐츠를 주제별로 분류하는 단계
S120: 여행 관련 콘텐츠에서 키워드를 추출하고 추출한 키워드의 중요도를 계산하는 단계
S130: 키워드의 중요도 정보를 포함하는 청크를 구성하는 단계
S200: 여행 관련 콘텐츠를 작성한 작성자의 평가도를 산출하는 단계
S300: 청크의 추천도를 산출하는 단계
S400: 작성자의 평가도, 청크에 포함된 중요도 및 청크의 추천도에 따라 청크를 클러스터링하는 단계
S500: 각 클러스터별 신뢰도를 설정하여 신뢰도 추정 모델을 구성하는 단계
10: Travel information provision system
20: user terminal
100: information collection module
200: model configuration module
300: content selection module
400: content providing module
S100: extracting keywords from travel-related content and composing chunks including the importance of keywords
S110: Classifying travel-related content by topic
S120: Step of extracting keywords from travel-related content and calculating the importance of the extracted keywords
S130: Step of constructing a chunk including the importance information of the keyword
S200: Step of calculating the rating of the author who wrote the travel-related content
S300: Calculating the recommendation degree of the chunk
S400: Clustering the chunks according to the rating of the author, the importance contained in the chunk, and the recommendation of the chunk
S500: A step of configuring a reliability estimation model by setting the reliability for each cluster

Claims (8)

여행 정보 제공 시스템(10)으로서,
여행 코스 및 숙소 리뷰를 포함하는 여행 관련 콘텐츠를 수집하는 정보 수집 모듈(100);
상기 수집된 여행 관련 콘텐츠에 대해 머신러닝을 적용하여, 추출된 키워드의 중요도, 작성자의 평가도 및 추천도를 기반으로 콘텐츠의 신뢰도를 추정하는 신뢰도 추정 모델을 구성하는 모델 구성 모듈(200);
상기 구성된 신뢰도 추정 모델을 이용해, 여행 관련 콘텐츠를 선별하는 콘텐츠 선별 모듈(300); 및
상기 선별된 여행 관련 콘텐츠를 여행자에게 제공하는 콘텐츠 제공 모듈(400)을 포함하며,
상기 모델 구성 모듈(200)은,
(1) 상기 정보 수집 모듈(100)에서 수집된 여행 관련 콘텐츠에서 키워드를 추출하고, 키워드의 중요도를 포함하는 청크를 구성하는 단계;
(2) 상기 여행 관련 콘텐츠를 작성한 작성자의 평가도를 산출하는 단계;
(3) 상기 구성된 청크의 추천도를 산출하는 단계;
(4) 상기 작성자의 평가도, 청크에 포함된 중요도 및 청크의 추천도에 따라, 청크를 클러스터링하는 단계; 및
(5) 상기 클러스터링 결과에 따라 각 클러스터별 신뢰도를 설정하여 신뢰도 추정 모델을 구성하는 단계를 수행하여 상기 신뢰도 추정 모델을 구성하며,
상기 단계 (1)은,
(1-1) 상기 정보 수집 모듈(100)에서 수집된 여행 관련 콘텐츠를 주제별로 분류하는 단계;
(1-2) 상기 여행 관련 콘텐츠에서 주제별로 미리 설정된 핵심 키워드를 추출하고, TF(Term Frequency), IDF(Inverse Document Frequency), TF-IDF(Term Frequency-Inverse Document Frequency) 및 딥러닝을 이용한 추상적 요약(abstractive summarization) 중 적어도 하나를 이용해, 추출한 키워드의 중요도를 계산하는 단계; 및
(1-3) 상기 키워드의 중요도 정보를 포함하는 청크를 구성하되, 상기 여행 관련 콘텐츠에서 추출된 복수의 키워드의 중요도 정보를 포함하여 상기 여행 관련 콘텐츠마다 하나의 청크를 구성하여 각 여행 관련 콘텐츠에 대한 정보가 하나의 청크로 표현되도록 하는 단계를 포함하며,
상기 단계 (3)에서는,
상기 여행 관련 콘텐츠에 대한 추천도를 기반으로 청크의 추천도를 산출하여, 청크 단위로 학습 및 처리가 가능하도록 하며, 상기 청크와 관련된 여행 관련 콘텐츠에 대한 추천수, 댓글수, 찬반수 및 조회수를 포함하는 군에서 선택된 적어도 하나에 기반하여, 추천, 중립 및 비추천으로 상기 청크를 분류하고, 분류에 따라 추천도를 설정하며,
상기 콘텐츠 선별 모듈(300)은,
입력받은 검색어에 대해 여행 관련 콘텐츠를 검색하고, 상기 신뢰도 추정 모델을 이용해 검색된 여행 관련 콘텐츠 중 신뢰도가 미리 설정된 기준 이상인 콘텐츠를 선별하며,
상기 콘텐츠 선별 모듈(300)은, 검색된 여행 관련 콘텐츠를 상기 모델구성 모듈(200)에 입력하여 상기 단계 (1)에서 구성된 청크의 형태소 분석을 통해, 분석된 형태소 패턴이 상기 정보 수집 모듈(100)에 의해 수집되어 분석된 기존의 패턴과 일치하지 않는 새로운 패턴이면, 상기 모델 구성 모듈(200)은 검색된 여행 관련 콘텐츠를 학습 데이터로 사용해 클러스터링을 재수행하여, 상기 신뢰도 추정 모델을 업데이트하는 것을 특징으로 하는, 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10).
As a travel information providing system (10),
an information collection module 100 for collecting travel-related content including travel course and accommodation reviews;
a model configuration module 200 for constructing a reliability estimation model for estimating the reliability of the content based on the extracted keyword's importance, the author's evaluation degree, and the recommendation degree by applying machine learning to the collected travel-related content;
a content selection module 300 for selecting travel-related content by using the constructed reliability estimation model; and
Includes a content providing module 400 that provides the selected travel-related content to travelers,
The model configuration module 200,
(1) extracting a keyword from the travel-related content collected by the information collection module 100, and constructing a chunk including the importance of the keyword;
(2) calculating an evaluation degree of the author who wrote the travel-related content;
(3) calculating a recommendation degree of the configured chunk;
(4) clustering chunks according to the rating of the author, the importance included in the chunk, and the recommendation degree of the chunk; and
(5) configuring the reliability estimation model by configuring the reliability estimation model by setting the reliability for each cluster according to the clustering result;
The step (1) is,
(1-1) classifying the travel-related content collected by the information collection module 100 by subject;
(1-2) Extracting preset key keywords for each subject from the travel-related content, and abstracting them using TF (Term Frequency), IDF (Inverse Document Frequency), TF-IDF (Term Frequency-Inverse Document Frequency) and deep learning calculating the importance of the extracted keyword using at least one of abstract summarization; and
(1-3) Configure a chunk including the importance information of the keyword, but configure one chunk for each travel-related content including the importance information of a plurality of keywords extracted from the travel-related content Including the step of expressing the information in one chunk,
In step (3),
Based on the recommendation for the travel-related content, the chunk recommendation is calculated to enable learning and processing in chunk units, and includes the number of recommendations, comments, pros and cons, and views for travel-related content related to the chunk. Classifying the chunks into recommended, neutral, and non-recommended based on at least one selected from the group, and setting a recommendation level according to the classification,
The content selection module 300,
Searching for travel-related content with respect to the input search word, and selecting content with a reliability higher than or equal to a preset criterion from among the searched travel-related content using the reliability estimation model,
The content selection module 300 inputs the searched travel-related content into the model construction module 200, and through morphological analysis of the chunk constructed in step (1), the analyzed morpheme pattern is generated by the information collection module 100. If it is a new pattern that does not match the existing pattern collected and analyzed by , a travel information providing system 10 that provides content selected by reliability estimation.
삭제delete 삭제delete 제1항에 있어서, 상기 단계 (2)에서는,
상기 여행 관련 콘텐츠가 작성된 플랫폼에서의 상기 작성자의 등급, 레벨, 인기도, 참여도, 지성도, 신뢰도 및 콘텐츠 작성 개수를 포함하는 군에서 선택된 적어도 하나 이상을 이용해 상기 작성자의 평가도를 산출하는 것을 특징으로 하는, 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10).
The method of claim 1, wherein in step (2),
Computing the rating of the author using at least one selected from the group including the rating, level, popularity, participation, intelligence, reliability, and number of content creation of the author on the platform where the travel-related content is written A travel information providing system 10 that provides content selected by reliability estimation.
제4항에 있어서, 상기 단계 (2)에서는,
상기 작성자의 성별, 나이 및 직업 중 적어도 하나에 따라 작성자의 신뢰도를 상이하게 설정하는 것을 특징으로 하는, 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10).
The method of claim 4, wherein in step (2),
A travel information providing system (10) for providing content selected by reliability estimation, characterized in that the author's reliability is set differently according to at least one of the author's gender, age, and occupation.
삭제delete 제1항에 있어서, 상기 단계 (4)에서는,
응집 계층적 클러스터링(Hierarchical Agglomerative Clustering)을 이용해 상기 청크를 클러스터링하며, 엘보 평가(Elbow Criterion)를 이용하여 클러스터의 개수를 결정하는 것을 특징으로 하는, 신뢰도 추정에 의해 선별된 콘텐츠를 제공하는 여행 정보 제공 시스템(10).
The method of claim 1, wherein in step (4),
Travel information providing content selected by reliability estimation, characterized in that the chunks are clustered using Hierarchical Agglomerative Clustering and the number of clusters is determined using Elbow Criterion system (10).
삭제delete
KR1020190151724A 2019-11-22 2019-11-22 Travel information providing system that provides contents selected by credibility estimation Active KR102313285B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190151724A KR102313285B1 (en) 2019-11-22 2019-11-22 Travel information providing system that provides contents selected by credibility estimation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190151724A KR102313285B1 (en) 2019-11-22 2019-11-22 Travel information providing system that provides contents selected by credibility estimation

Publications (2)

Publication Number Publication Date
KR20210063157A KR20210063157A (en) 2021-06-01
KR102313285B1 true KR102313285B1 (en) 2021-10-18

Family

ID=76375997

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190151724A Active KR102313285B1 (en) 2019-11-22 2019-11-22 Travel information providing system that provides contents selected by credibility estimation

Country Status (1)

Country Link
KR (1) KR102313285B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102740545B1 (en) * 2023-09-19 2024-12-10 유철상 Service providing apparatus and method for providing travel information using short-form contents

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101871747B1 (en) * 2017-04-07 2018-06-27 주식회사 화성 Similarity tendency based user-sightseeing recommendation system and method thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100973969B1 (en) * 2007-08-06 2010-08-05 한국과학기술원 System for providing News Service that reduce Media-Bias Effect and Method therefor
US8176057B2 (en) * 2009-04-01 2012-05-08 Korea Institute Of Science And Technology Assessment of a user reputation and a content reliability
KR101373927B1 (en) * 2012-05-04 2014-03-13 중앙대학교 산학협력단 Social network server and method for creating social reputation model using the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101871747B1 (en) * 2017-04-07 2018-06-27 주식회사 화성 Similarity tendency based user-sightseeing recommendation system and method thereof

Also Published As

Publication number Publication date
KR20210063157A (en) 2021-06-01

Similar Documents

Publication Publication Date Title
TWI636416B (en) Method and system for multi-phase ranking for content personalization
US9015140B2 (en) System and method for providing contextual actions on a search results page
US20130036121A1 (en) System and method for recommending blog
US20100205176A1 (en) Discovering City Landmarks from Online Journals
US11263664B2 (en) Computerized system and method for augmenting search terms for increased efficiency and effectiveness in identifying content
KR20210055296A (en) Method for providing bigdata based matching service connecting individual
CN112084413B (en) Information recommendation method, device and storage medium
CN101916264A (en) A personalized webpage recommendation method based on user facial expression and gaze distribution detection
Xu et al. Where to go and what to play: Towards summarizing popular information from massive tourism blogs
KR102138757B1 (en) Personalized persona management server
JP5516421B2 (en) Context collection device, context collection program, and context collection method
KR102119238B1 (en) Personalized persona management server and mangment method thereof
US9058328B2 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
CN116484079A (en) Attribute word mining method and related product
Ramírez et al. Overview of the multimedia information processing for personality & social networks analysis contest
KR102313285B1 (en) Travel information providing system that provides contents selected by credibility estimation
JP6960838B2 (en) Information providing equipment, information providing method, and program
Bharathi et al. Sentiment classification of tourist’s opinion on tourist places of interest in South India using tweet reviews
KR20170036422A (en) Apparatus, method and computer program for providing service to share knowledge
Vosecky et al. Limosa: A system for geographic user interest analysis in twitter
Kamal et al. Influential factors for tourist profiling for personalized tourism recommendation systems–a compact survey
de Almeida et al. Personalizing the top-k spatial keyword preference query with textual classifiers
Mizzaro et al. A context-aware retrieval system for mobile applications
Hitz et al. Sharing geotagged pictures for an Emotion-based Recommender System
US12067128B2 (en) Dynamic system profiling based on data extraction

Legal Events

Date Code Title Description
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

P22-X000 Classification modified

St.27 status event code: A-2-2-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-2-2-P10-P22-nap-X000

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000