KR20040074693A - System and method for estimating web site - Google Patents
System and method for estimating web site Download PDFInfo
- Publication number
- KR20040074693A KR20040074693A KR1020030010070A KR20030010070A KR20040074693A KR 20040074693 A KR20040074693 A KR 20040074693A KR 1020030010070 A KR1020030010070 A KR 1020030010070A KR 20030010070 A KR20030010070 A KR 20030010070A KR 20040074693 A KR20040074693 A KR 20040074693A
- Authority
- KR
- South Korea
- Prior art keywords
- website
- hyperlink
- information
- searched
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/50—Business processes related to the communications industry
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
본 발명은 웹사이트 평가 시스템 및 그 방법에 관한 것이다.The present invention relates to a website evaluation system and method thereof.
본 발명은 a) 사용자 단말기로부터 검색어가 입력되면, 상기 검색어를 포함하는 컨텐츠를 제공하는 웹사이트를 검색하는 단계; b) 상기 검색된 웹사이트별로 하이퍼링크 정보를 추출하는 단계; c) 상기 추출된 하이퍼링크 정보를 토대로, 상기 검색된 웹사이트별로 하이퍼링크 참조 빈도를 산출하는 단계; d) 상기 하이퍼링크 참조 빈도를 토대로 상기 검색된 웹사이트에 대한 순위를 결정하는 단계; 및 e) 상기 검색된 웹사이트들을 상기 결정된 순위별로 순차적으로 디스플레이 하는 단계를 포함한다.The present invention includes a) searching for a website providing content including the search word when a search word is input from a user terminal; b) extracting hyperlink information for each searched website; c) calculating a hyperlink reference frequency for each searched website based on the extracted hyperlink information; d) ranking the retrieved website based on the hyperlink reference frequency; And e) sequentially displaying the searched websites by the determined ranking.
이러한 본 발명에 따르면, 특정 주제에 대하여 알고자 하는 정보검색 사용자들은 그 주제에 대하여 대표적인 웹사이트만을 추천 받음으로서, 방대한 인터넷상의 자료들을 보다 효율적으로 이용할 수 있다.According to the present invention, information retrieval users who want to know about a particular subject are recommended only representative websites on the subject, so that the data on the Internet can be used more efficiently.
Description
본 발명은 웹사이트 평가 시스템 및 그 방법에 관한 것으로서, 보다 구체적으로 네트워크 상의 다수 웹사이트의 신뢰도를 평가하는 웹사이트 평가 시스템 및 그 방법에 관한 것이다.The present invention relates to a website evaluation system and method, and more particularly, to a website evaluation system and method for evaluating the reliability of a plurality of websites on a network.
최근에 웹(Web: World Wide Web)은 가상 공간을 통한 새로운 비즈니스를 창출하고 있으며, 이에 따라 기존의 비즈니스들은 웹을 새로운 시장으로 인식하게 되어 수많은 웹사이트(site)들이 출현하고 있으며 그 수가 기하급수적으로 증가되고 있는 추세이다.Recently, the World Wide Web (Web) has created new businesses through virtual spaces, and as a result, existing businesses have recognized the web as a new market, and numerous websites have emerged. The trend is increasing.
이에 따라 웹 상에서 개시되는 공개 문서는 그 수가 더욱 방대해지고 있으며, 그 결과 사용자들이 자신이 원하는 정보를 검색하기가 어려워지고 있다. 야후, 심마니, 앰파스 등 많은 검색 엔진들이 사용자가 찾고자 하는 특정 주제나 단어에 대하여 키워드를 이용하거나 문장 검색 기능을 이용하여 검색을 수행하고 그 결과를 제공하고 있다.As a result, the number of public documents launched on the web is getting larger, and as a result, it is difficult for users to search for information they want. Many search engines such as Yahoo, Simmani, and Ampas perform a search using a keyword or sentence search function for a specific topic or word that a user wants to find and provide the result.
그러나 이러한 종래의 검색 엔진들이 제공하는 검색결과에 나오는 사이트의 수가 너무 방대하기 때문에, 사용자들은 이중에서 질 높은 사이트를 찾는데 어려움을 겪고 있다. 상기와 같은 검색 엔진들도 전문가들의 검토 등 사람의 노력에 의존하여 사이트에 대한 평가를 수행하고 있으나 워낙 웹 문서들의 수가 방대하고 증가하고 있는 관계로 효용성에 한계가 있다.However, since the number of sites appearing in the search results provided by these conventional search engines is so large, users have difficulty in finding high quality sites. Search engines such as the above are also evaluating sites based on human efforts such as expert reviews, but their utility is limited due to the huge and increasing number of web documents.
이에 따라 웹사이트를 평가하여 그 결과를 사용자들에게 제공하는 기술들이 개발되고 있다. 종래의 웹사이트 평가 방법으로는 대한민국 특허 출원 공개 번호 2001-0108877호(2001년 12월 8일 공개)에 개시된 "웹사이트 평가방법"이 있다.As a result, technologies are being developed to evaluate websites and provide the results to users. Conventional website evaluation methods include a "web site evaluation method" disclosed in Korean Patent Application Publication No. 2001-0108877 (published December 8, 2001).
이 종래 기술은 웹사이트의 외관, 성능, 참신성 등을 계량화된 점수로 환산하여 평가하는 것이다. 그러나 웹사이트의 외적인 면만을 평가하기 때문에 실질적으로 중요한 내용(사이트에서 제공되는 정보 등)의 평가가 이루어지지 않는 한계가 있다.This prior art evaluates the appearance, performance, novelty, etc. of a website in terms of a quantified score. However, since it evaluates only the external aspects of the website, there is a limit that the evaluation of the practically important contents (information provided on the website, etc.) cannot be made.
또 다른 종래 기술로는 대한민국 특허 출원 공개 번호 제2000-0063442호 (2000년 11월 6일 공개)에 개시된 "검색 순위 결정 시스템 및 이를 이용한 순위 결정 방법"이 있다. 이 종래 기술은 인터넷 사용자들의 투표를 전문분야에 따라 가중치를 부여하는 평가방식으로서, 평가방법의 부분적인 자동화는 달성하였지만 사용자들의 적극적인 참여와 주관적인 평가기준에 의존하는 한계가 있다.Another conventional technique is a "search ranking system and a ranking method using the same" disclosed in Korean Patent Application Publication No. 2000-0063442 (published November 6, 2000). This prior art is an evaluation method that weights the voting of Internet users according to their specialty. Partial automation of the evaluation method is achieved, but there is a limitation that depends on active participation of users and subjective evaluation criteria.
그러므로, 본 발명이 이루고자 하는 기술적 과제는 종래의 문제점을 해결하기 위한 것으로서, 웹 상의 다수의 웹사이트들에 대한 평가가 자동적으로 이루어지면서 객관적인 평가가 이루어지도록 하는데 있다.Therefore, the technical problem to be achieved by the present invention is to solve the conventional problem, and to evaluate the plurality of websites on the web automatically and to make an objective evaluation.
특히, 본 발명이 이루고자 하는 기술적 과제는 웹사이트들이 가지고 있는 하이퍼링크 정보를 이용하여 이들간의 유기적인 관계를 분석함으로써 웹사이트 평가 및 추천과정을 자동화하는 데 있다.In particular, the technical problem to be achieved by the present invention is to automate the website evaluation and recommendation process by analyzing the organic relationship between them using the hyperlink information of the website.
도 1은 본 발명의 실시 예에 따른 웹사이트 평가 시스템의 구조를 나타낸 도이다.1 is a view showing the structure of a website evaluation system according to an embodiment of the present invention.
도 2는 본 발명의 실시 예에 따른 웹사이트 평가 시스템의 방법을 나타낸 순서도이다.2 is a flowchart illustrating a method of a website evaluation system according to an exemplary embodiment of the present invention.
이와 같은 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 웹사이트 평가 시스템은, 네트워크에 연결되어 있는 다수의 웹사이트를 평가하는 시스템으로, 사용자 단말기로부터 검색어가 입력되면, 상기 검색어를 포함하는 컨텐츠를 제공하는 웹사이트를 검색하는 웹사이트 추출부; 상기 검색된 웹사이트별로 하이퍼링크 정보를 추출하는 하이퍼링크 추출부; 상기 추출된 하이퍼링크 정보를 토대로, 상기 검색된 웹사이트별로 하이퍼링크 참조 빈도를 산출하는 통계 처리부; 상기 하이퍼링크 참조 빈도를 토대로 상기 검색된 웹사이트에 대한 순위를 결정하는 순위 결정부를 포함한다.The website evaluation system according to a feature of the present invention for achieving the technical problem is a system for evaluating a plurality of websites connected to the network, when a search word is input from the user terminal, the content including the search word A website extraction unit for searching a provided website; A hyperlink extracting unit for extracting hyperlink information for each searched website; A statistical processor configured to calculate a hyperlink reference frequency for each searched website based on the extracted hyperlink information; And a ranking unit configured to determine a ranking of the searched website based on the hyperlink reference frequency.
또한, 상기 검색된 웹사이트들을 상기 결정된 순위별로 순차적으로 디스플레이하는 디스플레이부를 더 포함한다.The apparatus may further include a display unit configured to sequentially display the searched websites by the determined ranking.
여기서, 상기 하이퍼링크 참조 빈도는 해당 웹사이트가 검색된 다른 웹사이트에 의하여 얼마나 하이퍼링크 참조되고 있는지를 나타낸다.Here, the hyperlink reference frequency indicates how hyperlinked the corresponding website is by the other websites searched.
또한, 이러한 특징을 가지는 웹사이트 평가 시스템은, 각 웹사이트별로 추출된 하이퍼링크 정보가 저장되는 링크 정보 데이터베이스; 및 평가 결과 검색어별로 순위가 결정된 웹사이트 정보가 저장되는 추천 정보 데이터베이스를 더 포함할 수 있다.In addition, a website evaluation system having such a feature may include: a link information database storing hyperlink information extracted for each website; And a recommendation information database in which website information, which is ranked by search terms, is stored.
본 발명의 다른 특징에 따른 웹사이트 평가 방법은, 네트워크에 연결되어 있는 다수의 웹사이트를 평가하는 방법으로, a) 사용자 단말기로부터 검색어가 입력되면, 상기 검색어를 포함하는 컨텐츠를 제공하는 웹사이트를 검색하는 단계; b) 상기 검색된 웹사이트별로 하이퍼링크 정보를 추출하는 단계; c) 상기 추출된 하이퍼링크 정보를 토대로, 상기 검색된 웹사이트별로 하이퍼링크 참조 빈도를 산출하는 단계; d) 상기 하이퍼링크 참조 빈도를 토대로 상기 검색된 웹사이트에 대한 순위를 결정하는 단계; 및 e) 상기 검색된 웹사이트들을 상기 결정된 순위별로 순차적으로 디스플레이하는 단계를 포함한다.According to another aspect of the present invention, a method for evaluating a website is a method for evaluating a plurality of websites connected to a network. A) When a search word is input from a user terminal, a website for providing content including the search word is provided. Searching; b) extracting hyperlink information for each searched website; c) calculating a hyperlink reference frequency for each searched website based on the extracted hyperlink information; d) ranking the retrieved website based on the hyperlink reference frequency; And e) sequentially displaying the searched websites by the determined ranking.
상기 b) 단계는 웹사이트별로 한 페이지에서만 하이퍼링크 정보를 추출할 수 있다.In step b), hyperlink information may be extracted from only one page for each website.
이하, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있는 가장 바람직한 실시 예를 첨부된 도면을 참조로 하여 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention.
도 1에 본 발명의 실시 예에 따른 웹사이트 평가 시스템의 개략적인 구조가도시되어 있다.1 shows a schematic structure of a website evaluation system according to an embodiment of the present invention.
첨부한 도 1에 도시되어 있듯이, 본 발명의 실시 예에 따른 웹사이트 평가 시스템(이하, 평가 시스템이라고 명명함)(1)은 네트워크(유무선 네트워크 또는 퓨쳐 네트워크를 포함)(2)를 통하여 다수의 클라이언트(3)와 다수의 웹사이트(4)에 연결되어 있다.As shown in FIG. 1, a website evaluation system (hereinafter referred to as an evaluation system) 1 according to an embodiment of the present invention may be connected to a plurality of networks through a network (including a wired or wireless network or a future network). It is connected to a client 3 and a number of websites 4.
여기서, 클라이언트(3)는 네트워크를 통하여 평가 시스템으로 접속할 수 있는 사용자 단말기를 나타내며, 단말기는 유선으로 네트워크(2)에 접속할 수 있는 컴퓨터, 인터넷 접속 가능한 TV 등을 포함하는 유선 단말기, 또는 무선으로 네트워크(2)에 접속할 수 있는 휴대폰, PDA 등을 포함하는 무선 단말기일 수 있다.Here, the client 3 represents a user terminal that can be connected to the evaluation system via a network, and the terminal is a wired terminal including a computer that can be connected to the network 2 by wire, a TV that can be connected to the Internet, or a wireless network. It may be a wireless terminal including a mobile phone, a PDA, etc. which can be connected to (2).
본 발명의 실시 예에 따른 평가 시스템(1)은 크게, 인터페이스 서버(11), 처리 서버(12) 및 데이터베이스 서버(13)를 포함한다.The evaluation system 1 according to the embodiment of the present invention largely includes an interface server 11, a processing server 12, and a database server 13.
인터페이스 서버(11)는 네트워크(2)를 통하여 다수의 클라이언트(3)나 웹사이트(4)들이 접속할 수 있도록 하고, 처리 서버(12)를 통하여 제공되는 다양한 정보들을 통신 규격에 맞도록 변환 처리하여 다수의 클라이언트(3)나 웹사이트(4)로 제공하거나, 네트워크(2)를 통하여 입력되는 정보를 수신하여 처리 서버(12)로 제공하는 기능을 수행한다. 인터페이스 서버(11)에는 웹 서버나 다른 시스템과의 정보 송수신을 위한 데이터베이스 연동 장치(CGI) 등이 포함될 수 있으며, 또한, 전자 메일 송수신을 수행하는 메일 서버도 포함될 수 있다. 이러한 인터페이스 서버의 기능은 공지된 기술임으로 상세한 설명을 생략한다.The interface server 11 allows a plurality of clients 3 or websites 4 to access through the network 2, and converts and processes various information provided through the processing server 12 in accordance with a communication standard. It provides a plurality of clients (3) or a website (4), or receives the information input through the network (2) to provide a function to the processing server 12. The interface server 11 may include a database interworking device (CGI) for transmitting and receiving information with a web server or another system, and may also include a mail server for transmitting and receiving electronic mail. The function of such an interface server is a well-known technology, and thus a detailed description thereof will be omitted.
처리 서버(12)는 웹사이트에 대한 평가를 수행하며, 구체적으로,클라이언트(3)로부터 입력되는 검색어를 토대로 해당 검색어를 가지는 정보를 제공하는 웹사이트들을 추출하는 평가 대상 웹사이트 추출부(121, 이하, 추출부라고 명명함), 추출된 웹사이트들에 대하여 각각의 웹사이트들이 내포한 하이퍼링크를 추출하는 하이퍼링크 추출부(122), 하이퍼링크별로 얼마나 많은 웹사이트에서 참조되고 있는지를 통계 처리하는 하이퍼링크 통계 처리부(123, 이하, 통계 처리부라고 명명함),통계처리 결과에 따라 가장 많이 참조되는 하이퍼링크(웹사이트)별로 순위를 결정하는 검색 결과 순위 결정부(124, 이하, 순위 결정부라고 명명함), 순위결과를 토대로 정보검색 사용자들 즉, 클라이언트(3)에게 유용한 웹사이트를 추천하여 디스플레이하는 추천 결과 디스플레이부(125, 이하, 디스플레이부라고 명명함)를 포함한다.The processing server 12 evaluates the website, and specifically, the evaluation target website extracting unit 121 which extracts websites that provide information having the corresponding search word based on the search word input from the client 3. Hereinafter, referred to as an extractor), a hyperlink extractor 122 for extracting hyperlinks included in respective websites with respect to the extracted websites, and how many websites are referred to each hyperlink by statistical processing. Hyperlink statistics processing unit (123, hereinafter referred to as statistical processing unit), search result ranking unit for determining the ranking by the hyperlink (website) that is referred to the most according to the statistical processing results 124, hereinafter, ranking unit Based on the ranking results, a recommendation result display that recommends and displays a website useful to IR users, that is, the client (3). And a chin (125, below, commanded display unit business card).
한편, 데이터베이스 서버(13)는 각 웹사이트별로 추출된 하이퍼링크 정보가 저장되는 링크 정보 데이터베이스(131), 평가 결과 검색어별로 순위가 결정된 웹사이트 정보가 저장되는 추천 정보 데이터베이스(132)를 포함한다.Meanwhile, the database server 13 includes a link information database 131 which stores hyperlink information extracted for each website, and a recommendation information database 132 that stores website information ranked for each search term.
다음에는 이러한 구조를 토대로 하여 본 발명의 실시 예에 따른 웹사이트 평가 시스템의 동작을 설명한다.Next, the operation of the website evaluation system according to an embodiment of the present invention will be described based on this structure.
도 2에 본 발명의 실시 예에 따른 웹사이트 평가 방법의 순서도가 도시되어 있다.2 is a flow chart of a website evaluation method according to an embodiment of the present invention.
정보검색 사용자 즉, 클라이언트(3)가 알고 싶어하는 주제에 해당하는 자료를 찾기 위하여, 네트워크 접속을 위한 프로그램(예를 들어 웹 브라우저 등)을 구동시키고 본 발명의 실시 예에 따른 평가 시스템(1)으로 접속하기 위한 URL을 입력하면, 이 URL 정보는 웹 브라우저에서 HTTP(hypertext transfer protocol)에 의해 변환되고 패킷화 된 다음에 네트워크(2)를 통하여 평가 시스템(1)으로 전송된다.In order to find the data corresponding to the subject that the information search user, that is, the client 3 wants to know, a program (for example, a web browser) for network connection is run and the evaluation system 1 according to an embodiment of the present invention is executed. If a URL for connecting is entered, this URL information is converted and packetized by HTTP (hypertext transfer protocol) in a web browser and then transmitted to the evaluation system 1 via the network 2.
이에 따라 평가 시스템(1)의 인터페이스 서버(11)가 URL 정보에 해당하는 웹 페이지를 클라이언트(3)로 전송하며, 전송된 웹 페이지는 웹 브라우저 상에 윈도우 상태로 변환되어 표시된다(S100).Accordingly, the interface server 11 of the evaluation system 1 transmits the web page corresponding to the URL information to the client 3, and the transmitted web page is converted into a window state on the web browser and displayed (S100).
웹 브라우저 상에 입력창이 표시되어 클라이언트(3)가 알고 싶어하는 주제에 해당하는 검색어를 입력하면(S110∼S120), 웹사이트 추출부(121)가 종래의 키워드 검색 방법에 따라 상기 검색어를 포함하는 컨텐츠를 제공하는 복수의 웹사이트를 추출한다(S130).When the input window is displayed on the web browser and the search word corresponding to the topic that the client 3 wants to know is input (S110 to S120), the website extractor 121 may include the search word according to a conventional keyword search method. Extract a plurality of websites that provide (S130).
다음에, 하이퍼 링크 추출부(122)가 추출된 웹사이트별로 각 웹사이트가 내포하는 하이퍼링크 정보를 추출한다(S140).Next, the hyperlink extracting unit 122 extracts hyperlink information included in each website for each extracted website (S140).
일반적으로 하이퍼링크는 본문의 내용과 상호 관련성이 있는 웹사이트에 대한 포인터 역할을 하며, 하이퍼텍스트 문서(hypertext document) 내의 하나의 단어나 구(phrase), 기호, 화상과 같은 요소와 그 문서 내의 다른 요소 또는 다른 하이퍼텍스트 문서 내의 다른 요소 사이의 연결을 나타낸다.In general, a hyperlink serves as a pointer to a website that is correlated with the content of the text, and contains elements such as words, phrases, symbols, and images within a hypertext document and other elements within the document. Represents a link between an element or another element in another hypertext document.
사용자가 하이퍼텍스트 문서 내의 밑 줄쳐진 요소 또는 문서 내의 나머지 부분과 다른 색으로 표시된 요소(링크된 요소)를 클릭하면, 하이퍼링크가 활성화되어 다른 웹 문서로 연결됩니다. 이에 따라, 같은 하이퍼텍스트 문서 내의 한 요소와 다른 요소의 연결을 선택하여 검색할 수 있고, 수백 또는 수천 km 떨어져 있는 다른 인터넷 호스트에 있는 서버 상의 하이퍼텍스트 문서 내의 다른 요소의 연결을선택하여 검색할 수도 있다.When a user clicks an underlined element in a hypertext document or an element (linked element) that is colored differently from the rest of the document, the hyperlink is activated and linked to another web document. This allows you to select and search for connections between one element and another within the same hypertext document, or to select and search for connections between other elements within a hypertext document on a server on another Internet host hundreds or thousands of kilometers away. have.
본 발명의 실시 예에서는 일반적으로 학계에서 논문 인용 빈도가 높은 연구결과물일수록 중요한 논문으로 인정하는 것과 같이, 관련 분야의 웹사이트들로부터 자주 참조되는 웹사이트가 특정 주제분야에서 유용한 웹사이트로 간주될 수 있다는 것을 토대로 하여, 검색된 웹사이트 중에서 어떠한 웹사이트가 다른 웹사이트에 의하여 가장 많이 하이퍼링크 참조되고 있는지를 추출하고 그 빈도를 산출한다.In an embodiment of the present invention, a website frequently referred to from related fields may be regarded as a useful website in a particular subject field, as a research paper with a high citation of articles is recognized as an important article. Based on the presence of the web site, it is extracted and the frequency of which web sites are most hyperlinked by other web sites is searched.
하이퍼링크 추출부(122)는 각 웹사이트별로 해당 웹사이트가 다른 웹사이트에 의하여 하이퍼링크된 정보를 추출하고, 이를 링크 정보 데이터베이스(13)에 저장한다. 이 때, 웹사이트별로 검색 깊이(depth)를 한 페이지 정도로 하여 하이퍼링크 정보를 추출한다. 즉, 예를 들어, 각 웹사이트별로 메인 페이지에서만 하이퍼링크 정보를 추출하며, 서브 페이지에서의 하이퍼링크 정보는 추출하지 않는다. 그러나, 본 발명에 따른 검색 깊이는 이것에 한정되지 않으며, 필요에 따라 하나 이상의 페이지에서 하이퍼링크 정보를 추출할 수 있다.The hyperlink extracting unit 122 extracts information hyperlinked by a different website for each website, and stores the information in the link information database 13. At this time, hyperlink information is extracted with a search depth of about one page for each website. That is, for example, the hyperlink information is extracted only from the main page of each website, and the hyperlink information of the sub page is not extracted. However, the search depth according to the present invention is not limited to this, and hyperlink information can be extracted from one or more pages as necessary.
이와 같은 방식으로 모든 평가 대상 웹사이트들에 대하여 하이퍼링크를 추출하고 나면, 통계 처리부(123)가 링크 정보 데이터베이스(131)에 저장된 정보를 토대로 웹사이트별로 추출된 각각의 하이퍼링크가 얼마나 많은 웹사이트들로부터 참조되었는지를 계산한다(S150).After extracting the hyperlinks for all the websites to be evaluated in this manner, the statistical processor 123 calculates how many websites each hyperlink extracted for each website is based on the information stored in the link information database 131. It is calculated whether the reference from the (S150).
예를 들어, 사용자가 입력한 ‘P2P’ 라는 검색어에 대하여 약 30개의 웹사이트가 평가대상으로 추출되었다고 하자. 이 30개의 웹사이트들에 대하여 하이퍼링크 정보를 분석한 결과 ‘OpenP2P’라는 하이퍼링크(웹사이트)가 30개의 웹사이트중 29개로부터 참조되어 가장 많은 웹사이트들로부터 참조되었다는 통계를 얻을 수 있다.For example, suppose that about 30 websites have been extracted for evaluation based on the search term 'P2P' entered by the user. As a result of analyzing the hyperlink information on the 30 websites, the statistics that the hyperlink named "OpenP2P" was referred to from 29 of the 30 websites were referred to from the most websites.
다음에, 순위 결정부(124)가 이러한 하이퍼링크 분석결과를 토대로 가장 자주 참조되는 순서로 웹사이트들의 순위를 결정한다(S160). 위의 예를 적용하면, ‘OpenP2P’라는 웹사이트가 1순위로 결정된다.Next, the ranking unit 124 determines the ranking of the websites in the order that is most frequently referenced based on the hyperlink analysis result (S160). Using the example above, a website named "OpenP2P" is ranked first.
순위 결정이 이루어지면, 디스플레이부(125)가 결정된 순위에 따라 추천 웹사이트 결과를 정보검색 사용자가 보기 편하도록 디스플레이 한다(S170). 즉, 순위별로 웹사이트를 디스플레이 하여 사용자가 위에 디스플레이된 웹사이트가 가장 신뢰성 있는 정보를 제공하는 사이트임을 알 수 있도록 한다.When the ranking is made, the display unit 125 displays the recommended website results so that the information retrieval user is easy to see according to the determined ranking (S170). That is, by displaying the websites by ranking, the user can know that the website displayed above is the site providing the most reliable information.
따라서, 사용자는 디스플레이된 웹사이트 중에서 상위에 위치하는 웹사이트로 접속하여 찾고자 하는 주제에 대한 신뢰성 있는 정보를 제공받을 수 있다(S180).Therefore, the user may be provided with reliable information on a topic to be found by accessing a website located above the displayed website (S180).
한편, 순위 결정부(124)는 검색어별로 순위가 결정된 웹사이트 정보를 추천 정보 데이터베이스(132)에 선택적으로 저장하여, 이후에 동일한 검색어 입력시에 별도의 평가 과정 없이 웹사이트 정보를 순위별로 제공할 수 있도록 할 수 있다.Meanwhile, the ranking determiner 124 selectively stores the website information ranked for each search term in the recommendation information database 132 to provide website information for each rank without a separate evaluation process when the same search term is input later. You can do that.
이상에서는 본 발명의 실시 예에 대하여 상세하게 설명하였으나, 본 발명은 상기한 실시 예에만 한정되는 것은 아니며 그 외의 다양한 변형이나 변경이 물론 가능하다.In the above, embodiments of the present invention have been described in detail, but the present invention is not limited to the above-described embodiments, and various other modifications or changes are possible.
이러한 본 발명에 따르면, 특정 주제에 대하여 알고자 하는 정보검색 사용자들은 그 주제에 대하여 대표적인 웹사이트만을 추천 받음으로서, 방대한 인터넷상의 자료들을 보다 효율적으로 이용할 수 있다.According to the present invention, information retrieval users who want to know about a particular subject are recommended only representative websites on the subject, so that the data on the Internet can be used more efficiently.
또한, 종래 사람의 판단력에 의존하여 결정되던 순위 결정방식을 대신하여 컴퓨터를 이용한 자동화방식으로 수행되기 때문에, 정보 검색 및 신뢰성 있는 정보 제공의 효율성을 높일 수 있다.In addition, since it is performed by an automated method using a computer in place of the ranking method that has been determined depending on the judgment of the conventional person, it is possible to increase the efficiency of information retrieval and reliable information provision.
Claims (6)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020030010070A KR20040074693A (en) | 2003-02-18 | 2003-02-18 | System and method for estimating web site |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020030010070A KR20040074693A (en) | 2003-02-18 | 2003-02-18 | System and method for estimating web site |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20040074693A true KR20040074693A (en) | 2004-08-26 |
Family
ID=37361331
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020030010070A Ceased KR20040074693A (en) | 2003-02-18 | 2003-02-18 | System and method for estimating web site |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR20040074693A (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007056031A1 (en) * | 2005-11-03 | 2007-05-18 | Microsoft Corporation | Using popularity data for ranking |
| WO2008084930A1 (en) * | 2007-01-12 | 2008-07-17 | Nhn Corporation | Method for offering result of search and system for executing the method |
| KR100952391B1 (en) * | 2005-04-14 | 2010-04-14 | 에스케이커뮤니케이션즈 주식회사 | A value analysis system, method, and computer readable recording medium capable of implementing the same according to the evaluation of contents in an internet network |
| WO2011152647A1 (en) * | 2010-06-01 | 2011-12-08 | Lee Jeong-Gab | Method for managing advertisement and advertisement management server |
-
2003
- 2003-02-18 KR KR1020030010070A patent/KR20040074693A/en not_active Ceased
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100952391B1 (en) * | 2005-04-14 | 2010-04-14 | 에스케이커뮤니케이션즈 주식회사 | A value analysis system, method, and computer readable recording medium capable of implementing the same according to the evaluation of contents in an internet network |
| WO2007056031A1 (en) * | 2005-11-03 | 2007-05-18 | Microsoft Corporation | Using popularity data for ranking |
| US7783632B2 (en) | 2005-11-03 | 2010-08-24 | Microsoft Corporation | Using popularity data for ranking |
| WO2008084930A1 (en) * | 2007-01-12 | 2008-07-17 | Nhn Corporation | Method for offering result of search and system for executing the method |
| US8150839B2 (en) | 2007-01-12 | 2012-04-03 | Nhn Corporation | Method and system for offering search results |
| WO2011152647A1 (en) * | 2010-06-01 | 2011-12-08 | Lee Jeong-Gab | Method for managing advertisement and advertisement management server |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10839029B2 (en) | Personalization of web search results using term, category, and link-based user profiles | |
| US9367591B2 (en) | Client system and server | |
| US7454417B2 (en) | Methods and systems for improving a search ranking using population information | |
| US20050240580A1 (en) | Personalization of placed content ordering in search results | |
| US7930287B2 (en) | Systems and methods for compound searching | |
| CN108280081B (en) | Method and device for generating webpage | |
| JP2008181186A (en) | How to find the relevance between keywords and sites using query logs | |
| CN104050243B (en) | It is a kind of to search for the network search method combined with social activity and its system | |
| JP4875911B2 (en) | Content identification method and apparatus | |
| JP4909748B2 (en) | Method and server for recommending information related to Web page of reference source to Web page based on history information of page moving operation | |
| JP4962980B2 (en) | Search result classification apparatus and method using click log | |
| CN103370708B (en) | Information processing device and information processing method | |
| US9064014B2 (en) | Information provisioning device, information provisioning method, program, and information recording medium | |
| KR20020022977A (en) | Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources | |
| KR20030024295A (en) | Search system using real names and method thereof | |
| KR20040074693A (en) | System and method for estimating web site | |
| JP2007317105A (en) | On-demand link creation system | |
| KR101308821B1 (en) | Keyword extraction system for search engines and extracting method thereof | |
| CN110866170A (en) | Importance evaluation method, search method and system of Tor darknet service based on site quality | |
| KR20010108877A (en) | Method For Evaluating A Web Site | |
| JP4869311B2 (en) | Advertising bid term suggestion device, advertising bid term suggestion system, and advertising bid term suggestion method | |
| JP2007188134A (en) | Document search method using index file | |
| JP5777663B2 (en) | Search support device and search support program | |
| JP3984263B2 (en) | Map information system linked search engine server system. | |
| JP2011039697A (en) | Recommendation information providing device, user terminal, operation recommendation method, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20030218 |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20080215 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20030218 Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20100114 Patent event code: PE09021S01D |
|
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20100330 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20100114 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |