바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

분류와 사용자 질의어 정보에 기반한 개인화 검색 시스템

A Personalized Retrieval System Based on Classification and User Query

한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292
2009, v.43 no.3, pp.163-180
https://doi.org/10.4275/KSLIS.2009.43.3.163
김광영 (한국과학기술정보연구원)
심강섭 (한국과학기술정보연구원)
곽승진 (충남대학교)
  • 다운로드 수
  • 조회수

초록

본 논문은 사용자가 검색에 사용한 질의어를 기반으로 개인의 성향정보를 분석하고자 한다. 이를 위하여 사용자가 검색을 하기 위해서 입력한 질의어를 문서분류기를 이용하여 범주를 부여한다. 본 연구에서는 각 레코드에 미리 부여된 DDC 분류코드를 분류정보로 활용하였다. 이러한 방식을 사용하여 사용자의 질의어를 기반으로 개인의 특징을 분석한다. 분석된 개인의 성향정보를 검색 결과에 반영하고 개인의 의도에 맞는 문서를 재순위화시키는 개인화 검색시스템을 개발하였다. 또한 개인의 성향정보를 이용하여 단어의 중의성 문제를 해결할 수 있었다. 본 논문에서는 한국과학기술정보연구원이 운영 중인 과학기술학회마을 데이터베이스를 이용하여 개인화와 단어중의성해소에 관한 실험을 수행하였다. 실험과 사용자 평가를 통해서 개인화 검색 및 단어중의성 해소 성능을 제시하였다.

keywords
Classification, Personalization, Personalized Retrieval System, 분류, 개인화, 개인화 검색 시스템, 의미 검색, Classification, Personalization, Personalized Retrieval System

Abstract

In this paper, we describe a developmental system for establishing personal information tendency based on user queries. For each query, the system classified it based on the category information using a kNN classifier. As category information, we used DDC field which is already assigned to each record in the database. The system accumulates category information for all user queries and the user's personalized feature for the target database. We then developed a personalized retrieval system reflecting the personalized feature to produce search result. Our system re-ranks the result documents by adding more weights to the documents for which categories match with the user's personalized feature. By using user's tendency information, the ambiguity problem of the word could be solved. In this paper, we conducted experiments for personalized search and word sense disambiguation (WSD) on a collection of Korean journal articles of science and technology arena. Our experimental result and user's evaluation show that the performance of the personalized search system and WSD is proved to be useful for actual field services.

keywords
Classification, Personalization, Personalized Retrieval System, 분류, 개인화, 개인화 검색 시스템, 의미 검색, Classification, Personalization, Personalized Retrieval System

참고문헌

1.

김성진. 2006. 이용자 중심 웹 정보탐색 연구의 실체이론 분석. ꡔ정보관리학회지ꡕ, 23(3): 127-146.

2.

김희섭, 박용재. 2004. 정보시스템의 이용자만족지수 모형 개발 및 측정. ꡔ정보관리학회지ꡕ, 21(4): 153-171.

3.

남궁황. 2003. 학습시스템에 기반한 개인화 정보 서비스에 관한 연구. ꡔ정보관리학회지ꡕ, 20(4): 113-134.

4.

윤성희. 2007. 질의어 의미정보와 사용자 피드백을 이용한 웹 검색엔진의 성능향상. ꡔ한국산학기술학회논문지ꡕ, 8(2): 280-285.

5.

이소영, 정영미. 2006. 웹 포털 이용자 로그 데이터에 기반한 개인화 검색 서비스 모형의 설계 및 평가. ꡔ정보관리학회지ꡕ, 23(4): 179-196.

6.

이소영, 조영환. 2004. 검색 포탈에서 사용자 질의분석을 통한 검색형태 연구. ꡔ정보과학회지ꡕ, 22(4): 47-51.

7.

허정, 서희철, 장명길. 2006. 상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소. ꡔ정보과학회논문지ꡕ, 33(12): 1073-1088.

8.

허정, 옥철영, 2000. 사전의 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템. ꡔ정보과학회논문지ꡕ, 28(9): 688-698.

9.

Bonnet, Monica. 2001 “Personalization of Web Services: Opportunities and Challenages." Ariadne Issue 28. [online]. [cited 2009.08.17] <http://www.ariadne.ac.uk/issue28/personalization>.

10.

Glover, E. J., Lawrence, S., Gordon, M. D., Bormingham, W. P., & Giles, C. L. 2000. “Web Search - Your Way." Communications of the ACM, 44(12): 97-102.

11.

Jeh, G., & Widom, J. 2003. “Scaling Personalized Web Search." In Proceedings of the 12th International World Wide Web Conference, 271-279.

12.

Riecken, D.. 2000 “Personalized Views of Personalization." Communication of the ACM, 43(8): 27-28.

13.

Shahabi, Cyrus, & Chen, Yi-Shin. 2003. “Web Information Personalization: Challenges and Approaches." In Proceedings of 3rd Workshop on Databases in Networked Information System(DNIS): 5-15.

한국문헌정보학회지