바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

OPAC에서 탐색결과의 클러스터링에 관한 연구

The Effectiveness of Hierarchic Clustering on Query Results in OPAC

한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292
2004, v.38 no.1, pp.35-50
노정순 (한남대학교)
  • 다운로드 수
  • 조회수

초록

본 연구는 한글 OPAC에서 문헌의 분류와 된 탐색결과를 클러스터링하는데도 효과적인지를 규명하기 위해 수행되었다. 서명에 출현하는 단어와 색인자가 부여한 통제어를 통합한 색인어를 이진빈도로 가중치를 주어, 다이스와 자카드 계수, 집단간 평균연결과 완전연결 클러스터링 기법이 테스트되었다. 16개의 서명단어 탐색으로 검색된 문헌을 클러스터링한 결과 최적으로 선택된 클러스터의정확률은 유사도 계수나 클러스터링 기법에 관계없이 서명단어탐색보다 100%이상 향상되었다. 1단계와 최종단계 클러로 유의한 수준은 아니었다. 1단계 클러스터에서 집단간 평균연결이 보다 높은 재현율을 보인 것은 유의하였다. 다이스와 자카드 사이에 차이는 없었다. 최종클러스터가 선택되기까지 집단간 평균연결은 너무 긴 계층군집 단계를 필요로하여 탐색효율 측면에서 바람직해 보이지 않았다.

keywords
OPAC, Document Clustering, Query Result, Similarity, Hierarchic Clustering, OPAC, Document Clustering, Query Result, Similarity, Hierarchic Clustering, 온라인 목록, 문헌 클러스터링, 계층 클러스터링, 탐색결과, 유사도

Abstract

This study evaluated the applicability of the static hierarchic clustering model to clustering query results in OPAC. Two clustering methods(Between Average Linkage(BAL) and Complete Linkage(CL)) and two similarity coefficients(Dice and Jaccard) were tested on the query results retrieved from 16 title-based keyword searchings. The precision of optimal clusters was improved more than 100% compared with title-word searching. There was no difference between similarity coefficients but clustering methods in optimal cluster effectiveness. CL method is better in precision ratio but BAL is better in recall ratio at the optimal top-level and bottom-level clusters. However the differences are not significant except higher recall ratio of BAL at the top-level cluster. Small number of clusters and long chain of hierarchy for optimal cluster resulted from BAL could not be desirable and efficient.

keywords
OPAC, Document Clustering, Query Result, Similarity, Hierarchic Clustering, OPAC, Document Clustering, Query Result, Similarity, Hierarchic Clustering, 온라인 목록, 문헌 클러스터링, 계층 클러스터링, 탐색결과, 유사도

참고문헌

1.

노정순, (2004) OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구, 정보관리학회지

2.

Carlyle, Allyson , (1996) Ordering author and work records: an evaluation of collection in online catalog displa,

3.

Croft, (1980189-195) “A Model of clustersearching based on classification,

4.

(1985) “Automatic classificationof book material repre-sented by back-of-book index ”Journal of Documentation,

5.

Griffiths, (1984) ”Journal of Documentation,

6.

Hearst, M, (1996) Reexamining the cluster hypothesis: Scatter/Gather on retrieval resul,

7.

Larson, (1986) University of California,

8.

(1991197-215) “The Decline of subjectsearching long-term trends andpatterns of index use in an onlinecatalog ”Journal of the AmericanSociety for Information Science,

9.

Leouski, A, (1998) Evaluating a visual navigation system for a digital library,

10.

Lynch, (19891989) Proceedings of a JointMeeting of the British Library,

11.

Peter, (1991) “Controlledand uncontrolled vocabularysubject searching in an academiclibrary online catalog,

12.

Preece, (1973189-190) “Clustering as an outputoption ”Proceedings of the AmericanSociety for information Science,

13.

Roussinov, D, (2001) Information navigation on the web by clustering and summarizing query results,

14.

Salton, (1971) The SMART RetrievalSystem-Experiments in AutomaticDocument Retrieval, Prentice-Hall

15.

Silverstein, D, (1997) Almost-constant-time clustering of arbitary corpus subsets,

16.

Tombros, A, (2002) The Effectiveness of query-specific hierarchic clustering in information retrieval,

17.

Vivisimo,

18.

Wibereley, S. E, (1995) User persistence in displaying online catalog posting: LUIS,

19.

Willett, (1985) ”Internation Forum on Informationand Documentation,

20.

Zamir, O, (1998) Web document clustering: A feasibility demonstration,

한국문헌정보학회지