바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

입말 표기를 이용한 영어 단어 검색

Retrieving English Words with a Spoken Word Transliteration

한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292
2005, v.39 no.3, pp.93-103
김지승 (숭실대학교)
이준호 (숭실대학교)
김광현 (숭실대학교)
  • 다운로드 수
  • 조회수

초록

영어 사전 검색 서비스 이용자들은 원하는 영어 단어의 철자를 정확하게 기억하지 못하고, 발음만을 기억하는 경우가 있다. 이러한 이용자들에게 도움을 주기 위해 본 연구에서는 입말 표기, 즉 영어 단어 발음의 한글 표기를 이용하여 영어 단어를 효과적으로 검색할 수 있는 방법을 제안한다. 이를 위하여 코닉스(KONIX) 코드를 개발하며, 입말 표기와 영어 단어를 코닉스 코드들로 변환한다. 그리고 변환된 코닉스 코드들 사이의 음성적 유사도를 편집 거리 방법과 2-그램 방법을 이용하여 계산한다. 또한 제안한 방법이 입말 표기에 의한 영어 단어 검색에 매우 효과적임을 실험을 통하여 입증한다.

keywords
정보 검색, 영어 사전 검색, 음성적 유사도, Information Retrieval, English Dictionary Search, Phonetic Similarity, Information Retrieval, English Dictionary Search, Phonetic Similarity

Abstract

Users of searching Internet English dictionary sometimes do not know the correct spelling of the word in mind, but remember only its pronunciation. In order to help these users, we propose a method to retrieve English words effectively with a spoken word transliteration that is a Korean transliteration of English word pronunciation. We develop KONIX codes and transform a spoken word transliteration and English words into them. We then calculate the phonetic similarity between KONIX codes using edit distance and 2-gram methods. Experimental results show that the proposed method is very effective for retrieving English words with a spoken word transliteration.

keywords
정보 검색, 영어 사전 검색, 음성적 유사도, Information Retrieval, English Dictionary Search, Phonetic Similarity, Information Retrieval, English Dictionary Search, Phonetic Similarity

참고문헌

1.

최기선. 1990. 외국어 음차 표기의 음성적 유사도 비교 알고리즘. ,

2.

F. 1964. ?A technique for com- puter detection and correction of spel- ling errors.? Communications of the ACM,

3.

J. 1993. ?Combination of Multiple searches.? In Harman Washington. National Institute of Standards and Technology Special Publication,

4.

T.. 1988. ??Fisching fore werds?. Pho- netic retrieval of written text in infor- mation retrieval systems.? Program,

5.

(180-188.) J. 1995. ?Combining Multiple Evidence from Different Properties of Weighting Schemes ACM SIGIR Conference on Research and Development in Information Retrieval,

6.

H. 1999. ?N-Gram- Based Indexing for Korean Text Retrieval,

7.

(191-211.) E. 1992. ?Approximate string- matching with q-grams and maximal matches.? Theoretical Computer Sci- ence,

8.

D. 2000. ?The TREC-8 Question Answering Track Evaluation.? In Text Retrieval Con- ference TREC-8.,

9.

(1996.) Lessons from information retrieval.? In Proceedings of ACM SIGIR Conference on Information Retrieval,

한국문헌정보학회지