· KLDP.org · KLDP.net · KLDP Wiki · KLDP BBS ·
KTS

이상호님의 GPL로 공개한 한글 형태소 분석기

소개

KTS는 EUC-KR, 이성진코드 기반의 한글 형태소분석기로서 1995년에 만들어진 것이 2002년에 [http]GPL2 라이센스로 정식 공개되었습니다.

KTS는 그 코드 기반이 현실정에는 맞지 않으나, 한글 형태소 분석기로 가치뿐만 아니라 코드의 완성도 및 소스에 포함되어 있는 여러가지 정보도 유용하므로 KLDP.net에 둥지를 틀었습니다.

KTS의 특징

  • EUC-KR 및 이성진 코드(한글을 영문으로 표현하는 방법중 한가지) 기반
  • 경로기반의 태깅 및 상태기반의 태깅 동시 지원
  • 각종 사전을 만들기위한 툴이 제공된다.
  • 확률기반 처리 및 미등록어 처리 기법 제공
  • corpus 자료 제공 (태깅된 5만5천여 문장, 태깅안된 7천여 문장)

변경점

1.0.1 2008-04-29

  • svn으로 소스관리
  • ndbm을 사용하던 것을 db의 ndbm호환모드로 사용하도록 고침
  • 소스트리 정리

1.0

GPL2로 공개 (2002)

0.9

최초 버전 (1995)

프로젝트 페이지

문서




sponsored by andamiro
sponsored by cdnetworks
sponsored by HP

Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2008-04-29 22:34:02
Processing time 0.0230 sec