StarDict 사전파일의 재활용 (On PC -W7, 10)
2018.06.02 14:16
요즘은 온라인 사전이 좋아 굳이 오프라인 사전이 필요없을 정도지만 일전엔 StarDict 을 위시한 오프라인 사전이 꽤나 유행했었다.
이제 StatDict 은 사전 파일의 저작권등에 치여 공식적인 Project 는 없어지고 카피나 다른 Project 형태로 남아있다.
http://stardict.sourceforge.net/
Android 용(StarDict 호환)으로는 상기 ColorDict 정도인데 이도 업데이트 안된지 좀 된듯하다.
본 글의 목적은 StatDict 사전 파일의 무단 공유가 아니라 이미 획득한(?) 사전파일의 PC 애서의 활용이다. 따라서 사전 파일의 공유 요청이나 딴지는 일절 무대응 할 것이다.
StarDict 사전 파일의 구성은 아래 그림과 같다.
.dict 파일이 사전 본 파일이고 .idx 가 단어 index 그리고 .idCS 가 본인이 재활용하기 위해 만든 다른 형태의 index 파일이다.
res 폴더는 이미지 리소스 파일인데 여기에 .css 그리고 발음기호 이미지 들이 있기에 반드시 필요하다.
.css 가 있는이유는 사전 내용이 이미지 와 문자 혼합이라 이를 효과적으로 표현하기 위해 html 을 이용한듯 하고 따라서 이를 표현하려면 Web Browser Control 이 필요하다.
.dict, .idx 는 모두 바이너리 형태라 사용하려면 별도의 파싱을 해야한다, 그럼 그냥 파싱해서 쓰면 돼지 왜 또 별도로 추가를 했나하면
.idx 의 Byte Order 가 Unix Style 이라 PC 에서는 변환이 필요하고 그에따른 전처리 작업이 필요한데 이를 쓸 때마다 작업하기엔 불합리한 측면이 있어 그냥 미리 만들기로 한 것이다.
idxidCS.exe 가 그작업을 하는 tool 이고 아래 그림과 같다.
성공하면 사전을 활용하기 위한 작업이 끝났다.
아래는 SharpDict.exe 실행 화면이다.
먼저 설정 버튼을 눌러 생성한 .idCS 를 선택한다. 이 파일명을 기준으로 .dict 를 찾기에 두 파일 명은 확장자만 다르고 같아야 한다.
덤으로 TTS 설정 화면이다. W10 영문판에 한글 언어팩 추가 형태로 설치하면 아래 그림처럼 Voice 3 개가 뜬다. David 가 그나마 들어줄만 하다.
마지막으로 단어 찾기를 시도하면...
이렇게 된다.
Longman Dictionary of Contemporary English, 4th Edition 의 경우 ColorDict 에서도 첨부 이미지들이 제대로 언나오는데 분석한 결과 이미지 명 좌우로 보이지않는 특수문자들이 있었고 이를 제거하여 제대로 표현 가능하게 앴다.
** 실행화일 및 개발자들을 위해 소스 (C#, WPF) 첨부 한다.
** 실행 환경
W7, 10 - ,NET 4.6.2 or Higher
Window 내장 Web-Browser(IE) Control를 쓰므로 강제로 IE를 제거한 환경에서는 제대로 실행이 안될수도 있다.
** 사용 폰트 : 가독성을 위해 나눔고딕코팅을 사용 https://github.com/naver/nanumfont/blob/master/README.md