소프트웨어 ABBYY 에서 납득이 안되는 사실들
2018.11.15 20:48
ABBYY 프로그램을 사용 중입니다. (버전 14)
ABBYY 는 이미지만으로 된 PDF 파일에 텍스트를 입혀 줍니다.
그렇게 텍스트가 입혀지고 나면 그 텍스트는 drag 도 되고 find 도 되게 됩니다.
그런데 원래 PDF 를 구성하고 있던 각 Page 의 이미지는
특별한 변형없이 그대로 두는 것이 상식적인 일이라 생각됩니다.
텍스트만 입히는 것 외에 다른 목적은 없으니까요.
그런데 '원래 PDF 를 구성하고 있던 각 Page 의 이미지 퀄리티'
라는 설정이 있습니다. 아래사진참조
초기값은 Balanced 로 되어있습니다.
그런데 Balanced 상태에서 OCR 을 해서 텍스트를 입힌 PDF 의 경우
이미지의 퀄리티가 아래와 같이 상당히 떨어집니다.
<원본 pdf 의 이미지 >
<OCR 마친 후 생성된 PDF 의 이미지>
정리 및 첨언하자면 ABBYY 프로그램에서
1) 이미지 퀄리티에 대한 설정이 존재한다.
2) default 값인 balanced 로 진행할 경우 퀄리티가 상당히 떨어진다.
3) best 로 해도 원본보다 퀄리티가 떨어지는 것 같다.
4) 원본 이미지를 그대로 유지하는 방법이 없어 보인다.
이 4 가지 모두 납득이 잘 안되네요. 어떻게 생각하세요?
댓글 [4]
-
DarknessAngel 2018.11.15 21:44
-
ton3d 2018.11.15 22:05
Best 말고 Custom 선택하고 옵션에서 할 수 있는 것을 다 해도 원본과는 달라지네요
-
노래하는다롱이 2018.11.16 02:35 전 11, 12, 14 버전 다 사용해 왔는데, 그렇지 않던데요. 혹시 이미지 사전 처리 때문에 그런 것은 아닐까요? 이미지 사전 처리 설정을 다 끄고 해보세요.
-
공자왈 2018.11.30 21:38
아크로뱃도 그렇더군요. 깜짝 놀랐었습니다.
알pdf는 사용해보니 아예 글꼴을 바꿔버리던데
인식율때문에 개판이 되버리더군요.
원본을 그대로 유지해주는게 pdf의 장점중 하나인데, 지맘대로 저러는건가요