기 타 OCR처리된 PDF 파일에서...
2021.09.08 19:33
북스캔 후 OCR 처리 하려면 먼저 스캔 해서 PDF 파일을 만든 후 OCR 처리를 해야 한다고 알고 있습니다.
이렇게 OCR 처리까지 마친 PDF 파일에서 OCR 처리를 지우고 OCR 처리 전 파일인 순수한 PDF 파일을 만들 수 있는지요?
댓글 [6]
-
내가사는이유 2021.09.08 19:58 -
줄넘기 2021.09.08 22:18
이렇게 OCR 처리까지 마친 PDF 파일에서 OCR 처리를 지우고 OCR 처리 전 파일인 순수한 PDF 파일을 만들 수 있는지요?
=> 해보지는 않았지만, ocr된 pdf를 출력하면서 출력 형태를 pdf로 하면 기존의 ocr이 전부 없어질것 같습니다.
-
asklee 2021.09.08 22:40
줄넘기님 됩니다. 정말 발상의 전환이네요
감사합니다.
-
DarknessAngel 2021.09.09 08:35
다만 OCR 처리 과정에서 잘못 인식해서 손상된 문자열이나 오리지널의 폰트 정보같은건 다 날아갑니다
-
줄넘기 2021.09.09 08:56
네. 맞습니다. 인식률이 90%는 넘어도 결국에는 인간의 검수가 필요하기 때문에 ocr은 하지 않는게 나을 듯 합니다.
-
네오이즘 2021.09.09 11:12
모든 문서는 문서형태인 벡터방식과 그림형태인 비트맵방식으로 이뤄져 있습니다.
출판사에서 제공하는 PDF등은 제작문서 원본을 PDF로 변환하기때문에 벡터방식일 가능성이 높고 이경우 OCR을 안해도 문자 읽고 쓸수가 있습니다
(HWP파일을 PDF로 변환한 형식)
이에반해 개인이 책을 스캔을 하면 기본적으로 그림형태로 비트맵방식으로 스캔이 됩니다.
그위에 OCR을 하게 되면 글자가 내장되게 되는 방식인데......
이런 과정이랑 상관없이 PDF파일을 이미지화(래스터)시키면 OCR이고 뭐고 다 날라가고 그림만 남습니다.
스캔을 했으니 당연히 원본만 남겠죠
OCR이 힘든거지 래스터화시키는건 어렵지가 않습니다.
이게 왜 문제가 되는지 모르겠네요
번호 | 제목 | 글쓴이 | 조회 | 등록일 |
---|---|---|---|---|
[공지] | 질문과 답변 게시판 이용간 유의사항 | gooddew | - | - |
13401 | 윈 도 우| 윈도우10 1903 업데이트 이후 특정프로그램 실행시 오류가 ... | 소금별 | 381 | 07-23 |
13400 | 소프트웨어| startisback 문의드립니다. [3] | 바수 | 381 | 07-20 |
13399 | 하드웨어| 테더링으로 인터넷 연결시 [5] | 양치기영감 | 381 | 07-12 |
13398 | 윈 도 우| 램디스크 사용시에 환경변수로 인한 프로그램 실행 오류... [4] | 초보윈도우 | 381 | 07-12 |
13397 | 윈 도 우| 윈도우10 시스템 보호 속성페이지 오류, 시스템보호 사용 ... | 번개 | 381 | 05-04 |
13396 | 하드웨어| 부팅 => USB 안보여요!!!??? [5] | 부키시 | 381 | 03-16 |
13395 | 소프트웨어| 윈도우 10에서 실행불가 응용프로그램 입니다. [2] | 하늘은높고 | 381 | 02-07 |
13394 | 윈 도 우| 간간히 부팅 에러 발생 [2] | asklee | 381 | 12-26 |
13393 | 하드웨어| 그래픽카드 추천 부탁 [2] | knada | 381 | 08-22 |
13392 | 윈 도 우| 각시탈님 카페 가입하신분들 계신가요? [2] | 도우너2 | 381 | 07-26 |
13391 | 소프트웨어| YUMI Multiboot USB를 사용하여 winpe에 관해 질문할게요 | redforce85 | 381 | 05-18 |
13390 | 소프트웨어| 보이스 레코더에 음성을 컴퓨터에 녹음을 할려면,,, [5] | 좋은데이 | 381 | 08-11 |
13389 | 윈 도 우| rs4 재부팅 [1] | 깨중이 | 381 | 04-28 |
13388 | 윈 도 우| 태블릿에 적합한 윈도우즈가 어떤 것인지 조언부탁드립니다. [2] | biho | 381 | 11-07 |
13387 | 소프트웨어| 레인미터를 설치했는데 어떻게 적용하나여. [6] | 아구다 | 381 | 04-30 |
13386 | 윈 도 우| HD TUNE PRO 5.75 한글버젼 혹시 받을수 있는곳 있을까요? | 개미7 | 381 | 01-15 |
13385 | 서버 / IT| 서버 2016 에서 서비스 자동시작 관련 질문입니다. | VALKyRiE™ | 381 | 11-04 |
13384 | 소프트웨어| [요청] 뒤늦게 프로그램 공부를 하고 싶습니다 [2] | 항상감사 | 381 | 01-12 |
13383 | 윈 도 우| 백업 방법 문의 - HDD 파일들 [4] | 눅스야 | 381 | 03-01 |
13382 | 윈 도 우| pe로 부팅해서 ISO로 윈도우 설치 등의 용어를 알고싶습니다 [3] | never | 381 | 02-14 |
불가능합니다.
필요없는 부분을 없애는 방식으로 처리한거라
그 없앤 부분을 다시 원본처럼 되살려 낼 수가 없습니다.
컬러 사진을 흑백 사진으로 만들었다가
다시 컬러 사진으로 만든다고 생각해보세요.
OCR처리라고 하신게 흑백처리 비슷하거든요.
요즘은 AI 로 원래 흑백사진도 컬러로 만들 수 있다고는 합니다만
그게 원본 컬러 사진은 아니죠.
비슷하게 복원했다고 합니다.