기 타 OCR처리된 PDF 파일에서...
2021.09.08 19:33
북스캔 후 OCR 처리 하려면 먼저 스캔 해서 PDF 파일을 만든 후 OCR 처리를 해야 한다고 알고 있습니다.
이렇게 OCR 처리까지 마친 PDF 파일에서 OCR 처리를 지우고 OCR 처리 전 파일인 순수한 PDF 파일을 만들 수 있는지요?
댓글 [6]
-
내가사는이유 2021.09.08 19:58 -
줄넘기 2021.09.08 22:18
이렇게 OCR 처리까지 마친 PDF 파일에서 OCR 처리를 지우고 OCR 처리 전 파일인 순수한 PDF 파일을 만들 수 있는지요?
=> 해보지는 않았지만, ocr된 pdf를 출력하면서 출력 형태를 pdf로 하면 기존의 ocr이 전부 없어질것 같습니다.
-
asklee 2021.09.08 22:40
줄넘기님 됩니다. 정말 발상의 전환이네요
감사합니다.
-
DarknessAngel 2021.09.09 08:35
다만 OCR 처리 과정에서 잘못 인식해서 손상된 문자열이나 오리지널의 폰트 정보같은건 다 날아갑니다
-
줄넘기 2021.09.09 08:56
네. 맞습니다. 인식률이 90%는 넘어도 결국에는 인간의 검수가 필요하기 때문에 ocr은 하지 않는게 나을 듯 합니다.
-
네오이즘 2021.09.09 11:12
모든 문서는 문서형태인 벡터방식과 그림형태인 비트맵방식으로 이뤄져 있습니다.
출판사에서 제공하는 PDF등은 제작문서 원본을 PDF로 변환하기때문에 벡터방식일 가능성이 높고 이경우 OCR을 안해도 문자 읽고 쓸수가 있습니다
(HWP파일을 PDF로 변환한 형식)
이에반해 개인이 책을 스캔을 하면 기본적으로 그림형태로 비트맵방식으로 스캔이 됩니다.
그위에 OCR을 하게 되면 글자가 내장되게 되는 방식인데......
이런 과정이랑 상관없이 PDF파일을 이미지화(래스터)시키면 OCR이고 뭐고 다 날라가고 그림만 남습니다.
스캔을 했으니 당연히 원본만 남겠죠
OCR이 힘든거지 래스터화시키는건 어렵지가 않습니다.
이게 왜 문제가 되는지 모르겠네요
번호 | 제목 | 글쓴이 | 조회 | 등록일 |
---|---|---|---|---|
[공지] | 질문과 답변 게시판 이용간 유의사항 | gooddew | - | - |
90670 | 윈 도 우| 잠금화면에 대하여 질문 드립니다. [2] | 갠지스의잔 | 165 | 09-09 |
90669 | 소프트웨어| ms오피스 해마다 상위버전ㅈ나오는거 엑셀 같은 단축키가 ... [2] | 치국평천하 | 584 | 09-09 |
90668 | 윈 도 우| 무인 설치오류 [1] | 사이버해결 | 325 | 09-09 |
90667 | 윈 도 우| sysprep 봉인완료 후 wim이미지 부팅하면 다시 봉인화면으... [2] | 직구중독 | 421 | 09-08 |
90666 | 윈 도 우| 윈도우 업데이트 때 다시시작하고 화면 깜빡일때는 [1] | 치국평천하 | 343 | 09-08 |
» | 기 타| OCR처리된 PDF 파일에서... [6] | asklee | 402 | 09-08 |
90664 | 윈 도 우| 네트워크 단순궁금증 [1] | First. | 344 | 09-08 |
90663 | 하드웨어| exFAT 파일시스템에 대해서 잘 아시는분? [7] | 컴알못러 | 620 | 09-08 |
90662 | 윈 도 우| 사진앱 jpg..? [1] | 뚜릅 | 388 | 09-08 |
90661 | 윈 도 우| 시작프로그램 Setuplancher 삭제하는 방법 없을까요? [1] | slhyou | 268 | 09-08 |
90660 | 소프트웨어| 오피스는 아직 디지털 인증툴이 없나요? [6] | 『ⓖⓤⓝ』 | 1193 | 09-08 |
90659 | 소프트웨어| Executor Launcher 실행시 오류 [2] | 사이버해결 | 158 | 09-08 |
90658 | 서버 / IT| 인터넷에서 스크리밍 동영상을 클릭하면 왜 유트브가 뜨나요. | 레전드한화 | 192 | 09-08 |
90657 | 소프트웨어| 비츄얼 박스 Uefi설정 방법 [4] | 사이버해결 | 277 | 09-08 |
90656 | 기 타| H.265 264 변환 [3] | 홍낄똥 | 445 | 09-08 |
90655 | 윈 도 우| Windows 11, 22H2 Insider 질문요 [8] | 토니™짱야 | 701 | 09-07 |
90654 | 윈 도 우| 9세대 pc에 win10 32bit 설치방법요 [2] | 는개 | 715 | 09-07 |
90653 | 윈 도 우| 안녕하세요 윈도우7 관련 질문있습니다! [4] | 흊흊 | 311 | 09-07 |
90652 | 윈 도 우| 디스크 mbr을 nt60로 배치파일 만들어 할 수 있을까요? [8] | 엇갈린길 | 429 | 09-07 |
90651 | 소프트웨어| AUTOCAD 2020 평가판.. [2] | 덤더미 | 841 | 09-07 |
불가능합니다.
필요없는 부분을 없애는 방식으로 처리한거라
그 없앤 부분을 다시 원본처럼 되살려 낼 수가 없습니다.
컬러 사진을 흑백 사진으로 만들었다가
다시 컬러 사진으로 만든다고 생각해보세요.
OCR처리라고 하신게 흑백처리 비슷하거든요.
요즘은 AI 로 원래 흑백사진도 컬러로 만들 수 있다고는 합니다만
그게 원본 컬러 사진은 아니죠.
비슷하게 복원했다고 합니다.