해외 자료를 회사에 공유해야 할 수 있고 팀원들과 나누어 번역을 한 적이 있습니다. 문제는 일본 서적에서 나는 일본어의 초심자였음. 책임을 진 분량 10여장도 정말 바쁠 수밖에 없었습니다만 그 때 도움을 받은 것이 “OCR(문자 인식)”프로그램이었습니다. 일단 스캔 한 책을 OCR기능을 갖춘 100만원(!)이상의 번역기 프로그램에게 돌리셨습니다만, 대충 어느 정도 어감을 거리낌 없이 두드리며 성공적으로 번역할 수 있었습니다. 요즘은 무료 구글 번역기가 좋아지고 스캔한 PDF문서의 OCR도 잘못 인식 없이 제대로 되면 번역은 어렵지 않아 집니다. 좋은 세상이죠? ^^^^;{PDF아직 뷰어에서 볼 만한 분? MS오피스도 모니터만 보나요?)요즘에는 직장뿐 아니라 대학원/대학생들도 논문과 전공서를 PDF문서에서 스캔해서 iPad에 넣고 다닙니다. 보관/휴대성이 좋아진 대신 단점도 없는 것은 아닙니다. 디지털화된 자료는 손에 들어 종이 문서나 책과 달리 필요한 정보를 계속~ 주며 탐색하기가 쉽지 않습니다. 그래서 스캔한 PDF문서에서도<검색>이 꼭 필요한데 이 때 필수적인 것이 “문자 인식”이 되고 있다”PDF”입니다. 번역의 문제가 아니라도 디지털화된 문서에서 필요한 자료를 바로 찾기는 매우 중요한 문제입니다. PDF를 단순히 저장하고 공유하고 그것을 모니터(Acrobat reader)과 보는 정도에 사용했다면 필요한 부분만 분리하고 잘라내고 복수의 문서를 작성해서 회전/변경하는 등 편집하고 활용하는 것도 알아야죠. 내용을 입력/수정하거나 편집하거나 주석을 달고 밑줄을 그등 일반 문서처럼 편집이 가능할 뿐 아니라 데스크 톱에서는 없는 스마트 폰, iPad 같은 태블릿에서 역시 활용할 수 있는 것이 중요합니다. 그래서 사진은 포토샵, 문서 작성과 MS오피스가 있도록 PDF 하면 제대로 편집과 OCR기능이 갖춰진 프로급 PDF프로그램을 한개 정도 놔두고 사용할 것을 권합니다. 이번의 포스팅에서는 최근 테스트 후, 다재 다능한 기능에 만족하고 사용하고 있는 PDFelement를 소개하겠습니다. ^^해외 자료를 회사에 공유해야 할 일이 생겨서 팀원들과 나눠서 번역을 한 적이 있습니다. 문제는 일본 서적이고, 나는 일본어 초보자였다는 것. 책임질 분량 10여 장도 정말 벅찰 수밖에 없었는데 그때 도움을 받은 게 ‘OCR(문자인식)’ 프로그램이었어요. 일단 스캔한 책을 OCR 기능이 있는 100만원(!) 이상의 번역기 프로그램으로 돌렸는데 대략 어느 정도 어감을 스스럼없이 두드리며 성공적으로 번역할 수 있었습니다. 요즘은 무료 구글 번역기가 좋아져서 스캔한 PDF 문서의 OCR만 오인식 없이 제대로 된다면 번역은 어렵지 않게 됩니다. 좋은 세상이죠? ^^ ^^;{PDF 아직 뷰어로 보기만 하는 분? MS 오피스도 뷰어로만 보나요?) 요즘은 직장뿐만 아니라 대학원/대학생들도 논문이나 전공서를 PDF 문서로 스캔해서 아이패드에 넣고 다닙니다. 보관/휴대성이 좋아진 대신 단점도 없는 것은 아닙니다. 디지털화된 자료는 구할 수 있는 종이 문서나 책과 달리 필요한 정보를 계속 ~ 넘겨주면서 서치하기가 쉽지 않습니다. 그래서 스캔한 PDF 문서에서도 <검색>이 꼭 필요한데 이때 필수적인 것이 <문자 인식>으로 되어 있는 <PDF>입니다. 번역의 문제가 아니더라도 디지털화된 문서에서 필요한 자료를 바로 찾는 것은 매우 중요한 문제입니다. PDF를 단순히 저장하고 공유하고 그것을 뷰어(Acrobat reader)로 보는 정도로 사용했다면 필요한 부분만 분리해서 잘라내고 여러 문서를 묶어 회전/변경하는 등 편집해서 활용할 수도 있어야 합니다. 내용을 입력/수정하거나 편집하거나 주석을 달고 밑줄을 긋는 등 일반 문서처럼 편집이 가능할 뿐만 아니라 데스크톱이 아닌 스마트폰이나 아이패드와 같은 태블릿에서도 동일하게 활용할 수 있는 것이 중요합니다. 그래서 사진이라고 하면 포토샵, 문서 작성과 MS 오피스가 있듯이 PDF라고 하면 제대로 편집과 OCR 기능이 갖춰진 프로급 PDF 프로그램을 하나 정도 상비해서 사용하는 것을 추천합니다. 이번 포스팅에서는 최근 테스트 후 다재다능한 기능에 만족하여 사용하고 있는 PDF element를 소개하고자 합니다. ^^#PDF제작및편집 #OCR #PDF주석포함 ▼프로그램 상세및설치PDFelement@PDFelement 최고의 Acrobat 대체 PDF 편집 프로그램!bit.ly(체험판 및 유료 프로그램입니다) ※제작사 원더쉐어는 글로벌 소프트웨어 제작사로 영상편집, 녹화, 오피스툴 등 다양한 프로그램을 내놓고 있습니다만, 저도 스마트폰 관리 유틸리티는 오래전부터 동사의 프로그램을 사용하고 있습니다.원더쉐어의 대표 프로그램 중 하나인 ‘PDFElement’는PDFelement (메인홈 화면)PDF 문서를 작성, 편집, 관리할 수 있는 다양한 기능을 갖춘 PDF 종합 툴킷 프로그램입니다. PDF 작성 | PDF 편집 | PDF 폼 | PDF 주석 | PDF 변환이 PD Felement는 어도비의 아크로뱃 프로(Acrobat pro)를 대체하는 프로그램으로 정기구독 라이선스도 있지만 1회 구매로 영구 소장도 가능해 가성비가 높습니다. 아직 한국에 잘 알려지지 않았지만 미국 유럽 일본 등 해외에서도 어도비 다음으로 사용자 수가 많은 프로그램입니다.(메뉴 한글화를 완벽하게 해서 한국에 진출했네요.)그만큼 PDF 문서를 다룰 때 필요한 기능, 즉 PDF를 이미지 또는 MS 워드/PPT/엑셀, 그리고 hwp 문서로 변환하거나 페이지 삽입/삭제 그리고 문서 분할하는 편집 작업, 중요 내용에 밑줄 긋고 사진 첨부, 도형이나 메모하는 등의 주석 기능, 서명 붙이기, 양식(폼) 작성, 용량을 압축하여 참고 자료를 첨부하는 기능, 그리고 고급 기능인 OCR까지 PDF를 다루는 다양한 기능과 도구들이 마치 MS 오피스나 포토샵 편집 도구처럼 종합 세트에 갖춰져 있습니다.PDFelement의 메뉴 툴▼ PDF element: PDF ‘주석’ 기능 활용 예▼ PDF element: PDF ‘주석’ 기능 활용 예핵심 기능으로 유용하게 사용할 수 있는 기능이 OCR이기 때문에 어느 정도 잘 될지 관심 있으신 분들은 상당히 궁금하실 것 같습니다. 각 언어별로 테스트한거 보여드릴게요. PDF문자인식(OCR) 성능테스트샘플 PDF: 책 또는 프린트한 문서를 다시 iPhone으로 스캔글로벌 제작사의 프로그램인 만큼 외국어 PDF 문서의 OCR(문자 인식) 기능이 뛰어나다는 제작사의 자부심이 있는 것 같은데(20개 이상의 언어 지원) 직접 테스트해보니 한국어/영어는 물론 중국어, 일본어 등 동양 언어에도 우수한 인식 결과를 보여주었습니다. 몇 가지 사례를 보시고 판단하시면 좋을 것 같습니다. ^^▼ 텍스트 OCR[편집 가능한 텍스트로 스캔]하는 방법과 [이미지로 검색 가능한 텍스트로 스캔] 두 가지 방법이 있으며, 어떤 언어가 사용되었는지 선택하는 [문서 언어] 옵션을 반드시 맞춰야 합니다. 복수언어 선택이 가능하니 언어 혼용이 되는지 먼저 봐주세요. 적용을 누르면 아래와 같이 텍스트 읽기가 이루어지고 선택/복사 등 편집이 가능한 PDF 문서로 변경됩니다. ( ▼ )일부를 텍스트로 복사하여 메모장에 붙여 보았습니다. <영어> 문서에서는 오인식된 알파벳이 보이지 않습니다. 문장 부호까지 정확하네요. 확인해보겠습니까? ^^커다란 커다란 커다란 커다란 큰 105104와 그동안의 차이 우리는 누군가 또는 뭔가가 2개 이상의 명확하게 분리된 사람 또는 물건 사이에 있다고 합니다. 우리는 누군가 또는 무언가가 그룹, 군중, 많은 사람 또는 물건에 있을 때 사용합니다.따로 볼 수 없습니다. 비교:-그녀는 앨리스와 메리 사이에 끼어 있었습니다. 그녀는 아이들 무리 속에 섰다. — 우리 집은 숲과 강과 마을 사이에 있다. 그의 집은 나무 사이에 숨어 있다.Between을 사용하여 간격으로 시간 제한에 대해서 설명할 수 있어요. 창문 사이에 2미터 필요합니다.9시부터 11시 사이에 회사에 있습니다.큰, 큰, 큰, 큰, 큰, 큰, 105104와 그 사이의 차이 우리는 누군가 또는 무언가가 둘 이상의 명확하게 분리된 사람 또는 사물 사이에 있다고 말합니다. 우리는 누군가 또는 무언가가 그룹, 군중, 많은 사람 또는 물건에 있을 때 사용합니다.따로 볼 수는 없어요. 비교:- 그녀는 앨리스와 메리 사이에 서 있었습니다. 그녀는 아이들 무리 속에 서 있었다. 우리 집은 숲과 강과 마을 사이에 있다. 그의 집은 나무들 사이에 숨어 있다.Between을 사용하여 간격과 시간 제한에 대해 설명할 수 있습니다. 창문 사이에 2미터 필요해요.9시에서 11시 사이에 회사에 있습니다.동양 언어는 어떤지 궁금하시죠? 한국어/일본어/중국어 테스트 결과를 보면… 토에이 언어에서는 일부 문자 단위에서 오인식이 조금 보입니다. 그러나 스캔을 휴대폰으로 한 것을 고려하여 다른 OCR과 비교해 볼 때 상당한 수준이라고 판단할 수 있습니다. <한국어 OCR : 신문기사 예>(클릭해서 크게 보세요) 오인식 부분은 {기회→기화, 위해→오른쪽]으로, 2018→2아8}과 같은 일부입니다. 다른 OCR 프로그램이 아직 완벽한 게 없는 만큼 이 정도 오인식 정도면 애교로 볼 수 있지 않을까 싶습니다.2단 신문으로 활자간도 좁아 일반 문서보다는 문자 인식에 난해한 문서입니다. 스캔 상태가 그리 좋지 않은 것도 고려하면 될 것 같습니다.<중국어 OCR : 저널 예>중국어는 제가 잘 모르는 언어라 보기만 해도 똑같아 보이네요. (-_-;) (▼) 텍스트만 메모장에 옮겨봤어요. 중국어를 아시는 분들은 이미지를 클릭하셔서 비교해보시면 좋을 것 같습니다. 차선책으로 텍스트를 ‘구글 번역기’에 넣어서 한국어로 번역해 봤습니다.세상에~ PDFOCR이 너무 잘 됐는지, 구글 번역기를 너무 잘했는지 명문장으로 이해할 수 있는 글이 보입니다. 중국어 오~<일본어 OCR : 문서 예>일본어도 마찬가지로 위의 원문을 아래 텍스트와 비교해 주시면 좋겠습니다. 마찬가지로 번역기로 번역한 결과를 같이 보여드리겠습니다. 일본어 번역은 구글 번역기 결과가 엉망이어서 ‘파파고’ 번역기를 사용했습니다.중국어만큼은 아니지만 번역을 해도 대체로 내용 파악에 문제가 없네요. 이것도 OCR과 번역기(파파고)의 궁합이 잘 맞았던 것 같아요.이렇게 OCR에서 문자인식된 문서는 검색을 통해서 필요한 부분을 바로 찾을 수 있기 때문에 나중에 자료 관리할 때도 상당히 도움이 될 것 같습니다. ▼ PDF 검색 가능팁입니다! 에버노트처럼 PDF 문서 내에서 검색할 수 있는 데이터 매니저 앱을 함께 사용하면 당신은 수백 개의 PDF 중 키워드 검색만으로 필요한 문서와 원하는 부분을 바로 찾을 수 있는 자신만의 네이버 검색 DB를 가질 수도 있습니다. 번역도 가능하고 검색도 가능하기 때문에 여기까지도 좋지만 PDFelement의 OCR 기능의 또 다른 핵심적인 이익이 있는데 스캔된 문서에서 데이터를 추출해서 엑셀에 저장할 수 있다는 것!▼ Extract PDF data책이나 스캔 또는 복사해 온 문서에서 폼 안에 들어 있는 수많은 데이터를 직접 타이핑해 보신 분이라면 동공이 확장되었을 텐데 이 기능도 잘 활용했으면 해서 귀띔해 드립니다. ^^ PDF로 데이터 추출 기능 자세히 보기원더 점유율(Wondershare)사의 PDF종합 편집 프로그램”PDFelement”을 소개했습니다. 특히 PDFOCR프로그램과 기능을 중심으로 설명했지만 사실은 기능이 너무 많아 이 포스팅 하나로 일일이 설명하기는 벅찬 감이 있습니다. 체험판을 다운로드 가능하므로 PDF를 다루는 분이라면 꼭 설치하고 테스트하고 보세요. 1개씩 마우스를 대고 보니, 바로 툴의 기능이 알게 리본의 도움말이 충실하고 있습니다. 스마트 폰과 태블릿 PDFelement앱도 평가가 아주 좋습니다. 함께 활용하면 PDF문서를 어디서나 잘 관리합니다. ^^–☞ PD Felement체험판 다운로드원더쉐어(Wondershare)사의 PDF 종합 편집 프로그램 「PDFelement」를 소개했습니다. 특히 PDFOCR 프로그램으로서의 기능 위주로 설명했는데 사실 기능이 너무 많아서 이 포스팅 하나로 일일이 설명하기는 벅찬 감이 듭니다. 체험판을 다운로드 할 수 있으므로 PDF를 취급하는 분이라면 꼭 설치하여 테스트해 보시기 바랍니다. 하나씩 마우스를 맞혀보면 바로 도구의 기능을 알 수 있도록 리본 도움말이 충실합니다. 스마트폰과 태블릿 PDF element 앱도 평가가 아주 좋습니다. 같이 활용하면 PDF 문서를 어디서나 잘 관리할 수 있을 것 같습니다. ^^__ ☞ PD Felement 체험판 다운로드원더쉐어(Wondershare)사의 PDF 종합 편집 프로그램 「PDFelement」를 소개했습니다. 특히 PDFOCR 프로그램으로서의 기능 위주로 설명했는데 사실 기능이 너무 많아서 이 포스팅 하나로 일일이 설명하기는 벅찬 감이 듭니다. 체험판을 다운로드 할 수 있으므로 PDF를 취급하는 분이라면 꼭 설치하여 테스트해 보시기 바랍니다. 하나씩 마우스를 맞혀보면 바로 도구의 기능을 알 수 있도록 리본 도움말이 충실합니다. 스마트폰과 태블릿 PDF element 앱도 평가가 아주 좋습니다. 같이 활용하면 PDF 문서를 어디서나 잘 관리할 수 있을 것 같습니다. ^^__ ☞ PD Felement 체험판 다운로드