:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
17/10/26 16:00
물론 가능할 것 같고 비용도 많이 들지 않을 것 같습니다. 제 생각엔 저정도 기능이면 가격도 매우 저렴하게 불러야 할테니 직접 하실수도 있다고 생각.. 합니다
17/10/26 16:53
스캔을 한 게 아니라, 즉 OCR이 필요한 것이 아닌 경우라면 간단할 겁니다.
PDF 파일들을 탐색기에서 긁어다가 한 번에 클릭해서 프로그램을 실행하고, 결과를 모두 모아서 텍스트 파일로 모아주는 식이라면 어렵잖게 만들 것 같은데요... PDF 파일에서 텍스트만 추출하는 건 쉬운 예제가 널려 있거든요. 약간만 코딩을 할 줄 아시면 직접 만드시거나 저렴한 비용으로 만드는 사람을 구할 수 있을 겁니다.
17/10/26 17:30
pdf가 그림을 저장한게 아닌 글자로 저장되어 있다면(예를 들어 커서로 드래그 가능하다면) 텍스트 추출은 굉장히 쉬울거구요. (오픈소스도 많을테고)
피쟐에 일정 금액(돈 거래가 여기서 좀 그렇다면.. 또는 피자 몇판 치킨 몇마리 이정도)만 걸어도 해주실 능력자분들이 많이 계실 것 같습니다.
17/10/26 17:33
https://pypi.python.org/pypi/slate
뭐 이런것도 있네요. 파일 내 필요한 텍스트 부분이 패턴이 일정하다면 정말 쉬운 문제로 갈 듯..
17/10/26 18:05
(수정됨) 링크를 보면 설레서 상용 프로그램이 있나 해서 클릭해보았는데 무슨 말인지 모를 영어입니다!!
네, 텍스트 부분은 항상 아주 일정하고, 긁어보니 긁어집니다! 필요없는 부분을 지우고 기본서식에 필요한 부분이 들어가야 하는 건데 일단 PGR 운영자 님께 치킨을 걸어도 되는지 여쭤보는 건의 글을 올렸습니다. 감사합니다..^^;;
17/10/26 19:12
어렵지 않을 거 같은데, 난이도는 원하시는 텍스트부분의 형식이 일정한지에 따라 조금 다르겠네요. 예시 pdf 몇개 확인 가능하면 난이도 파악이 수월할 거 같습니다.
17/10/26 19:19
위의 예제처럼 필요한 부분은 홍길동/춘향이 이런 사람이름 이랑 금액부분이예요.
텍스트 부분의 형식은... 보통은 이름이 세자겠지만 외자이신경우에는 한글 이름이 두자일수 있고, 금액부분은 숫자가 자릿수가 변할수 있겠네요. 그정도입니다!
|