PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2017/10/26 15:51:25
Name 나제
Subject [질문] 프로그램 만드는데 비용이 얼마나 들지 궁금합니다. (수정됨)
매일 매일 같은 PDF 파일을 수십개를 받고 있습니다.

--
안녕하십니까 어쩌고저쩌고

성명 : 홍길동
주소 : 어쩌고저쩌고
금액 : 50,000원

감사합니다. 어쩌고저쩌고
----

이렇게 같은 자리에 적혀있는 PDF파일인데요(완전 동일 같은 자리에). 위 아래에는 다른 내용도 막 있고요.


요즘 PDF를 워드로 인식해주는 프로그램이 있더라구요.
해당 문서는 스캔한 것이 아니라 알PDF등으로는 전체 인식이 잘됩니다.

해당 프로그램과 결합(?)해서 PDF파일을 업로드(?) 하면, 딱 제가 필요한 부분만 인식해서

" 홍길동님,
  50,000원이 발생되었습니다"

라고 텍스트가 나오는 방식의 프로그램을 만들수 있을까요?
저의 짧은 생각으로는 만드는건 가능할 것 같은데 비용이 많이 들지도 궁금합니다.

완전 컴알못이라 무식한 질문이라고 지적하시는 부분도 달게 받겠습니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
AlwaysAwake
17/10/26 16:00
수정 아이콘
물론 가능할 것 같고 비용도 많이 들지 않을 것 같습니다. 제 생각엔 저정도 기능이면 가격도 매우 저렴하게 불러야 할테니 직접 하실수도 있다고 생각.. 합니다
17/10/26 17:23
수정 아이콘
워드 pdf 변환 정도나 할줄 아는 사람이라 직접은 무리인데 댓글 감사합니다ㅠㅠ
Lord of Cinder
17/10/26 16:53
수정 아이콘
스캔을 한 게 아니라, 즉 OCR이 필요한 것이 아닌 경우라면 간단할 겁니다.
PDF 파일들을 탐색기에서 긁어다가 한 번에 클릭해서 프로그램을 실행하고, 결과를 모두 모아서 텍스트 파일로 모아주는 식이라면 어렵잖게 만들 것 같은데요... PDF 파일에서 텍스트만 추출하는 건 쉬운 예제가 널려 있거든요. 약간만 코딩을 할 줄 아시면 직접 만드시거나 저렴한 비용으로 만드는 사람을 구할 수 있을 겁니다.
17/10/26 17:24
수정 아이콘
네 댓글 감사합니다. 스캔한 파일은 아닙니다. 혹시 이런거 할줄아시는 분은 어디서 수소문할수 있을까요?
오클랜드에이스
17/10/26 17:28
수정 아이콘
정규표현식이랑 텍스트파일 전처리만 되면 될 것 같네요
17/10/26 18:03
수정 아이콘
간단하다고 생각하시는 표현같은데 "정규표현식" "전처리" ㅠㅠ둘다 모르는 용어라서 이해는 못했습니다. 감사합니다..
17/10/26 17:30
수정 아이콘
pdf가 그림을 저장한게 아닌 글자로 저장되어 있다면(예를 들어 커서로 드래그 가능하다면) 텍스트 추출은 굉장히 쉬울거구요. (오픈소스도 많을테고)
피쟐에 일정 금액(돈 거래가 여기서 좀 그렇다면.. 또는 피자 몇판 치킨 몇마리 이정도)만 걸어도 해주실 능력자분들이 많이 계실 것 같습니다.
17/10/26 17:33
수정 아이콘
https://pypi.python.org/pypi/slate
뭐 이런것도 있네요.
파일 내 필요한 텍스트 부분이 패턴이 일정하다면 정말 쉬운 문제로 갈 듯..
17/10/26 18:05
수정 아이콘
(수정됨) 링크를 보면 설레서 상용 프로그램이 있나 해서 클릭해보았는데 무슨 말인지 모를 영어입니다!!
네, 텍스트 부분은 항상 아주 일정하고, 긁어보니 긁어집니다!

필요없는 부분을 지우고 기본서식에 필요한 부분이 들어가야 하는 건데
일단 PGR 운영자 님께 치킨을 걸어도 되는지 여쭤보는 건의 글을 올렸습니다. 감사합니다..^^;;
우울한구름
17/10/26 19:12
수정 아이콘
어렵지 않을 거 같은데, 난이도는 원하시는 텍스트부분의 형식이 일정한지에 따라 조금 다르겠네요. 예시 pdf 몇개 확인 가능하면 난이도 파악이 수월할 거 같습니다.
17/10/26 19:19
수정 아이콘
위의 예제처럼 필요한 부분은 홍길동/춘향이 이런 사람이름 이랑 금액부분이예요.
텍스트 부분의 형식은...

보통은 이름이 세자겠지만 외자이신경우에는 한글 이름이 두자일수 있고,
금액부분은 숫자가 자릿수가 변할수 있겠네요. 그정도입니다!
우울한구름
17/10/26 21:01
수정 아이콘
음 전체 형식을 알아야되서요. 비슷한 패턴의 텍스트가 존재하는지 아닌지 같은 거요

딱 저 부분만 있나요??
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
110967 [질문] 클래식음악 추천 부탁 드립니다 [11] 어묵1665 17/10/27 1665
110966 [질문] 옆집과의 신경전, 어떻게 행동해야 할까요 [22] 리오넬 호날두3505 17/10/27 3505
110965 [질문] 컴퓨터 모니터가 안켜집니다. [15] Neo2556 17/10/27 2556
110964 [질문] 데스크탑을 새로 맞추려고 하는데 도움 부탁 드립니다 [3] Chronic Fatigue2126 17/10/27 2126
110963 [질문] 주택담보태출 관련 조언좀요 [11] Be[Esin]2612 17/10/27 2612
110962 [질문] 회사 사수 선물로 어떤게 좋을까요? [3] GTA58242 17/10/27 8242
110961 [질문] 부산에 10시넘어서 갈만한 횟집같은데 있을까요? [3] zzzzz1851 17/10/27 1851
110960 [질문] 수능 국어영역 지문이 읽히질 않을때 [11] 삭제됨1892 17/10/27 1892
110959 [질문] 경찰이 사건을 쌍방폭행으로 처리하면 경제/인사상 이득이 있나요? [6] 삭제됨4625 17/10/27 4625
110958 [질문] 50대 아버지 선물 어떤 게 좋을까요..? [3] 은휴2362 17/10/27 2362
110957 [질문] 카드에 기재된 이름이 아닌 다른 사람이 카드 쓰는건 불법인가요? [9] 스핔스핔2539 17/10/27 2539
110955 [질문] 폴아웃4 질문드립니다. [4] 조이스틱2172 17/10/27 2172
110954 [질문] 써멀그리스와 써멀패드 구매할 수 있는 매장, 서울 [2] Killy2490 17/10/27 2490
110953 [질문] Auto cad2015 프로그램 질문입니다! [2] 인생국수2276 17/10/27 2276
110952 [질문] 녹음한 제 노래가 이상하게 들립니다 제가 이상한가요? [22] 트레인플6319 17/10/27 6319
110951 [질문] 방탈출까페 어디가 깔끔하고 괜찮은가요...? [7] nexon3759 17/10/27 3759
110950 [질문] 고소당했을 때 노하우 좀 부탁드립니다. [40] 트레인플10323 17/10/26 10323
110949 [질문] 공무원시험과목 행정학 관련 질문 [4] cjhhh1232232 17/10/26 2232
110948 [질문] [배그]다들 이럴때 어떻게 하시나요? [13] 밤일하는사람2855 17/10/26 2855
110947 [질문] 집에 둔 태블릿 쉽게 찾는 방법 있나요? [7] will1931 17/10/26 1931
110946 [질문] [소녀전선]샷망 제대 조언 부탁드립니다. [5] 풍각쟁이3500 17/10/26 3500
110945 [질문] 스타1) 인구수 250으로 바뀌면 어떻게 될까요? [40] Ariana Grande6678 17/10/26 6678
110944 [질문] 간단하게 동영상에 모자이크 처리할 프로그램 없을까요? [1] 냥멍빌런3017 17/10/26 3017
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로