:: 게시판
:: 이전 게시판
|
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
16/11/11 14:21
제 기억이 맞다면
뉴스룸 영상속의 종이를 보면 파쇄가 흔히들 생각하는 파쇄기 파쇄가 아니라 가위같은걸로 조각조각 낸 파쇄인 것 같았는데.... 아마 그래서 복원이 쉽지 않았을까 싶습니다
16/11/11 14:32
프로그램을 직접 본 적은 없는데, 있다는 이야기까지는 귀동냥으로 들어봤던 것 같긴 합니다...
뭐, 어찌되었든 기대해보는중입니다. 과연 무슨 폭탄이 또 터질 것인지.
16/11/11 14:33
파쇄기가 병원에 있었나 모르겠어요. 정말 파쇄기로 했으면 아마 안될것 같기도 하거든요.
그냥 가위로 자른 수준이라면 모를까 음..
16/11/11 14:33
예전에 일본 방송에서 일본 최고 파쇄기 제조 회사 vs 외국 문서 복원팀이 대결한 방송을 본 기억이 나네요..
그때 복원팀에서 썻던 방식이 종이조각을 모조리 스캔 한 후 컴퓨터로 일일히 맞추는 방식으로 순뎅순뎅님께서 제안하신 방식과 흡사했습니다... 결국 제한시간을 넘겨 파쇄기 회사가 이기긴 했습니다만, 시간이 조금만 더 주어졌더라면 복원이 가능했었던 것으로 기억하네요..
16/11/11 14:35
알고리즘 많이 있는걸로 알고 있습니다.
조각난 도자기 유물 같은거 발굴 되면 영상 처리 이용해서 복구 한다고 하네요. 스켄 뜨는게 일이지 복원하는건 금방 될꺼 같습니다.
16/11/11 14:40
스켄한 다음에 파쇄된 양 끝쪽 이미지의 픽셀 값들이 일치하거나 가장 비슷한 이미지들을 연결해주면 되지 않을까 싶네요.
A 의 오른쪽 끝쪽이 01110001 이고 B 의 왼쪽 끝이 01110001 이면 AB 이런 식으로요. 오차 감안하고, 비슷한것들을 여러개 골라주면 되지 않을까요?
16/11/11 14:49
사해문서같은 경우 DNA 분석까지 했죠.
"대부분의 쿰란사본은 항아리 속에서 아마포에 곱게 싸인 채 발견된 것이 아니라, 아무런 보호장치 없이 동굴바닥에 흩어져서 많은 세월을 견뎌왔기 때문에 이 수집단계를 통해 원래는 한 두루마리에 속한 조각들을 퍼즐 맞추듯이 맞추어가야 했습니다. 학자들은 육안으로 비슷한 서체, 비슷한 동물가죽의 두께 등을 기초로 하여 조각들을 모아보았지만, 이것만 갖고서는 완전한 작업을 할 수가 없었습니다. 그래서 학자들은 사본의 재질인 이 동물 가죽의 유전자 지문(DNA fingerprint)을 조사함으로써, 어떤 조각들이 하나의 동물로부터 만들어진 피지인지를 알아낼 수 있게 되었습니다." 물론 이 예시와는 약간 성격은 다릅니다만, 시간이 주어진다면 충분히 복원할 수 있는 자료라고 생각합니다.
16/11/11 14:52
http://homepages.inf.ed.ac.uk/imurray2/projects/2013_razvan_ranca_ug4.pdf
파쇄 문서 복구 프로그램에 대한 70페이지짜리 논문입니다. 오래 전부터 컴퓨터 전공하는 사람들이 이쪽 계속 연구하고 있는거 같네요. 첫페이지에 4년차 리포트라고 하는거 보니 저기서는 장기 프로젝트로 굴러가는 듯.
16/11/11 14:54
샷 건 방식으로 맞추면 전체를 모두 맞출 필요 없이 전체의 5% 정도만 맞춰도 나머지가 쉽게 맞춰지면서 어느정도 해석까지 가능하지 않을까요
16/11/11 15:18
아래 댓글보면 대충 처리한거같아서 불가능은 아닐수도??
패턴인식은 아직 인공지능이 못따라갈만큼 인간의 뇌도 아주 훌륭한지라 아날로그도 무시할건 아닙니다.
16/11/11 15:31
그야 그렇죠. 다만 아날로그는 인간이 피곤해지는데 프로그램으로 하면 기계가 피곤할 뿐이니 가능하면 프로그램이 되는거였으면 하는 바램이였습니다.(?!)
16/11/11 14:59
http://www.bobaedream.co.kr/view?code=strange&No=1630714&bm=1
이미 최모녀 이름도 찾았다는데...
16/11/11 15:28
이건 파쇄기로 돌린게 아닙니다.
향정신성의약품 대장을 파쇄기 돌렸고 고객 명단을 그냥 찢어서 버렸는데 거기 정유연-최가 적혀있었다는거죠.
16/11/11 15:03
병원에서 쓰는 문서양식이 정해져 있고 반복되는 단어,줄,칸,테두리까지 있으니까 일반 문서보다는 조합하기 좀더 쉽겠네요.
그런데 문제는... 조합은 쉬운 반면 문서의 고유정보인지는 헷갈릴 수 있겠네요. 비슷한게 많으니...
16/11/11 16:16
저 군대있을때 선임이 비문을 파쇄기에 갈아버린적 있었는데 3일 밤새서 소대원들이 다 맞췄습니다. 하려면 할 수는 있어요. 말 그대로 곤죽형태로만 갈리지 않았으면...
16/11/11 16:18
파쇄된 조각의 절단면의 잉크 묻은 부분을 도트로 간주하고 해당 도트의 간격을 패턴화해서 스캔 떠서 DB화한 다른 조각의 절단면 패턴과 대조하는 식으로 구현하면 될 것 같은데... 도트 패턴이랑 절단면의 형상을 동시에 패턴화해서 조합하면 의외로 빠르게 조합할 수도?
16/11/11 16:39
스캐너의 성능만 좋다면, 생각 이상으로 정확할 가능성이 높습니다. 복잡한 인공지능 어쩌고 들어갈 것도 없어요.
이미 이미지 프로세싱을 통한 패턴인식 같은거야 상용화된지 오래고(스마트폰 앱으로도 충분합니다.) 조각 짜맞추는건, 따지고보면 QR코드 인식하는것 보다도 쉬운 일이라고 봅니다. 1. 절단면이 서로 일치하는 곳을 찾고, 2. 짜맞췄을때 양쪽의 컬러값이 매칭이 되는 경우를 찾아서 조합 이 두 가지의 프로세스 만으로도 충분할 거라고 봅니다. 거기다가, 이미 상용화(?)된 프로그램까지 있다면 금상첨화겠지요.
16/11/11 18:29
QR 코드 인식보다는 훨씬 어려울것 같습니다...
이미지 프로세싱도 이미지가 있어야 하는건데 세절된 종이조각들은 이미지 정보가 적어도 너무 적으니까요. 1. 세절기의 특성상 절단면이 거기서 거기고 2. 짜맞췄을대 양쪽의 컬러값이 매칭되는 경우가 종이조각이 작다보니 많이 나와서 복구하기가 쉽지 않을것 같습니다. 게다가 종이를 한장만 복구하는것도 아니고 이게 1번 페이지에서 온건지 136번째 페이지에서 온건지도 확실치 않고 총천연색 이미지도 아니고 특징도 별로 없는 흑백 텍스트 문서이니 점점 난이도는 산으로 가겠죠.
16/11/11 19:40
기본 정보가 없는 이미지라면 시간이 엄청 걸리겠지만
기본적으로 이건 원래 문자라는 기본 정보가 있는 이미지입니다. 한글 영어에 의학용어 기본폰트에 대한 정보만 준 상태에서 시작해도(병원에서 특별한 경우 아니면 상용프로그램을 썼을테니) 난이도가 확 낮아지죠
16/11/11 20:11
문자여서 더 어렵게 느껴지는데요.
종이에 씌여져 있는 문자를 인식하는 문제가 아니라 세절되어 잘게잘게 나누어진 조각에 있는 픽셀들로 원래 문서를 재구성하는 문제입니다. 이미지 프로세싱이 기본적으로는 feature point 들 즉 특징점을 중심으로 처리하는것에 다름아닌데 문자는 기본적으로 흑백이고 세절된 조각은 크기도 작아서 특징점이라고 부를만한 것도 마땅치않고 또 그게 정말 특징적이냐 하기에도 비슷비슷한 조각이 너무 많을거고 이게 어느 글자 어느 문장을 이루는 조각인지 어느 페이지에서 온건지 알기가 매우 어렵다고 생각됩니다. 저도 이쪽이 전문분야는 아니고 관련해서 연구하는 동료들이 가까이 있어서 세미나시간에 귀동냥 정도로 아는 수준이지만 제 생각에는 이미지 프로세싱 분야 난이도중에서 거의 최상위권에 속하지 않을까 하는데요. 근데 세절된 조각 크기가 얼마냐에 따라 많이 다를것같긴 하네요. 만약 세절된 조각 하나에 글자가 한두개정도 보인다 이러면 문제가 좀더 쉬워질것같고 어예 알아보지고 못하게 잘게 파쇄해버렸다 하면... 매우 어려워질것 같습니다.
16/11/11 19:57
QR보다 어렵습니다.
QR코드 해독하는 거야 표준문서 던져주면 학부생 수준 엔지니어 혼자 일주일이면 만듭니다. 랜덤하게 찢기는게 아니라 균일하게 찢어지기 때문에 절단면이나 컬러값으로 각 조각들을 구분하기가 매우 어렵다는 한계가 있습니다.
16/11/12 05:00
http://gall.dcinside.com/board/view/?id=hit&no=13717
음... 이미 비슷하게 하고있는듯 합니다.
|