PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2016/04/10 10:28:52
Name 태종
Subject [질문] 구글캐시에 대해 이해하고 싶습니다.
선거게시판 자주보고 있는데 이번에 모 유저두분이서 설전을 벌이다가 구글캐시로  본인이 작성한 글의 수정전 글이  딱걸려서 많은 비판을
받았는데요. 이런게 있다는걸 첨 알았고 참 신기하네요.

그래서 기본 개념을 좀 이해하려고 하는데 웹블로그에서 알려주는 내용으로는 제가 개념을 이해하기가 좀 부족한 부분이 있어서 이렇게 질문드립니다.

1. 구글캐시의 가장 원초적인 개념은 무엇인가?
말그대로 구글캐시가 왜 있고 어떻게 쓰이기 위해 만들어졌나 하는점이 궁금합니다.

2. 스냅샷은 글을 최초로 올렸을때 자동적으로 구글서버에서 찍는것인가?

이게 좀 이해가 안됩니다. http://webcache.googleusercontent.com/search?q=cache:www.pgr21.com/pb/pb.php%3Fid%3Delection%26no%3D1128&num=1&strip=0&vwsrc=0
이글을 보면 최초 글등록시간에 찍는것도 아니고 약간의 텀이 생기면서 찍히는 것 같은데요. 밑에 초기댓글 2개가 보이는걸 보면요..
원래 이렇게 구동되게 만들어놓은건가요? 그러면 글등록시 자동으로 스냅샷이 찍히게 해야 하는 것아닌가 싶네요.

3. 그러면 최초글 등록시 스냅샷이 자동으로 찍힌다고 하면 수정때마다 또 스냅샷이 안찍히는 이유는 무엇인가?
그니까 최초글은 스냅샷이 찍히는 것까지는 알겠습니다. 왜 그런지 이해는 안되지만... 근데 또 궁금증이 수정후의 글은 구글캐쉬에 남아있지 않는 이유도 궁금합니다. 예를 들자면 하나의 글을 3번 수정했다고 치면 최초글은 당연히 구글캐쉬에 남아있는 것이고 최종수정글 또한 당연히
현재 구글링을 통해 검색할 수 있다면 그 과정에서 2~3번 수정된 글들은 캐쉬로 남아있나요? 수정될때마다 스냅샷이 찍혀서 구글서버에 다 남아있는건가요? 그렇다면 그 글들은 url에 어떠한 명령어를 치면 다 찾아낼 수 있을까요?

컴알못에 구알못이라 모르는게 너무 많고 신기하기도 합니다. 기본적인 개념부터 2. 3번의 궁금증 또한 좀 알고 싶네요 ㅠㅠ

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
16/04/10 10:42
수정 아이콘
1. 모든 검색엔진은 페이지를 통째로 저장하여 데이터를 모아두고 그 결과를 검색 결과로 보여줍니다. 단 이때 텍스트로 된 결과만 저장하고 미디어(사진 등)은 저장하지 않습니다. 이 개념을 크롤링이라고 할겁니다 아마.

2. 실시간으로 어떤 사이트를 체크할수도 있지만 실시간이라는 개념은 서버를 지속적으로 체크할 수 있기 때문에 별도의 동기화(새 글을 쓰면 검색엔진에 알려주는)같은 기능이 없다면 10분 15분 같은 일정 주기로 새 글이 올려진지 검색한 후 크롤링을 합니다.
그렇기 때문에 글이 저장될때는 댓글이 여러개도 한개도 없을수가 있습니다.

3. 저장된 내용에 대해서 갱신도 해야합니다. 링크가 삭제됐을수가 있고 변동된 내용이 있을수가 있으니까요.
그 주기는 하루 단위 같은 개념으로 이뤄집니다.

도움 되셨나 모르겠습니다
16/04/10 11:00
수정 아이콘
우선 답변감사합니다.
1번에 대해서 좀더 이해를 구하자면 스냅샷이라는 개념자체가 스크린샷으로 사진을 찍는 것 아닌가요? 제가 그동안 알고 있기로는 스냅샷은 데이터를 사진화 하는걸로 알고 있는데 구글캐쉬에 대한 설명을 하는 블로그에 따르면 스냅샷을 찍는다고 표현을 하던데 그건 제가 알고 있었던 스냅샷의 개념이 아니라 글을 그냥 자체적으로 구글서버에 저장한다는 개념으로 스냅샷이란 표현을 쓴건가요? 그리고 미디어는 저장하지 않는다는 것에 대한 개념도 좀 설명 부탁드려도 될까요? 미디어는 저장하지 않는 다는 건 결국 데이터의 불필요한 양을 줄이겠다라는 의도로 해석할 수 있는데 저희가 검색엔진에서 보는 것은 전부 미디어 포함해서 검색할 수 있잖아요 이미지검색도 있고..

2번에 대해서는 완벽히 이해가 되었습니다. 카톡의 친구관리도 일정한 주기로 최신화 하듯이 검색엔진도 일정한 주기로 모든 데이터에 대한 저장을 하는거군요. 완전히 이해됐어요.

3번에서 여전히 이해가 되지않는 부분이 있습니다. 저장된 내용에 대해서 갱신이 하루와 같은 주기로 이루어 진다고 하셨는데 그렇다면 왜 캐시로 최초글만 알 수 있는지 궁금합니다. 하루단위같은 주기로갱신이 되었다면 캐시로 알 수 있는 자료는 최초의 글이 아니라 마지막 글이 되어야 정상이지 않나요? 캐시로 수정전 최초글은 알 수 있는데 2차 3차 수정된 글들은 검색할 수 없고 최종글은 검색할 수 있는건 당연한거구요.
캐시에 대한 개념중 가장 이해가 되지 않는 부분이네요. 최초글은 캐시로 알아낼 수 있다. 근데 중간글은 캐시로 알아낼 수 없다 그렇다면 왜 하필 최초글은 캐시로 저장해서 알수 있도록 했을까 이부분이 참 궁금합니다.
랜덤여신
16/04/10 11:05
수정 아이콘
1. 사용자가 구글에 검색어를 입력할 때마다 구글이 네이버, 다음, 루리웹, PGR21, MLB파크 등 온갖 사이트에 접속하여 뒤지는 것은 지극히 비효율적이므로 각 사이트의 내용을 구글에 미리 복사해 놓게 됩니다. 이것을 캐시라고 합니다. 캐시의 정의를 위키백과에서 찾아보면 "데이터나 값을 미리 복사해 놓는 임시 장소를 가리킨다. 캐시의 접근 시간에 비해 원래 데이터를 접근하는 시간이 오래 걸리는 경우나 값을 다시 계산하는 시간을 절약하고 싶은 경우에 사용한다. 캐시에 데이터를 미리 복사해 놓으면 계산이나 접근 시간 없이 더 빠른 속도로 데이터에 접근할 수 있다"이므로 이 정의에 부합하죠.

여기에 덧붙여 구글 캐시는 사용자가 확인할 수 있게 공개하고 있으므로 대상 웹 사이트가 잠시 다운됐을 때 임시로 내용을 확인하는 용도로도 요긴하게 쓸 수 있습니다.

2. 검색 엔진이 작동하는 방식은 그냥 평범한 사람이 웹 서핑하는 거랑 똑같습니다. 어떤 사이트에 새 글이 올라왔나 확인하려면 틈틈이 그 사이트에 접속해야 하죠. 좀 관심도가 떨어지는 사이트의 경우에는 며칠 동안 새 글을 확인 못 할 (안 할) 수도 있죠. 마찬가지로 구글도 틈틈이 PGR21에 접속해서 새 글을 클릭해보는데 마침 그때 댓글이 두 개 달려 있었던 거죠.

3. 자원을 효율적으로 활용하기 위해 일단 읽어본 글에는 덜 자주 방문하게 됩니다. 너무 오래된 글은 아예 평생 다시는 방문 안 할 수도 있고요. 모든 글을 최신본으로 가지고 있으려면 PGR21에 있는 수만 개의 글을 (전 지구적으로 확대하면 수십억 개의 글을!) 매일 클릭해봐야 한다는 건데 이건 사람에게나 컴퓨터에게나 현실적으로 불가능하죠.

좀 더 부연하자면 유명한 사이트 & 최신 글일수록 자주 방문하게 되어 있습니다. 사람 안 오는 개인 사이트 같은 경우에는 며칠에 한 번씩밖에 안 오기도 합니다.
16/04/10 11:20
수정 아이콘
1번에 대해서 대략적으로 이해가 되었습니다. 그러니까 저희가 구글에서 검색을 할때 검색창에 뜨는 것들은 전부 캐시로 구글서버에 저장해놓은 것이고 그 검색정보를 클릭할때는 그 사이트로 연결되도록 해놓은 것이라 이해하면 되겠지요?

2번도 마찬가지로 이해되었습니다.

3번에 대해서는 이렇게 이해햐면 되는지 궁금합니다. 그러니까 캐시는 어디까지나 글의 흔적을 구글서버에 남겨놓아서 더 효율적으로 검색하고 또 검색능력을 올려주는 것일뿐 최초글이나 2차 3차 수정글들을 남겨놓기 위한 목적이 아니니까 2차 3차 수정글까지 저장해놓을 필요가 전혀 없다. 캐시로 수정전 최초글을 알아낼 수 있는건 목적에 부합하지 않는 그냥 얻어걸린 능력일뿐이다. 이렇게 이해하면 될까요? 그렇다면 과거의 자료중 최초 글은 캐시로 남아있지만 2차 3차 수정글은 알아낼 방법이 없다. 최종글은 어짜피 우리가 검색으로 알아낼 수있는 것이고..
이렇게 이해하면 될런지요?
랜덤여신
16/04/10 11:27
수정 아이콘
1. 정확합니다.

3. 얻어 걸린 게 맞습니다. 최신 내용으로 갱신되어 있을 수도 있으니까요. 캐시에 낡은 내용이 있다는 것은 다르게 말하면 검색 품질이 저하되었다는 이야기이기도 합니다. 원래 'A'만 있었던 글을 수정하여 'A B C'로 바꿨다고 했을 때, 구글 캐시에 초기 버전만 저장되어 있다면 'B'나 'C'로 검색했을 때는 그 글이 안 잡히겠죠. 그러나 구글 입장에서는 글이 그렇게까지 대격변하는 경우는 흔치 않고, 저런 세세한 변화까지 다 감지하려면 비용이 많이 드니까 (모든 글을 매일 클릭해 봐야 하니까) 어느 정도 낡은 데이터도 감수하는 것입니다. 물론 여건이 되면 그 사이에 캐시를 최신 내용으로 갱신하기도 하고요. 따라서 위에서 말했다시피 최초 버전을 확인할 수 있었던 것은 순전히 우연이며, 2차 버전이나 3차 버전만 확인될 수도 있습니다. 실제로 후자일 경우가 더 흔합니다.
16/04/10 11:30
수정 아이콘
캬~ 먼가 사이다마신 기분이네요 정말 감사드립니다. 개념에 대해 이해가 되었어요
16/04/10 11:57
수정 아이콘
캐시의 개념을 이해하셨으면 왜 캐시에 이미지 등을 저장하지 않는 지도 이해하실 수 있을 것 같아요.

용량으로 치면 동영상 >>>>>>>>> 이미지 >>>>>>>>> 텍스트이기 때문입니다. 이미지에 대해 썸네일을 사용하는 것도 같은 이유죠.
16/04/10 12:56
수정 아이콘
우와... 이 글 보고 선거게시판 검색해 보고 왔는데 정말 말이 안 나오네요... 쩐다....
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
81165 [질문] 양세형 나온 예능 추천해주세요 [2] Lv.992773 16/04/10 2773
81164 [질문] 공부하면 시력이 나빠질 수 있나요? [5] 여유를갖자3701 16/04/10 3701
81163 [질문] 팝송 가수 추천 부탁드립니다. 여자같은이름이군2485 16/04/10 2485
81162 [질문] [스타1] 종족전 빌드에 대해서 물어보고싶습니다. [1] JazzPianist2140 16/04/10 2140
81161 [질문] 연결 안끊어지고 안정적인 외장하드 좀 추천해주세요... [4] 정시레1782 16/04/10 1782
81160 [질문] USB 전송 속도가 너무 느립니다. 득이1309 16/04/10 1309
81159 [질문] [워크3] 그런트 샤먼 체제 질문요. [9] Waldstein1807 16/04/10 1807
81158 [질문] (9급) 공시 평균 합격나이? [7] 스팍15217 16/04/10 15217
81157 [질문] 국가직 공무원 이정도 점수면 이번년도안엔 힘들까요? [7] 레너블2507 16/04/10 2507
81156 [질문] 실용영어 학습용으로는 어떤 단어장이 좋을지요...? [4] nexon1585 16/04/10 1585
81155 [질문] 클로버필드 10번지 보신분!(스포) [3] 신용재5204 16/04/10 5204
81154 [질문] [LOL] 롤챔스 스프링 명경기 추천 좀 해주세요~ [12] 즐겁게삽시다1845 16/04/10 1845
81153 [질문] 구글캐시에 대해 이해하고 싶습니다. [8] 태종2730 16/04/10 2730
81152 [질문] 이 노래 뭔지 찾아주실분!(힌트 유) [2] 낭만.로망.갈망1399 16/04/10 1399
81151 [질문] 국가직 시험 omr 카드에 약간 번졌는데 괜찮을까요? [8] Mosby10170 16/04/10 10170
81150 [질문] 투싼 구입에 관한 질문 드려요. [1] Sith Lorder2063 16/04/10 2063
81149 [질문] 아이템매니아 사기관련질문드립니다. [10] 갓경언3008 16/04/10 3008
81148 [질문] 플라시보(건강보조식품) 질문드립니다. 은각1368 16/04/10 1368
81147 [질문] 영어학원 알바 관련 [4] 안철수당선2068 16/04/10 2068
81146 [질문] 윈도우7 정품 구매.. 이 제품으로 해도 될까요? [4] 마르키아르4195 16/04/10 4195
81145 [질문] 하드가 인식됐다가 안됐다가 오락가락 하는데 이유가 뭘까요? [10] 고양이발6227 16/04/10 6227
81144 [질문] 이마트 시설관리직 잘 아시는 분 계신가요? [14] 계륜미14532 16/04/09 14532
81143 [질문] 여름 지산 락페스티벌 궁금중? [4] 세작3009 16/04/09 3009
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로