:: 게시판
:: 이전 게시판
|
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
22/10/20 15:38
UPS용 전원을 굳이 비싸고 관리 까다로운 리튬전지를 쓸 필요 있나 그냥 납축전지 써도 상관 없는거 아닌가 싶었는데 역시 다른 업체들은 그렇게 하고 있었군요. SK는 건물 공간이 비좁아서 그랬나...
22/10/20 16:21
구체적으로 어떤 스펙의 전지인지는 모르겠습니다만, 전기차도 그렇고 이런 대용량 전지에 파우치는 안된다고 봐요.
엘지도 그래서 원통으로 전향하는거고 결국 원통이나 각형으로 갈수밖에
22/10/20 15:40
기사 본문만 보면 [경고를 무시]했다고 보기는 좀 어려운 것 같습니다.
- 4시간 전 1차 경고 때도 담당자가 조치를 하고 돌아갔고, 1시간 전 2차 경고 때도 담당자가 조치를 하고 돌아갔다고 하는데요, - 각각의 단계에서 매뉴얼에 따른 조치를 정확히 하지 않았던 거라면 '인재'라거나 '경고를 무시'했다는 평가도 적절한 것 같고요, - 각각의 단계에서 매뉴얼에 따른 조치를 정확히 하고 돌아갔는데도 화재가 발생한 거라면, 시스템과 매뉴얼 자체의 책임이 큰 것 같습니다.
22/10/20 15:53
비슷한 현장에서 근무해본 경험으로는 (매뉴얼에 따른) 점검 조치를 하지 않고 경고만 확인 후 재가동 했을 듯 한데, 100% 뇌피셜이라 세부적인건 더 봐야알것 같습니다.
매뉴얼에 따른 점검을 했는데도 불난 거면 매뉴얼이 잘못이겠죠. 다만 점검을 제대로 안했다는 가정 하에 매뉴얼 탓만 하기는 뭐한게, 하루에 발생할 경고 건수 대비 매뉴얼 점검에 소요되는 시간과 투입인력도 따져볼 문제긴 합니다. 쓸데없이 매뉴얼만 길고 현장에 적용은 전혀 불가능한 원론적인 내용만 잔뜩 있으면 무슨 소용이겠어요.
22/10/20 15:58
그렇게 볼수 있겠네요..
경고에 대한 대응책이 정상작동하지 않았다..가 더 적절한 말일거 같습니다. (전자든, 후자든 결국 경고가 4시간전에 나왔지만 못막은거니..)
22/10/20 16:20
저 경고가 얼마나 민감하게 자주 발생하는지를 알면 판단에 좀더 도움이 될것 같습니다
false positive alarm이 많으면, 관리자는 기계적으로 현장조치만 하게 되죠
22/10/20 17:07
근데 false positive case가 많으면 그건 그것데로 문제가. 가끔 나와야 false positive지, 자주 나오면 그건 defect 가 아닌가 싶네요.
22/10/20 16:03
지금까지 '화재가 난 부분은 카카오 잘못이 아니지만 그 외의 부분들(화재 이전의 이원화 시스템 구축 미비, 화재 이후의 대처 등)은 카카오 잘못이다'가 중론이었던 것 같고요,
이 부분에 대한 판단은 본문 기사를 보고 나서도 딱히 달라지는 부분이 없는 것 같습니다. 본문은 화재가 난 부분에 대해 SK의 책임이 얼마나 있는가 하는 부분에 대한 이야기니까요.
22/10/20 16:20
서로 다른 방향으로 잘못이 있었죠. 화재야 불가항력인지 과실이 있었는지, 있었다면 그 정도를 봐야겠지만
핵 떨어진 것도 아니고. <고작 데이터 센터 하나> 나갔다고 <카뱅 제외 자사에 관련된 모든 서비스>가 <100% 가까이 수 시간 중단>된 건 오로지 카카오의 과실이죠. 다른 것은 제쳐두더라도 제3자 서비스가 엮인 인증 서비스를 (카카오 로그인) 하나도 못살린 건 좀... 신뢰도가 하락하는 것도, 카카오 정도의 규모임에도 서비스 이원화/다중화 안한 회사 개별의 선택의 대가를 달게 받고 있는 거고요.
22/10/20 16:36
SK와는 별개로, 카카오는 장애대응을 준비 안한겁니다.
화재가 아니고 지진이나 홍수로 IDC가 망가졌다면 어차피 서비스 중단되었을거니까요.
22/10/20 16:40
기본적으로는 손배청구는 당연히 발생 가능할건데, SK도 손해보험 가입한게 있어서...
배상요청한 피해인원 -> 카카오 -> SK C&C -> 보험사... 순으로 청구가 진행될 예정으로 알고 있습니다. 이제 문제원인이 결함등으로 명확히 갈린다면 배터리 납품처 혹은, 시공관련 회사에서 뭔가를 할텐데 이건 SK C&C가 처리할 문제구요. 문제는 카카오가 SK측에 배상요청 가능한 범위는 전력복구가 되기 전까지에 대한 부분인데, 서비스 다운으로 인한 복구작업 지연에 따른 부분은 카카오가 감내해야 할 사항에 가깝죠. 선행에서 문제가 생겨 뒤쪽 문제가 생긴것이지만, 결국 그 문제의 복구지연은 카카오의 기술력(복구대응능력) 문제이기 때문에...
22/10/20 16:47
벨기에의 브뤼셀에 있는 국제 은행간 결제 시스템(SWIFT)는 1970년대부터 소련의 핵공격에 대비하여 각기 다른 세 도시에서 삼원 분산 서버를 운영하였습니다. 별명이 짐승(Beast)인지라, 이것이 바로 요한 계시록의 "짐승"이라는 주장이 있었다는 여담도 있습니다.
카카오가 그동안 제맘대로 편한 장사 해 온 거라고 봅니다. 불이란 아무 때든지 날 수 있습니다.
22/10/20 17:02
참고로 KT가 '리튬이온배터리를' 안쓰고 다른 배터리를 쓰게 된 이유는
'몇년전 KT가 불나서 통신마비가 왔던.. 그 사건 때문에 리튬이온 배터리를 전량 교체했다고 함.. 이것도 유머네요............
22/10/20 17:17
아무리 그렇다한들, 근본적인 원인은 카카오 탓이죠.
결국 이원화, 서비스 분할 중 제대로 된게 없었으니까 여전히 100% 복구는 안되고 있죠.
22/10/20 17:24
sk가 잘한건 없지만 이 사태의 근본은 카카오가 맞습니다.
데이터센터는 재해(disaster)를 당할 수 있기 때문에 카카오 서비스의 경우 이원화가 무조건 되야 합니다.
22/10/20 17:44
카카오톡이 이토록 오래 다운된 건에 대한 잘잘못을 따지자면 당연하게도 카카오의 잘못이 더 큽니다.
서비스 레벨에서 단일 데이터 센터에 의존하게 만든 것이 문제입니다. SK 센터에서 제공하는 서버들을 렌탈을 해서 쓰는 경우일텐데 렌탈업체 쪽에서 이원화 기능을 제공해주거나 혹은 카카오 스스로 이원화가 가능하게 설계를 했어야죠.
22/10/20 17:50
SK는 설비에 대한 책임만 있죠. 사고라는게 100%막을수 있는게 아니어서 사고가 났을때의 대처에 문제는 없었는가로 초점을 맞춰야 합니다. 국민들이 카카오 서비스를 원활히 쓰지 못한건 카카오의 문제고요. 소비자와 SK는 별개로 봐야합니다
22/10/20 18:48
카카오가 서버의 이중화 실패로 이사태 맞았다면, SK 또한 전기실, UPS, 배터리실의 이중삼중화에 실패했지요.
결국 여러 프로세스에서 막을 수 있는 사태를 둘다 시설 투자의 기피(결국 돈 때문에)가 원인이죠.
22/10/20 19:08
사실 카카오가 b2c라 여러군데에서 노출되고 있지만 sk에 들어갔던 게임업체들과 그 외 sk 계열사 시스템들도 이슈가 크기는 했습니다.
이번 일을 계기로 이중화나 카오스엔지니어링 관련된 영역들이 크게 포커싱이 될 수 있을거 같네요
22/10/20 19:14
저는 기술적인 거는 정말 하나도 모릅니다만
네이버는 즉각 복구하는 걸 카카오는 왜 아직도 완전 복구를 못하고 있는지 두 회사가 많이 다르구나 하는 거 하나는 알겠네요
22/10/21 13:01
https://naver.me/GD5Txnsr
SK C&C "화재 발생 4분 만에 카카오에 알렸다" 통화내역 공개 이래도 아이폰입니까? 크크
|