PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2020/04/19 02:14:34
Name Charli
Link #1 https://www.nature.com/articles/d41586-020-01095-0
Subject [일반] 스탠포드 코로나 항체검사 결과
4월초 캘리포니아 북구 산타클라라 카운티에서 3300명은 상대로 항체조사한 결과

66명당 1명꼴로 코로나바이러스에 감염된적이 있다고 합니다.

이는 2백만명이 거주하고 있는 산타클라라 카운티에서 4만8천명-8만2천명이 감염됬다는 결론입니다.

4월초까지 보고된 1천여명의 숫자보다 50배정도의 숫자입니다.

산타클라라 카운티에서 4월초까지 50여명이 죽은걸 감안하면 연구팀은 치사율이 0.1-0.2%인걸로 결론입니다.

다이아몬드 프린세스나, 영국, 중국의 데이터를 가지고 낸 결론과는 현저히 더 낮은 치사율입니다.

-----------------------------------------------------------------------------------------
여기까지가 기사의 대략적인 요약입니다.

참고로 산타클라라 카운티는 실리콘밸리라고 불리는 지역이고 고소득/학력층인 백인+아시안인이 많은 곳이라 일반화하기는 힘듭니다만

인프라가 갖춰진 한국같은 경우와 비교하기도 괜찮은 결과라고 보여집니다.

양로원등을 뺀 데이터기때문에 치사율이 더 낮게 나왔고 일반인이 체감할수 있는 치사율에 더 가깝지 않을까 생각합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
싶어요싶어요
20/04/19 02:59
수정 아이콘
(수정됨) 항체검사에 대해 다른 나라들의 결과들도 나오고 있는데요. 여긴 특히나 더 이해가 안되네요.
기존의 상식+대다수의 확진자가 감염경로가 파악되는걸로봐서 (추후 유증상으로 전환하지 않는) 무증상자에 의한 감염은 극히 드물것으로 보이는데, 이정도의 확산속도가 가능한건가요?

그리고 대남병원에서 110명중 100명이 감염되고 9명이 사망한걸로 알고 있습니다.
20/04/19 03:27
수정 아이콘
(수정됨) 66명중 1명꼴이면 200만명중에 3만명인데, 어떻게 4-8만명이 나오는지 찾아보니 아래와 같이 나오네요.
(The unadjusted prevalence of antibodies to SARS-CoV-2 in Santa Clara County was 1.5% (exact binomial 95CI 1.11-1.97%), and the population-weighted prevalence was 2.81% (95CI 2.24-3.37%).)

미국은 중국이나 한국에 비해 비교적 최근에 급격하게 감염자 수가 늘었기 때문에 치사율을 단순비교하기에는 무리가 있지 않나 싶습니다.
본논문에서도 당연하지만 (치사율이 아닌) 치명률이 0.12-0.2%이라고 얘기하고 있구요.

일단 아카이브에 실린 논문이니 조금 걸러서 볼 필요는 있을 것 같습니다.
20/04/19 04:13
수정 아이콘
일단 피어 리뷰 안된 논문은 그냥 블로그 포스트보다 신뢰도가 높다고 볼 수 없고요.
방법론 읽다가 실소가 나왔는데
항체검사를 한 대상이 페이스북 광고로 자원자들 모집했습니다.
문제가 보이시나요?
당연히 본인이 코로나바이러스에 걸렸을 확률이 있겠다고 생각하는 사람들의 지원률이 높죠.
3300명 검사했다는데 이런 기본적인 실수를 해버리면 돈 시간 다 날려버리는 거죠.
20/04/19 05:23
수정 아이콘
애초에 지원자 상대로한 샘플은 랜덤샘플보단 못하지만 여러여건상 실소 나올거까진 없죠.
20/04/19 05:35
수정 아이콘
지원자를 상대로 한 실험 자체는 실소가 나올게 전혀 없는데
그래놓고 이 엄청난 셀렉션 바이어스를 전혀 컨트롤하지 않은 상태에서 치명률 추정하고 알카이브에 올린건 실소가 나올 수밖에 없습니다.
https://www.medrxiv.org/content/10.1101/2020.04.14.20062463v1
20/04/19 06:19
수정 아이콘
광고에 정확히 어떻게 명시가 되어있는지는 안나와있는 것 같던데, 코로나 바이러스를 언급하고 지원자를 모집했다는 얘기가 있나요?
20/04/19 06:27
수정 아이콘
저자들 왈
"bias favoring those with prior COVID-like illnesses seeking antibody confirmation are also possible. The overall effect of such biases is hard to ascertain."
이니까 그렇겠죠.
떠주니
20/04/19 08:46
수정 아이콘
피어리뷰받은 논문도 이상한 논리를 잘못된 통계로 무장한 것들 꽤 많습니다. 통계로 쉴드치는 논문들은 피어리뷰가니고 통계전문가리뷰도 따로 받아야 하는거 아닌가 싶어요.
제라그
20/04/19 07:34
수정 아이콘
이미 유럽이나 미국 내에서도 사망자가 쏟아지는 판국이라... 0.1% 사망률은 별로 신빙성이 없어 보입니다. 그게 정말 맞다면 이탈리아 같은 나라는 국민 여섯명 중 한명이 다 걸렸다는 이야기인데... 양로원이나 노인을 제외하고 계산해도 이미 나온 통계하고 지나치게 맞지 않는...
20/04/19 07:43
수정 아이콘
이탈리아보다 평균연령도 더 젊고 병원 과부하도 안된 수치라 이탈리아와는 직접 비교할수 없죠.
이탈리아는 보통 환경에서 살수 있는 사람들도 죽었다고 봐야죠.
제라그
20/04/19 18:44
수정 아이콘
그걸 감안해도 0.1%는 무리수입니다.
초보저그
20/04/19 08:04
수정 아이콘
믿기 힘든 아니면 최소한 bias가 있는 수치이기는 한데, 트럼프가 이 수치를 인용해서 5월에 다시 경제활동 시작하자라고 주장할까봐 걱정되기는 하네요.
서쪽으로가자
20/04/19 12:24
수정 아이콘
preprint 사이트엔 (신기하게 댓글칸이 있군요)
사람들이 꽤 비판적이긴 하네요
https://www.medrxiv.org/content/10.1101/2020.04.14.20062463v1
위너스리그
20/04/19 18:51
수정 아이콘
링크 감사드립니다! 말씀대로 신기하게 댓글이 있는 아카이브 사이트는 처음 보네요... 흐흐
댓글에서도 위엣분들이 말씀해주셨던 '샘플링이 biased되었고 랜덤하지가 않다'라는 점을 지적하는 것 같습니다...
초록물고기
20/04/19 14:26
수정 아이콘
게이츠형님이 얼마전이 항체검사는 위양성이 많아서 기대하지 말라고 하던데 얼마나 믿을수 있을까요
20/04/19 23:32
수정 아이콘
IFR 0.12-0.2%는 다이아몬드 프린세스 대비 현저히 낮지는 않습니다. 다이아몬드 프린세스 CFR에다 연령보정을 하면, 미국이나 중국처럼 중위연령 30대 후반 국가를 기준으로 IFR 예상치는 대략 0.3% 언저리가 됩니다(일본이나 이탈리아처럼 늙은 국가에선 이보다 2배쯤 높을 수 있습니다). 0.12%는 다이아몬드 프린세스 기반 IFR의 95% CI 바깥으로 나가는데, 0.2%는 안쪽으로 들어옵니다.

중국 데이터의 경우, 우한 데이터를 우한을 제외한 중국 내륙 데이터와 1월말 우한 전세기 피난민 데이터(혹은 12월-1월의 우한의 수출실적 데이터)를 이용해 보정하면 대략 0.6-0.7%가 나옵니다. 비슷한 방법론을 채용해서 IFR 0.657%이나 sCFR 1.4%(=IFR 기준으로는 0.7% 수준) 같은 결과를 낸 논문이 The Lancet과 nature medicine에 꽤 오래 전부터 게재되어 있었는데, 둘 다 방법론상의 결함 내지 지나치게 후한 가정으로 인하여 과대평가가 완전히 해소되지 않고 어느 정도 잔존하고 있을 확률이 상당히 높은 상태입니다.

전자는 우한 전세기 피난민 데이터를 이용해서 우한의 감염자수를 추정한건데, 전세기 데이터 자체에 이미 과소평가가 존재(외국인 특성을 논외로 하더라도 순수하게 PCR 특성으로 인해 발생하는 과소평가입니다)함에도 그걸 보정없이 쓴 관계로 우한 감염자수가 과소평가 되었고, 그 결과 IFR 과대평가가 발생했습니다. 해당 논문에서는 심각한 과소평가를 막기 위해서 도착 즉시 PCR 전수조사를 한 전세기의 데이터만 사용하기는 했으나, 이렇게 해도 여전히 다음과 같은 사람들은 빠지게 됩니다.

오래 전에 감염된 사람 - 일반적으로 감염이 확산되는 시기에 테스트를 하면, 전체 누적 감염자의 대략 20-25% 정도가 PCR로는 탐지불능인 '오래 전 감염자'에 해당됩니다.
탑승 직전에 감염된 사람 - 도착 즉시 전수조사를 하면 탑승 직전에 감염된 사람이 초기 검사에서는 대체로 빠져나가게 되는데, 여기서 나온 결과에 따라 별도 격리를 시행하지 않고 풀어주면 이런 형태의 감염자 중 중증으로 진행하지 않는 대부분이 미탐지로 끝나게 됩니다.
탑승 직전에 감염된 후 별다른 증상이 나타나지 않는 사람 - 2주 격리를 시행하더라도, 퇴수 전 전수조사를 하지 않거나, 증상발생자에게만 하면 이런 형태의 감염자들이 미탐지로 끝납니다.
탑승 직전에 감염된 후 2주 이내에 완치되는 사람 - 2주 격리 후, 퇴소 전 전수조사를 하더라도 이런 형태의 감염자는 탐지에 실패할 확률이 상당히 높습니다.

nature쪽도 마찬가지라 1월 19일 이전의 수출실적과 전세기 데이터를 이용해 우한의 감염자수를 추정하면서, 수입국에서 수출 감염자를 탐지할 베이스라인 확률을 15%로 가정했습니다(유증상 비율 50% 및 유증상 탐지율 30%). 1월 19일 이전에 수입국가에서 유증상 탐지율 30% 혹은 전체 탐지율 15%라는건 -나름의 근거를 가지고 만든 값이지만- 지나치게 후한 가정입니다. 다이아몬드 프린세스 데이터를 보면 입국자 전원 대상으로 흉부 X선 검사를 실시해도 탐지율 15% 근처 혹은 그 이상이 나올 확률보다는 그보다 한참 낮은 수치가 나올 확률이 훨씬 더 높고, 15% 혹은 그 이상 탐지율이 나오려면 적어도 유증상 입국자 전원에 대한 PCR 검사가 필요한데, 그 어떤 국가도 1월 19일 이전에 모든 입국자 대상으로 흉부 X선 검사를 실시하거나 유증상자 전원을 대상으로 PCR 검사를 실시한 적이 없기 때문입니다.

또한 중국 데이터를 5차 사례정의 당시 숫자를 이용해서 보정하는 경우(즉 전구간에서 5차처럼 탐지했을 때 케이스 숫자를 추정하는 방식) 대략 0.8% 근처가 나오는데, 5차 사례정의에서도 흉부 X선/CT상 폐렴을 필요로 하는 것은 매한가지라서 100% 탐지는 커녕 과반 탐지도 사실상 불가능에 가깝기 때문에, 역시 상당한 수준의 과대평가가 남아있고 실제로는 이보다 낮아야 정상입니다. 물론 '사망자수' 자체도 과소반영이 어느 정도 존재할 수밖에 없고, 국가에 따라서는 이게 상당히 클 수도 있습니다(중국은 초반에는 어느 정도 놓쳤을 수 있어도, 대략 2월부터 우한에서 거주민 전원을 대상으로 매일같이 방문증상조사를 했었기 때문에 오히려 사망자수 과소반영이 적은 편에 속하고, 큰 나라들이 따로 있습니다). 하지만 중국 데이터를 위와 같은 방법으로 보정해서 만들어낸 추정치(0.6-0.8%)의 경우 대체로 다이아몬드 프린세스 95% CI를 바깥에 존재하고(윗쪽으로), 이는 중국의 사망자수 과소반영보다 위와 같은 형태의 과대평가가 더 심할 가능성이 높다는 점을 시사합니다.

한편 이 논문도 문제가 있는데, 일단 0.12% 쪽은 (뉴욕주 사망자의 1/2-2/3 가량을 차지하는) NYC 데이터와 안 맞기 시작하는 영역입니다. NYC 사망자수가 4월 17일 6PM(EST) 기준 확진사망 8,448명에 의심사망 4,264명이니, IFR 0.12%가 나오려면 NYC 인구(8백만)보다 더 많은 감염자가 필요합니다. 다만 NYC 사망자로 집계된 사람이 반드시 NYC 거주자일 필요는 없고(광역권 거주자나 그 외 지역 거주자도 포함되었기 때문), 광역권 거주자만 하더라도 2천만명은 되니까 아예 불가능한 것은 아닙니다. 하지만 어느 정도 개입 조치가 있었음에도 불구하고 초년도에 감염률 50%를 찍어버렸다는 것을 의미하기 때문에 현실성이 낮습니다. 물론 벤틸레이터/ECMO 수량부족 상황에선 사망자수가 2-3배로 늘어날 수 있기 때문에, 대부분의 ARDS 환자가 벤틸레이터/ECMO 수량부족으로 사망하는 상태라면 광역 거주자 감염률 20%(=충분히 가능한 수준) 같은 상황에서도 이런 데이터가 나올 수 있기는 합니다만, 실제로 그런 상황은 아니기 때문에 설명력이 떨어집니다. 0.2%는 이보다는 좀 낫고, 0.3-0.4%쯤 되면 별 무리 없이 잘 맞습니다.

방법론과 관련한 가장 큰 문제점은 테스트 실시 위치입니다. 감염률이 너무 낮은 지역에서 테스트를 했고, 이건 항체검사의 특이도(=1-위양성확률) 및 베이스라인 관련 문제를 불러옵니다. 많은 바이러스에는 약간의 선천면역자가 존재하고, 또한 다른 바이러스 감염시 형성된 항체가 이 바이러스에도 약간 반응하는 경우 등이 존재합니다. 그래서 약간의 위양성 확률을 깔고갈 수밖에 없습니다. 이 논문에서는 COVID 이전에 채취한 샘플 30개와 제조사 실험결과를 토대로 테스트의 특이도를 99.5% (95% CI 98.3-99.9%)로 봤는데, pre-COVID 샘플을 더 대규모로 테스트해서 특이도와 베이스라인을 명확하게 만들 필요가 있습니다. 물론 지금과 같은 특이도에 베이스라인을 0%로 간주하더라도 감염률이 20-30%에 도달한 지역에선 그다지 큰 문제는 아닙니다. 실제로는 20%인 감염률을 24%로 착각하는 식의 에러라 수용할만합니다. 허나 감염률이 1.5%에 불과한 지역에서는 당연히 문제가 됩니다. 감염률 0% 지역에서 1.7% 감염률이 나오는 것 조차 특이도 95% CI 안쪽에 들어가기 때문입니다.

이런 문제를 최소화하려면 최대한 감염률이 높아보이는 지역에서 테스트하는 것이 좋고, 그 중에서도 베스트는 우한(특히 2월말-3월초 정도 시기)입니다. 미국 도시의 경우 사람들이 전반적으로 교외에 퍼져서 사는 경향이 있는데, 호흡기계 감염증의 전염은 일반적으로 클러스터 형태로 나타나기 때문에 여기저기 퍼져서 사는 경우에는 지역별로 편차가 상당히 클 수 있습니다. Lombardy만 하더라도 province별 인구대비 사망자수나 확진자수 편차가 최대 10배 이상까지 벌어지고 있는데, 뉴욕 광역권은 Lombardy보다 더 크고, LA 광역권은 면적이 한국(남한)과 비슷한 사이즈입니다. 이 편차 문제를 해소하기 위해선 각 지역별로 충분한 인구를 테스트해야 하는데, 광역권을 구성하는 100개의 도시마다 천명씩 테스트하는건 당연히 어렵습니다(작은 도시는 인구가 1-4천명에 불과하기 때문). 그래서 우한처럼 비교적 좁은 영역에 천만쯤이 몰려살면서 감염률은 높아보이는 지역에서 테스트하는 것이 좋습니다.
20/04/20 01:24
수정 아이콘
좋은 댓글 감사합니다!
20/04/20 10:23
수정 아이콘
논문에 달린 댓글 중

The authors are reporting incorrect confidence intervals because they to not correctly treat the unknown false positive rate. Use the manufacturer data for false positives (2 out of 371 known negatives) to give the posterior probability for the false positive rate (fpr) which is proportional to Binomial(2, 371, fpr). With this, calculate the 95% CL interval using the exact approach (Neyman). The correct interval, for the unadjusted case is:
[0.00% - 1.53%]
The authors report an incorrect interval for this case: [1.11% - 1.97%].

여기서 비슷한 얘기를 하고 있고,
그 밖에 여러 개의 댓글에서 논문의 논지에 기본적인 통계적 엄밀성도 결여되어있음을 지적하고 있네요.

본문에서 0.1-0.2%이 [일반인이 체감할 수 있는 치사율에 가깝다]는 부분은 수정하심이 어떨까 싶습니다.
본문만 읽고 댓글은 읽어보지 않으신 분들은 저걸 사실로 받아들일까 걱정되네요.
20/04/21 22:16
수정 아이콘
적어놓으신 부분만 보면 딱히 저자가 잘못 계산한 부분은 없는 듯 하고, 오히려 해당 댓글이 오인하거나 잘못 계산한 것 같습니다. 무보정 감염률 1.5%에 붙어있는 95% CI 1.11-1.97%는 민감도와 특이도를 고려하기 이전의 값이고, 50/3,330으로 Clopper-Pearson 인터벌을 계산해 보면 실제로 1.1164-1.9748%가 나옵니다. 저자는 1.5%(95% CI 1.11-1.97%)에다 우편번호별로 인구, 성별, 인종 보정을 해서 감염률 2.81%(95% CI 2.24-3.37%)를 만들어냈고, 이렇게 보정된 감염률에 다시 민감도와 특이도를 고려한 보정을 했을 때의 값이 제조사 테스트 데이터를 기반으로 하면 2.49%(95% CI 1.80-3.17%), 스탠포드 테스트 데이터를 기반으로 하면 4.16%(95% CI 2.58-5.70%), 종합 데이터를 기반으로 하면 2.75%(95% CI 2.01-3.49%)입니다. 95% CI 로우 바운더리에 0이 포함되려면 특이도가 적어도 97%대까지는 내려가야 합니다.

한편 제 코멘트에서도 편의상 0% 감염률이라는 가정 하에 민감도를 무시한 채 특이도만 가지고 이야기하긴 했고, 2.5% 로우 바운더리쪽만 본다면 이렇게 해도 크게 틀리지는 않습니다만, 95% CI를 계산한다면 특이도만 가지고 계산하면 안 됩니다. 진짜 감염자는 진양성+위음성으로 구성되어 있고(둘 다 민감도 관련) 진짜 미감염자는 위양성+진음성으로 구성되는데(둘 다 특이도 관련), 실제로 얻게되는 결과인 테스트상 양성은 진양성+위양성이고 테스트상 음성은 위음성+진음성입니다. 즉 결과값에는 민감도와 특이도가 조합되어 있고, 양쪽 다 감안해서 계산해야 합니다. Exact 기준으로 보면, 저자가 제조사와 스탠포드 데이터를 종합적으로 고려해서 만든 민감도 80.3%와 특이도 99.5%를 맞다고 치고 그대로 쓰는 경우, 양성 샘플 50개는 진양성 33.56개와 위양성 16.44개가 합쳐져서 만들어내는 값이고, 음성샘플 3,280개는 진음성 3,271.77개와 위음성 8.23개가 합쳐져서 만들어내는 값이며, 진짜 감염샘플수는 진양성+위음성=41.79개가 되는 식입니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
85764 [일반] [보건] 사회적 거리두기가 5월5일까지 연장됩니다. [82] 구라쳐서미안19632 20/04/19 19632 5
85763 [일반] [스연] (여자)아이들이 공중파1위를 스윕했습니다 [31] fallsdown7694 20/04/19 7694 4
85762 [일반] [스연]'V리그 간판' FA 박철우, 삼성화재 떠나 한국전력 전격 이적 [18] LG우승8664 20/04/19 8664 0
85761 [일반] 상록수 2020 [10] 어강됴리11984 20/04/19 11984 7
85759 [일반] 트럼프는 얼마를 더 받을생각인가, 방위비 분담금 [240] 어강됴리16871 20/04/19 16871 0
85758 [일반] 6개월간의 트레이딩 시스템 정립과 훈련의 현재 상황 그리고 처음 주식을 하는 분들에게 드리고 싶은 말씀 [45] Trader J12144 20/04/19 12144 7
85757 [일반] 스탠포드 코로나 항체검사 결과 [19] Charli14068 20/04/19 14068 1
85756 [일반] 코로나감염자 5.7%가 완치후 항체가 형성되지 않았다고 하네요 [15] 싶어요싶어요13306 20/04/19 13306 0
85755 [일반] 역설적 상황의 코로나 사태 [58] TWICE쯔위17248 20/04/19 17248 26
85754 [일반] [팝송] 셀레나 고메즈 새 앨범 "Rare" [1] 김치찌개6973 20/04/19 6973 0
85753 [일반] (스연)유난히 빛나는 이들이 있다. 시지프스7508 20/04/18 7508 0
85752 [일반] [경제] 주식, 10년 존버하면 오를까? [49] 김유라17534 20/04/18 17534 5
85751 [일반] [WWE] 레슬매니아 36… 그 후 [7] Love.of.Tears.10866 20/04/18 10866 1
85750 [일반] 코로나19 신규 확진자가 31번 확진자 이후 처음으로 10명대로 줄었습니다 [31] VictoryFood12579 20/04/18 12579 2
85749 [일반] [스연] [cover] 우연히 봄 - 여자친구 유주 only (rap parts melody & lyrics rewritten by Yuju) [14] 메자이의 학점약탈자6835 20/04/18 6835 3
85748 [일반] 여러분은 정상인이신가요? (feat. 혐오의 시대) [44] 세종대왕14982 20/04/18 14982 50
85747 [일반] 어제 퇴근시간에 있었던 일. [18] 공기청정기11416 20/04/18 11416 20
85746 [일반] 미성년자 의제강간 13→16세 상향 추진 [185] 세종대왕20384 20/04/18 20384 3
85745 [일반] 코로나 19의 대한 북미 IT 두 거대기업의 대처 [13] 토니파커12249 20/04/18 12249 1
85744 [일반] [스연][여자친구] 참참참 1초컷 은하 [4] 메자이의 학점약탈자7612 20/04/18 7612 2
85743 [일반] 미국에서 겪은 일 / 하룻밤 사이 170불.. 아니 연간 2,040불 아낀 얘기 [29] LAOFFICE12285 20/04/18 12285 11
85742 [일반] 한국어의 용법(+일본어의 행태) [53] UMC12347 20/04/18 12347 26
85741 [일반] 세월호 사고원인에 대한 생각 [36] 마우스질럿13388 20/04/18 13388 23
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로