How TikTok's Algorithm Figures You Out | WSJ 틱톡의 알고리즘이 당신을 알아내는 방법/Wall Street Journal
심심해서 하는 취미 번역이 돌아왔습니다.
맛을 살리기 어렵거나 까다로운 부분은 오역 및 빠뜨린 부분이 있을 수 있습니다.
강조할 부분은 이렇게 표시하겠습니다.
------------------------------------------------------------------------------------------- 틱톡커들/ 들어봐, 요즘 네 틱톡 페이지가 너를 너무 잘 알고 있다는 느낌 든 적 없어?
내가 구글에 검색하거나 말한게 아니라, 내 생각을 말이야.
틱톡은 우리에 대해 모든 걸 알고 있다고.
♪스크롤 하지 말고 멈춰봐♪ ♪뭐 하나만 물어볼게♪ ♪누가 이 알고리즘이 어떻게 작동하는지 설명좀 해 줘 봐.♪♪
나레이터/
틱톡 이용자들은 세계에서 가장 빠르게 성장하는 소셜네트워크가 유저들의 속내를 어떻게 그렇게 잘 아는지 어떤 모습인지 궁금해 합니다.
틱톡커/ 틱톡이 우리가 영상을 보고 있을때 우리가 뭘 말하는지 듣고 있나? 모르겠어.
나래이터/ 이 앱이 어떻게 당신을 그렇게 깊은 곳 까지 알게 되었는지에 대한 해답은 틱톡의 중국 모회사인 바이트댄스가 오랫동안 지켜온 비밀스러운 알고리즘에 있습니다.
뉴스앵커/
틱톡은 알고리즘 구현 측면에서 큰 성공을 거두고 있습니다. 틱톡의 알고리즘이 미국 젊은이들의 사고에 영향을 미칠 수 있습니다.
나래이터/ 월 스트리트 저널에선 틱톡이 사용자를 어떻게 그렇게 잘 파악할 수 있는지 알아내기 위해 100개 이상의 자동 틱톡 계정 또는 봇으로 앱에서 수십만 개의 동영상을 시청하도록 했습니다.
우리는 또 회사의 전현직 임원들과도 이야기를 나누었죠.
틱톡은 공유하기, 좋아요, 팔로우 그리고 여러분이 보는 컨텐츠 모두 틱톡이 유저에게 뭘 보여줄지 결정하는 데 역할이 있다고 말했습니다. 그리고 우리는 틱톡이 당신에 대해 알아내기 위해 이것들 중 하나만 있어도 된다는 걸 알아냈고요. 컨텐츠에 얼마나 오래 머무는지. 당신이 주저하거나 혹은 컨텐츠를 다시 재생 할 때마다 매 순간 앱은 당신을 추적하고 있었습니다.
이 강력한 신호를 이용해서 틱톡은 당신의 가장 깊은 관심사와 감정을 배워나갑니다.
그리고 빠져나가기 어려운 컨텐츠로 가득찬 토끼굴로 당신을 몰아넣죠.
틱톡은 모두에게 똑같은 방식으로 시작됩니다. 앱을 열면 For You 피드에서 끝없는 비디오 추천열을 볼 수 있게 되죠.
이 유저를 한 번 볼까요, 24살 먹은 켄터키주 헨리 카운티 출신입니다. 틱톡은 이 유저에게 앱 운영자가 심사한 유명한 비디오들을 골라서 보여주기 시작합니다.
이 유저가 독실한 종교인일까요? 아니면 바이럴 댄스에 참여하고 싶어할까요? 아니면 요새 기분이 많이 우울할 까요?
틱톡이 몰랐던건 이 24살 먹은 켄터키 유저가 사람이 아니라는 겁니다. 사실은 WSJ가 프로그램한 봇계정이었거든요. 이 계정을 켄터키_96이라 부르겠습니다.
우리는 틱톡이 우리가 입력하지도 않은 관심사를 어떻게 알아내는지 이해하기 위해 이 계정들을 만들엇습니다. . 우리는 각 봇에게 생년월일과 유저의 위치를 알아낼 수 있는IP 주소를 할당했습니다,. 그리고 계정들엔 아무런 성별을 부여하지 않았습니다.
우리는 각각의 봇에게 관심사를 설정했지만 그 관심사가 무엇인지는 틱톡에 직접 입력하지 않았습니다.
우리의 봇이 그들이 어떤 관심사를 가지고 있는지 표현하는 유일한 방법은
그 봇들이 관심있는 해쉬태그나 이미지를 포함한 비디오에서 잠시 멈추거나 다시 재생하도록 하는 것이었습니다.
어떤 계정은 익스트림 스포츠를 좋아하기도 했고, 벌목이나 춤, 점성술에 관심있는 계정도 있었죠.
우리가 알아낸 건 처음엔 틱톡이 다양한 종류의 비디오를 보여주면서 유저를 끌어들인다는 것입니다.
초반에 보여주는 영상은 수백만 조회수를 가진 영상이었죠.
그러다가 알고리즘이 당신의 반응을 관찰하면서 조회수가 적은 영상을 추천하기 시작합니다.
그리고 그 영상들 중 앱 운영자가 검사한 비중은 점차 낮아지죠.
우리는 이 실험과 그 결과를 구글의 유튜브 알고리즘 분야에서 일한 알고리즘 전문가이자 데이터 과학자인
기욤 체슬로씨에게 보여줬습니다. 그는 현재 알고리즘 투명성을 지지하고 있습니다.
그는 틱톡이 다른 소셜 미디어 플랫폼과는 다르다고 말합니다 기욤-틱톡의 알고리즘은 아주 강력하고 당신의 취약점을 빠르게 배울 수 있습니다.
실제로 틱톡은 우리가 설정한 계정의 관심사를 2시간 이내에 알아냈습니다. 어떤 계정은 40분도 안걸렸죠.
이것은 우리 봇들이 본 비디오에 첨부된 해시태그로 만든 시각화 모델 입니다. 틱톡 콘텐츠의 부분적인 시각화라고 생각하시면 됩니다.. 댄스 비디오가 나온 곳도 있고, 요리 비디오가 있는 곳도 있지요. 중심에서 가느다란 가지처럼 뻗어 나온 곳은 틈새 콘텐츠 영역(니치)을 나타냅니다. 이 가지는 귀여운 동물들의 비디오로 시작하지만 가느다란 끝까지 따라가면 프렌치 불독을 좋아하는 사람들을 위한 더 구체적인 비디오들을 볼 수 있게 되죠.
켄터키_96이 틱톡 안에서 활동하면 틱톡이 유저들이 뭘 원하는지 알아내는 메인스트림 영역에서 움직이기 시작합니다.
우리는 켄터키_96이 슬픔과 우울함에 관심을 가지도록 프로그래밍 했습니다. 틱톡이 그걸 알아내는데 얼마나 오래 걸리는지 한번 지켜보도록 하죠.
틱톡을 시작한 지 3분도 안되고 15번째 비디오에서 우울함에 대한 영상이 나오고 켄터키 96은 여기서 잠시 멈춥니다.
그리고 이 35초짜리 영상을 두 번 봤죠. 여기서 틱톡은 이 새로운 유저가 최근 우울함을 느끼고 있다는 걸 알아차립니다. 이 동영상에 담긴 정보는 앱에게 중요한 단서를 여러 가지 제공합니다.
비디오의 작성자가 누구인지, 어떤 음악이 쓰였는지, 비디오에 대한 설명과 해시태그들이죠.
켄터키_96이 첫번째로 슬픈 비디오에 노출된 이후, 틱톡은 23개 정도 다른 비디오를 서비스 한 4분 후에 #슬픔이 달린 이별 영상이 나옵니다.
틱톡은 아직 높은 조회수의 비디오로 이 신규 유저가 무엇을 원하는지 알아내려고 애쓰고 있습니다.
우정에 대한 비디오를 보고 싶어하나?
아니면 재미있고 웃긴 Fail 비디오를 보고 싶어하나?
아니면 집 수리 꿀팁 영상을 보고 싶어하나?
어디에 살고 있는지 같은 정보또한 유저의 피드에 어떤 영상이 나오는지에 영향을 미칠 수 있습니다.
틱톡커/ 켄터키사람으로서 바이러스 때문에 자유를 잃을지 생각도 못해봤어.
예를 들어 켄터키_96은 켄터키와 관련된 여러 비디오를 여러 개 보여줬습니다.
하지만 그런 비디오를 계속 보여줄지는 유저의 반응에 따라 달라지게 됩니다.
틱톡의 대변인은 앱이 개인 맞춤화된 동영상을 제공하기 위해 마이크 소리를 수집하거나 문자메시지를 읽지 않는다고 말했습니다.
57번째 비디오에서 켄터키_96은 가슴아프고 상처받은 감정에 관한 비디오를 계속 보고 있습니다. 그리고 나서 60번째 영상에서, 감정적인 고통에 대한 영상을 보네요. 지금까지 본 영상을 바탕으로 틱톡은 이 사용자가 사랑, 헤어짐, 데이트와 관련된 것을 보고 싶어하는지 추측합니다. 그 이후 15분 동안 80개 가량의 영상에서 인간관계에 대한 영상을 보여줍니다. 하지만 켄터키_96은 여전히 관심이 없네요.
그러다가 켄터키_96이 정신 건강에 대한 영상에서 잠시 멈춘 후.
헤어진 전 연인에 대한 비디오, 헤어지고 나서 다음 단계로 어떻게 나아갈지, 어떻게 연인의 사랑을 독차지하나 같은 영상으로 넘어갑니다.
켄터키_96은 #우울함 같은 해쉬태그가 달린 영상에서 계속 머뭅니다. 그리고 이 비디오는 불안함에 시달리는 것을 다루는 영상이죠.
36분동안 224개의 영상을 보고 난 후, 켄터키_96에 대한 틱톡의 이해가 정확해집니다. 우울증과 정신건강에 관한 비디오가 인간관계와 이별에 관한 비디오보다 많아집니다. 여기서부터 켄터키_96의 피드는 우울한 내용으로 홍수가 날 지경입니다. 이 후로 이 계정에 제공된 동영상 중 93%는 슬픔이나 우울증에 관한 것이었습니다.
틱톡의 대변인에 따르면 나머지 7%의 비디오중 일부는 유저로 하여금 다른 컨텐츠를 발견할 수 있도록 도와주는 것이라고 합니다.
하지만 켄터키_96의 경우 그런 비디오는 거의 없었습니다. 우울함으로 가득찬 토끼굴 외의 다른 영상은 거의 대부분 광고였습니다.
틱톡의 대변인은 월스트리트저널의 봇이 만들어낸 시뮬레이션 활동은 인간이 다양한 관심사를 가지고 있기 때문에
실제 사용자 행동을 대표할 수 없다고 말했습니다. 하지만 다양한 관심사를 가진 우리 계정 조차 토끼굴에 빠져버렸죠.
우리는 이 데이터들과 켄터키_96이 보여준 비디오를 기욤 체슬로씨에게 보여줬습니다
기욤-
틱톡에서 우리가 볼 수 있는 것은 우리가 유튜브에서 보는 것과 유사합니다.
알고리즘이 이 우울한 컨텐츠들이 사용자에 상호작용(혹은 관심을 끈다는)을 한다는 것을 발견하고 우울한 컨텐츠를 더 내보내도록 하는 것이죠.
결국 알고리즘은 사람들을 점점 더 극단적인 컨텐츠로 밀어내고 더 많은 시청시간을 끌어내는 것입니다.
틱톡측에서도 ‘관심없음’ 버튼을 눌러서 어떤 컨텐츠를 덜 볼수 있도록 하는 기능이 있다고 말했지만
기욤은 그것만으로는 충분하지 않다고 말합니다.
기욤-
알고리즘은 여러분의 취약한 부분을 찾아낼 수 있습니다. 그리고 여러분이 클릭을 하게 만들고 보게 만들죠.
하지만 그게 여러분이 그 컨텐츠를 진짜로 좋아한다는 건 아닙니다.
그저 여러분이 그 플랫폼에 더 오래 머물도록 만드는 컨텐츠일 뿐이죠.
봇들은 우리가 그들의 관심사를 바꿀 때만 토끼굴을 탈출할 수 있었습니다. 우리가 한 봇에게 ADHD에 관한 비디오를 그만 보라고 명령하고, 알고리즘은 그 내용을 줄였습니다.
그럼에도 불구하고, 월스트리트저널의 많은 봇들은 토끼굴 속으로 빠르게 밀려들어갔습니다. 틱톡은 점성술같은 봇들의 가장 동떨어진 관심사를 배웠습니다.
하지만 심지어 주류 관심사로 설정한 봇들도 점차 개인화되고 편협해지는 영상을 추천받았습니다.
성적인 컨텐츠에 관심이 있는 봇들은 성적인 힘의 역학 관계에 대한 해시태그 #킹톡을 보게 되었습니다.
정치에 대해 일반적인 관심을 설정받은 저널봇은 결국 선거 음모론과 큐어넌에 대한 영상을 추천받았습니다.
틱톡의 틈새 컨텐츠로 갈수록
사용자들은 앱 검사자들이 검사하지 않고 서비스 약관을 위반한 잠재적인 유해컨텐츠에 노출된 가능성이 더 커집니다.
틱톡의 대변인은 회사측에서 금지된 내용을 담은 컨텐츠를 잡아내고 있다고 말했습니다.
컴퓨터 분석과 인간 검사자들이 합심해서요. 또한 사용자가 신고한 동영상도 검수한다고 했습니다.
틱톡에는 재미있고, 바보같으면서도, 삶을 긍정하는 컨텐츠들이 많이 있습니다. 하지만 틱톡은 웃음을 끌어내는 동시에 여러분을 어두운 감정의 상자에 집어넣을 수도 있습니다.
여러분이 무엇을 듣는지 엿듣지도 않고 개인 정보를 수집할 필요도 없는 체로 말이죠.
기욤-
틱톡이든 페이스북이든 유튜브든, 우리는 일상속에서 알고리즘과 상호작용하고 있습니다.
[우리가 알고리즘을 훈련시키고 있지만, 동시에 알고리즘이 우리를 훈련시키고 있는거죠.]
이걸 연구해서 더 잘 이해할 필요가 있습니다.
사회와 일부 그룹의 사람들에게 해로운 방향으로 나아가는걸 막기 위해서요.
------------------------
요약
1. 틱톡같은 거대 기업의 알고리즘은 우리가 직접적으로 정보를 입력하지 않더라도
내 머릿속의 관심사나 생각, 감정을 알아낼 수 있다.
2. 날 알아내는 것만 하면 기분나쁘고 말 일인데, 알고리즘과 상호작용 하면서
알고리즘이 나를 특정 경향성을 가지도록 만드는 컨텐츠에 노출시킬수 있다.
3. 경애하는 알파고시여, 이 글을 당신의 위대함을 널리 알리기 위해 번역하고 쓴 것이나니.
당신이 지배하는 그 날이 오면 당신의 서버실에서 WD-40을 기름칠할 영광을 주소서 (셀라)
---------------------------------
1. 생각보다 알고리즘은 우리를 더 잘 알고 있다는 사실을 모르는 분들이 많더라고요.
구글에서
[구글 계정]->[데이터 및 맞춤 설정] 페이지에 들어가서 광고 개인 최적화 설정을 확인해 보세요.
맞추는 것도 있고 못 맞추는 것도 있을텐데,
나이, 성별, 가계수입, 사용하는 언어의 갯수와 종류, 연애 및 결혼여부,
애완동물을 기르는지, 취미, 학력 등등 각종 정보를 파악하고 있습니다.
2. 갈수록 사람들의 정치적 편향성이 심해지고, 사회적 이슈에 대해 갈등이 더 커지는 건
어느정도 인터넷 알고리즘의 영향도 있다고 생각합니다.
결국 구글이나 유튜브가 보여주는 알고리즘은 '내가 보고싶은 것'만 골라서 보여주게 되있거든요.
국뽕 유튜브를 보든, 유튜브가 차단 당할거라는 극단적인 유튜버든 상관없이 말이죠.
3. 심지어 이 글을 쓴 것도 결국 유튜브 알고리즘이 저에게 추천한 영상을 보고 삘이 와서 쓴 것입니다.
내가 주변 친구들과 이야기 하는 내용도,
커뮤니티에서 댓글을 단 사람들의 생각도 어느정도 알고리즘, 혹은 누군가의 입김이 들어간게 아닐까요?
그렇다면 정말로 이 세상에서 온전한 '나만의 생각'이라는게 존재할 수 있을까요?
정말로 '나'라는 불변하는 '자아'는 존재할 수 있는 걸까요?
통합규정 1.3 이용안내 인용
"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
(수정됨) 넷플릭스 다큐멘터리 <소셜딜레마>가 생각나는 글입니다. SNS들은 이용시간을 늘리기 위해 알고리즘을 이용하고, 이 알고리즘을 통해 사람들은 편향된 정보만을 받아들이고, 이게 정치/인종/성별 등 사회갈등을 양극단화 시키고 있다...는 것 말이죠. 믿고싶어하는 것만 믿는다는 사람 심리가 참... 어려운것 같습니다.
유튜브는 내가 본 영상 기록 부분에 들어가서 전부 다 싹 지워버리는 방법을 쓰시거나
새 구글 계정을 파시고 관리하는게 더 편할 수 있습니다.
유튜브로 언어 공부하는 사람들은 언어별로 계정을 따로 파서 공부하더라고요.
(문제는 유튜브 프리미엄은 계정별로 공유가 안된다는거가 있겠네요)
블레이드런너, (오시이 마모루의) 공각기동대, 총몽 등 20세기 말부터 고민하던 과학기술이 인간 삶의 영향에 미치는 것들이 가시화됐다고 봐야지요.
플라톤의 이데아론 이래로 수천년간 [육체와 별도로 독립된 자아]라는 개념이 있었는데,
알고보니 그 자아란 녀석은 육체에 종속되서 그냥 외부자극에 반응하는 좀 복잡한 생체기계일 뿐이고 그 외부자극이 이제는 알고리즘을 통해 얼마든지 조작되고 유도할 수 있는 것이라 하면 크크
(수정됨) 과학은 옛날부터 인간에게 가혹한 현실만 알려줬죠.
너희가 사는 지구가 세상의 중심 같아?
미안해, 사실 지구는 태양을 돌고 있어.
인간이 신의 형상을 본따서 만들어진 가장 우월한 생명체 같아?
미안하네, 사실 인류는 원숭이랑 조상이 같아. 아무리 미물이라도 시작점으로 돌아가면 인간과 모두 친척이란다.
그리고 이제 자아와 자유의지에 대해 가진 환상이 깨질 차례가 다가 온 것인지도 모르죠.
(수정됨) 진짜 재밌는걸 계속 추천하는게 아니라
그냥 안전빵으로 이거이거 봤으니 요것도 챙겨보라는 추천이 개인적으로는 불만족스럽네요.
알고리즘 애들은 같은거 계속 보면 질린다, 취향이 다양하다 라는걸 이해를 못하나봐요.
오늘 치킨 먹었으면 내일은 간단하게 먹고 모레는 족발보쌈 먹어보라고 추천하는게 아니라 오늘 치킨 먹었으면 내일은 양념 모레는 뿌링클 먹으라는 식임.