PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2024/11/20 15:12:39
Name Charli
File #1 KZ8zTiO.png (198.8 KB), Download : 72
출처 https://x.com/hyunw_kim/status/1858927208469065733
Link #2 https://github.com/Marker-Inc-Korea/Korean-SAT-LLM-Leaderboard?tab=readme-ov-file
Subject [기타] 올해 수능 한개 틀린 AI


1위는 오픈AI의 최신모델인 o1-preview로 올해 수능 한개틀렸다고 합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
及時雨
24/11/20 15:13
수정 아이콘
오 서울대 가겠다
24/11/20 15:16
수정 아이콘
인간시대의 끝이 도래했다
윌슨 블레이드
24/11/20 15:17
수정 아이콘
쟤는 그렇구나 하는데 8등급 맞은건 뭐죠 크크
전기쥐
24/11/20 15:19
수정 아이콘
옛날 gpt 버젼인 3.5요
일면식
24/11/20 15:18
수정 아이콘
어떤과목으로 시험을 봤길래 원점수가 97일까요? 수학은 아니라는건데
전기쥐
24/11/20 15:19
수정 아이콘
본글 짤방 첫 문장을 보니 수능 국어 같네요.
김건희
24/11/20 15:20
수정 아이콘
짤에 국어...라고 적혀 있네요. 흐흐
24/11/20 15:22
수정 아이콘
국어라고 적혀있네요. 인공지능에게 제일 어려울 영역이 국어라고 봤는데 이미 97점이네요
jjohny=쿠마
24/11/20 15:31
수정 아이콘
(수정됨) 오히려 다른 과목보다 국어/영어가 압도적으로 쉬울 겁니다.
LLM(그리고 그 기반이 되는 Transformer)의 기능이 그렇습니다.

수리영역이나 과학영역에 있어서는 상대적으로 허점이 많을 수 있어요.
(수능 사회영역 과목은 제가 시험본 적이 없어서 잘 모르고요)
24/11/20 15:34
수정 아이콘
사탐은 배경지식이 입력된상태면 만점나올겁니다.
jjohny=쿠마
24/11/20 15:46
수정 아이콘
기본적인 한국어 fine tuning 외에 배경지식을 추가로 학습시킨 건 약간 컨닝 같긴 한데...
배경지식 학습이라는 전제가 있다면 과탐보다 사탐 만점이 더 쉽겠네요.
모링가
24/11/20 18:22
수정 아이콘
학생들이 하는 공부가 정확하게 그거랑 같죠
호드람
24/11/20 15:20
수정 아이콘
와 이정도면 수능시험볼때, 안경에 초소형 통신 가능한 카메라, 귀에 초소형 통신용 이어폰 달아서,
이미지 바로 gpt에 쏴주고 답안 바로 음성으로 알려주면 되는거 아닌가요?
24/11/20 15:35
수정 아이콘
걸리지만 않으면 가능합니다(!?)
마틴루터킴
24/11/20 15:37
수정 아이콘
그 아이템이면 gpt 아니어도 대리 수능이 가능..
호드람
24/11/20 16:56
수정 아이콘
gpt가 수능 문제 풀이 능력이 한 두 문제 틀리는 정도인데, 만점에 가까울 정도로 수능을 풀어줄 사람을 먼저 구하는게 쉽지 않죠, 대리수능자의 리스크도 고려해야하고 비용도 지불해야할텐데, 그걸 gpt가 해결해준다는데 의미가 있죠
키르히아이스
24/11/20 17:48
수정 아이콘
초소형 카메라 탑재 안경과
귓구멍에 숨길수있는 초소형 이어폰을 숨길수 있는 사람이면
그정도 비용은 문제가 아닐것같습니다?
호드람
24/11/20 18:45
수정 아이콘
지금 알리익스프레스에 검색해봐도 손톱만한 카메라, 이어폰을 팔고 있어서 장비는 비용문제가 없을것 같네요
24/11/20 15:43
수정 아이콘
나중엔 진짜 안경 같은 거 빡쎄게 검사할 수도 있겠네요...막 스캐너에 통과 시키고...;;
우울한구름
24/11/20 16:11
수정 아이콘
그정도면 그냥 사람이 대리시험 봐도 되는거라 큰 의미가......
TempestKim
24/11/20 16:34
수정 아이콘
LLM은 아니지만 중국에서 비슷하게 보안뚫기해서 전자기기 탐지 한다고 하더라구요
24/11/20 15:22
수정 아이콘
ai도 문제를 다 못 맞추는구나
그렇군요
24/11/20 15:26
수정 아이콘
인간은 이제 필요없다구~
24/11/20 15:33
수정 아이콘
o1 프리뷰는 확실히 보법이 다릅니다
좀 진지한 거 물어볼 때는 거의 이거만 쓰는 듯
24/11/20 15:36
수정 아이콘
한국어 모델 기준인데도 o1-Preview는 진짜.. 와.. (.....)

대충 야놀자, Mistral, 라마 3.2, 3점수도 궁금해지네요
김재규장군의결단
24/11/20 15:48
수정 아이콘
GPT 3.5 지금도 쓸 수 있나요? 가끔은 예전 GPT의 엉뚱한 대답이 필요할 때가 있는데
전기쥐
24/11/20 15:54
수정 아이콘
지금 제 gpt 보니까 4까지만 가능하고 3.5 이런건 목록에도 없네요.
이른취침
24/11/20 16:19
수정 아이콘
서버 싹 날렸겠죠. 다 비용인데...
리얼포스
24/11/20 17:53
수정 아이콘
API로 레거시모델을 활용 가능합니다.
김재규장군의결단
24/11/20 23:28
수정 아이콘
과거 모델로 빙의해서 결과를 출력하라고 명령을 내리니까 어느정도 옛날 느낌이 나게 하긴 하네요. 이게 그시절 그 맛이었는지는 의문입니다만.
raindraw
24/11/20 15:53
수정 아이콘
최소한 클로드 정도는 넣었어야 좋은 비교가 될텐데 말입니다.
복합우루사
24/11/20 15:55
수정 아이콘
똑바로 서라 A.I.
왜 만점을 받지 못하였지?
신사동사신
24/11/20 16:05
수정 아이콘
곧 안경이나 어디든 칩심고
수능보다 걸린 학생등장 하겠군요..
24/11/20 16:29
수정 아이콘
GPT 4o도 쓸만하던데. 얘가 겨우 4등급따리였어?
아서스
24/11/20 16:45
수정 아이콘
특이점이 진짜 다가오고 있다!
공실이
24/11/20 18:25
수정 아이콘
우리나라 수능은 학습대이터에 확실히 없다는 점에서 의미있는결과네요
대불암용산
24/11/20 18:51
수정 아이콘
ai가 만점이 아니라니 쯧쯧 아직 멀었군
라방백
24/11/20 18:53
수정 아이콘
점수보다 푸는데 몇분이나 걸렸을지가 궁금하네요. 2~3분컷 아닐까..
모링가
24/11/20 18:59
수정 아이콘
(수정됨) o1-preview 장난 아닙니다
근데 장난 아니게 비쌉니다 크크
잠깐 20분정도 놀았는데 3달라 나갔읍니다

근데 애가 좀 이상한게 자꾸 대화를 마무리지으려고 합니다.
비싼 모델이라 썩 가치 있는 질문이 아니라면 더는 말하지 마라고 하는 듯한 느낌
24/11/20 21:25
수정 아이콘
구독제 아닌가요?
모링가
24/11/21 02:05
수정 아이콘
종량제로 쓸 수 있습니다
자연스러운
24/11/21 11:46
수정 아이콘
나 바쁜 몸이야 ~이런 느낌인가요
개망이
24/11/20 21:24
수정 아이콘
문과탑 클로드 소넷3.5가 없네요...
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
508765 [기타] 실현된다면 좀 쩔 것 같은 저궤도 우주호텔 [29] a-ha6453 24/11/21 6453
508762 [기타] 이론상으로만 존재했던 신광물 발견 [6] 삭제됨5255 24/11/21 5255
508760 [기타] 의외로 정식으로 도입된 별칭 [17] Lord Be Goja7951 24/11/21 7951
508757 [기타] 친구 사이에 이런 건 무리다 vs 친구의 호의를 무시하면 안된다 [51] 묻고 더블로 가!8390 24/11/21 8390
508756 [기타] 오늘 공개된 현대 아이오닉 9 [51] a-ha6580 24/11/21 6580
508750 [기타] 아내가 게이 남사친 집에서 야한 영화 본다고 하면 허락? 불가? [71] 뭉땡쓰9313 24/11/21 9313
508741 [기타] 실제로 미국이 비밀리에 실시했다는 스파이 프로그램 [40] a-ha6650 24/11/21 6650
508732 [기타] 일광욕을 즐기다가 소매치기를 잡은 스웨덴 여경누나의 평소 몸관리.mp4 [25] insane9114 24/11/21 9114
508726 [기타] 요즘 영화에서 흥미를 반감시킨다는 요소 [58] Lord Be Goja8361 24/11/20 8361
508724 [기타] ‘백종원의 레미제라블’ 소년범 논란 속..PD “실패한 이들에 기회주는 콘텐츠” [55] Myoi Mina 6223 24/11/20 6223
508715 [기타] 은근히 사진 매너가 부족하다는 사람 [16] Lord Be Goja7362 24/11/20 7362
508713 [기타] 회사 여직원이랑 결혼하는 방법 [3] 쎌라비7828 24/11/20 7828
508710 [기타] 재규어 너프 [31] BTS6267 24/11/20 6267
508706 [기타] 말넘심... [7] Cand5267 24/11/20 5267
508700 [기타] 이삭토스트 포켓몬 뱃지 오늘 구입 성공했습니다. [17] 44년신혼2년4378 24/11/20 4378
508699 [기타] 트럼프,장관인선에 늘 있는 wwe [9] Lord Be Goja4623 24/11/20 4623
508696 [기타] 올해 수능 한개 틀린 AI [43] Charli6685 24/11/20 6685
508695 [기타] 유치원 교사의 개인기 [30] 묻고 더블로 가!6759 24/11/20 6759
508692 [기타] 연세대 논술시험 효력정지 가처분 이의신청 기각 [29] a-ha4965 24/11/20 4965
508691 [기타] 혐주의)중국 던파 콜라보 근황 [15] 크레토스5171 24/11/20 5171
508683 [기타] 한국은 굴 부자 나라임 [88] 퀀텀리프10468 24/11/20 10468
508681 [기타] 무서운 미 법무부...크롬 강제매각 추진 [34] a-ha7272 24/11/20 7272
508678 [기타] 승자는 많은것을 가져갑니다 [5] Lord Be Goja4664 24/11/20 4664
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로