PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2024/11/20 15:12:39
Name Charli
File #1 KZ8zTiO.png (198.8 KB), Download : 77
출처 https://x.com/hyunw_kim/status/1858927208469065733
Link #2 https://github.com/Marker-Inc-Korea/Korean-SAT-LLM-Leaderboard?tab=readme-ov-file
Subject [기타] 올해 수능 한개 틀린 AI


1위는 오픈AI의 최신모델인 o1-preview로 올해 수능 한개틀렸다고 합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
及時雨
24/11/20 15:13
수정 아이콘
오 서울대 가겠다
24/11/20 15:16
수정 아이콘
인간시대의 끝이 도래했다
윌슨 블레이드
24/11/20 15:17
수정 아이콘
쟤는 그렇구나 하는데 8등급 맞은건 뭐죠 크크
전기쥐
24/11/20 15:19
수정 아이콘
옛날 gpt 버젼인 3.5요
일면식
24/11/20 15:18
수정 아이콘
어떤과목으로 시험을 봤길래 원점수가 97일까요? 수학은 아니라는건데
전기쥐
24/11/20 15:19
수정 아이콘
본글 짤방 첫 문장을 보니 수능 국어 같네요.
김건희
24/11/20 15:20
수정 아이콘
짤에 국어...라고 적혀 있네요. 흐흐
24/11/20 15:22
수정 아이콘
국어라고 적혀있네요. 인공지능에게 제일 어려울 영역이 국어라고 봤는데 이미 97점이네요
jjohny=쿠마
24/11/20 15:31
수정 아이콘
(수정됨) 오히려 다른 과목보다 국어/영어가 압도적으로 쉬울 겁니다.
LLM(그리고 그 기반이 되는 Transformer)의 기능이 그렇습니다.

수리영역이나 과학영역에 있어서는 상대적으로 허점이 많을 수 있어요.
(수능 사회영역 과목은 제가 시험본 적이 없어서 잘 모르고요)
24/11/20 15:34
수정 아이콘
사탐은 배경지식이 입력된상태면 만점나올겁니다.
jjohny=쿠마
24/11/20 15:46
수정 아이콘
기본적인 한국어 fine tuning 외에 배경지식을 추가로 학습시킨 건 약간 컨닝 같긴 한데...
배경지식 학습이라는 전제가 있다면 과탐보다 사탐 만점이 더 쉽겠네요.
모링가
24/11/20 18:22
수정 아이콘
학생들이 하는 공부가 정확하게 그거랑 같죠
호드람
24/11/20 15:20
수정 아이콘
와 이정도면 수능시험볼때, 안경에 초소형 통신 가능한 카메라, 귀에 초소형 통신용 이어폰 달아서,
이미지 바로 gpt에 쏴주고 답안 바로 음성으로 알려주면 되는거 아닌가요?
24/11/20 15:35
수정 아이콘
걸리지만 않으면 가능합니다(!?)
마틴루터킴
24/11/20 15:37
수정 아이콘
그 아이템이면 gpt 아니어도 대리 수능이 가능..
호드람
24/11/20 16:56
수정 아이콘
gpt가 수능 문제 풀이 능력이 한 두 문제 틀리는 정도인데, 만점에 가까울 정도로 수능을 풀어줄 사람을 먼저 구하는게 쉽지 않죠, 대리수능자의 리스크도 고려해야하고 비용도 지불해야할텐데, 그걸 gpt가 해결해준다는데 의미가 있죠
키르히아이스
24/11/20 17:48
수정 아이콘
초소형 카메라 탑재 안경과
귓구멍에 숨길수있는 초소형 이어폰을 숨길수 있는 사람이면
그정도 비용은 문제가 아닐것같습니다?
호드람
24/11/20 18:45
수정 아이콘
지금 알리익스프레스에 검색해봐도 손톱만한 카메라, 이어폰을 팔고 있어서 장비는 비용문제가 없을것 같네요
24/11/20 15:43
수정 아이콘
나중엔 진짜 안경 같은 거 빡쎄게 검사할 수도 있겠네요...막 스캐너에 통과 시키고...;;
우울한구름
24/11/20 16:11
수정 아이콘
그정도면 그냥 사람이 대리시험 봐도 되는거라 큰 의미가......
TempestKim
24/11/20 16:34
수정 아이콘
LLM은 아니지만 중국에서 비슷하게 보안뚫기해서 전자기기 탐지 한다고 하더라구요
24/11/20 15:22
수정 아이콘
ai도 문제를 다 못 맞추는구나
그렇군요
24/11/20 15:26
수정 아이콘
인간은 이제 필요없다구~
24/11/20 15:33
수정 아이콘
o1 프리뷰는 확실히 보법이 다릅니다
좀 진지한 거 물어볼 때는 거의 이거만 쓰는 듯
24/11/20 15:36
수정 아이콘
한국어 모델 기준인데도 o1-Preview는 진짜.. 와.. (.....)

대충 야놀자, Mistral, 라마 3.2, 3점수도 궁금해지네요
김재규장군의결단
24/11/20 15:48
수정 아이콘
GPT 3.5 지금도 쓸 수 있나요? 가끔은 예전 GPT의 엉뚱한 대답이 필요할 때가 있는데
전기쥐
24/11/20 15:54
수정 아이콘
지금 제 gpt 보니까 4까지만 가능하고 3.5 이런건 목록에도 없네요.
이른취침
24/11/20 16:19
수정 아이콘
서버 싹 날렸겠죠. 다 비용인데...
리얼포스
24/11/20 17:53
수정 아이콘
API로 레거시모델을 활용 가능합니다.
김재규장군의결단
24/11/20 23:28
수정 아이콘
과거 모델로 빙의해서 결과를 출력하라고 명령을 내리니까 어느정도 옛날 느낌이 나게 하긴 하네요. 이게 그시절 그 맛이었는지는 의문입니다만.
raindraw
24/11/20 15:53
수정 아이콘
최소한 클로드 정도는 넣었어야 좋은 비교가 될텐데 말입니다.
복합우루사
24/11/20 15:55
수정 아이콘
똑바로 서라 A.I.
왜 만점을 받지 못하였지?
신사동사신
24/11/20 16:05
수정 아이콘
곧 안경이나 어디든 칩심고
수능보다 걸린 학생등장 하겠군요..
24/11/20 16:29
수정 아이콘
GPT 4o도 쓸만하던데. 얘가 겨우 4등급따리였어?
아서스
24/11/20 16:45
수정 아이콘
특이점이 진짜 다가오고 있다!
공실이
24/11/20 18:25
수정 아이콘
우리나라 수능은 학습대이터에 확실히 없다는 점에서 의미있는결과네요
대불암용산
24/11/20 18:51
수정 아이콘
ai가 만점이 아니라니 쯧쯧 아직 멀었군
라방백
24/11/20 18:53
수정 아이콘
점수보다 푸는데 몇분이나 걸렸을지가 궁금하네요. 2~3분컷 아닐까..
모링가
24/11/20 18:59
수정 아이콘
(수정됨) o1-preview 장난 아닙니다
근데 장난 아니게 비쌉니다 크크
잠깐 20분정도 놀았는데 3달라 나갔읍니다

근데 애가 좀 이상한게 자꾸 대화를 마무리지으려고 합니다.
비싼 모델이라 썩 가치 있는 질문이 아니라면 더는 말하지 마라고 하는 듯한 느낌
24/11/20 21:25
수정 아이콘
구독제 아닌가요?
모링가
24/11/21 02:05
수정 아이콘
종량제로 쓸 수 있습니다
자연스러운
24/11/21 11:46
수정 아이콘
나 바쁜 몸이야 ~이런 느낌인가요
개망이
24/11/20 21:24
수정 아이콘
문과탑 클로드 소넷3.5가 없네요...
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
508998 [유머] 트럼프와 급하게 통화한 캐나다 총리 [20] a-ha9440 24/11/27 9440
508997 [서브컬쳐] 의외로 세관에서 의심받으면 곤란한 품목 [17] Lord Be Goja7460 24/11/27 7460
508996 [기타] 의외로 프랑스산 마카롱과 비슷한 개념 [16] Lord Be Goja8119 24/11/27 8119
508995 [기타] 의외로 눈오면 불편하다는 오픈카 [22] Lord Be Goja8543 24/11/27 8543
508994 [서브컬쳐] [소전2] 전쟁은 그녀를 바꿔놓았습니다... [12] Cand4172 24/11/27 4172
508993 [기타] ???: ai 모델 개선이 슬슬 힘드신가요? 환각이 문제죠?? [19] Lord Be Goja7823 24/11/27 7823
508992 [LOL] 한스사마 근황 [12] Equalright8828 24/11/27 8828
508991 [기타] "관세무새" 트럼프 드디어 시작하나 보네요. [75] a-ha11612 24/11/27 11612
508990 [기타] 서울 역대 11월 중 가장 많은 눈. 기상관측 117년 만 [40] 핑크솔져13603 24/11/27 13603
508988 [유머] BTS 정국 닮은꼴 대회 수상자들... [13] a-ha11309 24/11/26 11309
508987 [LOL] 고전파 24 월즈 복기 방송 중 [25] BTS12098 24/11/26 12098
508986 [기타] 날 물로 보지마! [17] 人在江湖身不由己11836 24/11/26 11836
508985 [게임] 백야극광 중국서버 종료 [11] 묻고 더블로 가!8725 24/11/26 8725
508984 [LOL] 고소자료 모으고 있었던 채정원 [18] 카루오스10980 24/11/26 10980
508983 [LOL] 영입되자마자 높으신 분과의 관계에 대해서 추궁당하는 선수 [11] EnergyFlow9333 24/11/26 9333
508982 [게임] 소녀전선) 자기 자신을 뛰어넘는 춘전이 [10] 닭강정5893 24/11/26 5893
508980 [유머] 아이씨 공무원인데 악성민원땜에 죽겠다 진짜.jpg [34] 전자수도승15721 24/11/26 15721
508979 [방송]  알고보니 30년전 나이트에서 같이 술마신 사이.jpg [16] insane14219 24/11/26 14219
508978 [기타] 우리나라 주세의 문제점 [57] 로켓11341 24/11/26 11341
508977 [게임] 배틀 그라운드 새 광고모델 랄로 [8] 투투피치8286 24/11/26 8286
508976 [LOL] 젠지라이브 드립 모음 [18] 유머7434 24/11/26 7434
508975 [게임] G-STAR 2024 | 넥슨 30주년 오케스트라 영상 [7] EnergyFlow4995 24/11/26 4995
508974 [기타] 작가 vs 그림 [16] 묻고 더블로 가!10389 24/11/26 10389
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로