PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2223
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2206
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
104124 [일반] 역대 최악의 SK텔레콤 유심 정보 유출 사고 [71] 나미르13921 25/04/28 13921 8
104123 [일반] 광무제를 낳은 용릉후 가문 (3) - 미완의 꿈, 제무왕 유연 2 [3] 계층방정5002 25/04/27 5002 5
104122 [일반] 심히 유치하지만 AI 이야기를 해볼까 합니다 [12] Love.of.Tears.7826 25/04/27 7826 1
104121 [일반] [팝송] 알레시아 카라 새 앨범 "Love & Hyperbole" 김치찌개5740 25/04/27 5740 0
104120 [일반] [독서 에세이] 정치의 종이 되는 생각 없는 과학 (『20세기 소년』) [5] 두괴즐6593 25/04/26 6593 8
104119 [일반] 일본 정부부채는 정말 심각할까? [53] 기다리다13818 25/04/26 13818 8
104118 [일반] 최근 chatGPT와 함께 놀다가 마지막에 나눈 대화 [35] Quantum2113498 25/04/25 13498 7
104117 [일반] 미 공군의 A-10 썬더볼트 II는 올해 한국에서 철수합니다 [58] Regentag12963 25/04/25 12963 0
104116 [일반] 트럼프-달러패권 그 뉘앙스은 어떻게 잡는가 [20] Q-tip9622 25/04/25 9622 2
104115 [일반] 아래 간짜장 글을 보고 써보는 글입니다. [19] 덧물10540 25/04/25 10540 0
104114 [일반] 조금 다른 아이를 키우는 일상 9 [7] Poe7221 25/04/25 7221 24
104113 [일반] 챗gpt와 함께 읽는 "희랍어시간" [1] 아빠는외계인6827 25/04/24 6827 3
104112 [일반] 숙박앱에서 저에게 사기를 치려고 했던 것 같습니다? [18] 국힙원탑뉴진스12120 25/04/24 12120 3
104111 [일반] (스포일러 포함) 영화 <야당> - 빠르다... 진짜 빠르다!! [22] Anti-MAGE10412 25/04/23 10412 4
104110 [일반] 사학처럼 문학하기: 『눈물을 마시는 새』 시점 보론 [8] meson7616 25/04/23 7616 13
104109 [일반] 광무제를 낳은 용릉후 가문 (2) - 미완의 꿈, 제무왕 유연 1 [9] 계층방정8053 25/04/23 8053 10
104108 [일반] 트럼프 사실상 경제정책 항복? [100] DpnI18790 25/04/23 18790 7
104107 [일반] 무선 블루투스 송/수신기 사용기 [7] 스물다섯대째뺨8649 25/04/23 8649 3
104106 [일반] 제대로 하는 간짜장은 귀하다. [104] 인민 프로듀서16740 25/04/22 16740 26
104105 [일반] 오늘 갑상선암 진단을 받았습니다 [56] 승승장구12668 25/04/22 12668 41
104104 [일반] 오랜만에 자작곡 올립니다. [4] 포졸작곡가4744 25/04/22 4744 11
104102 [일반] 최근 1년동안 했던 게임들, 소소하게 평가를 해봅니다(2) [26] 공놀이가뭐라고10043 25/04/21 10043 7
104100 [일반] 프란치스코 교황 선종 [72] 제논13151 25/04/21 13151 14
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로