PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2219
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2205
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
103893 [일반] 기술자적 유연성 [8] 번개맞은씨앗5369 25/03/07 5369 7
103892 [일반] 소매업체, RX 9070 “MSRP”는 첫 배송에만 적용.가격은 추후 인상될 예정 [25] SAS Tony Parker 6909 25/03/07 6909 0
103891 [일반] 대형마트 의무휴일 축소? 확대? [131] 로켓12616 25/03/07 12616 14
103890 [일반] 미키 17 후기 (노스포) [23] 라이징패스트볼7358 25/03/07 7358 9
103889 [일반] K-자본주의는 주주를 등쳐먹기로 모두가 합의한 체제이다. [95] 깃털달린뱀14802 25/03/06 14802 76
103887 [일반] 챗AI에게 두억시니말 같은 글 쓰게 시키기 - 결론 포함 [10] 닉언급금지7359 25/03/06 7359 1
103886 [일반] 한미연합훈련 중 민가에 포탄 폭발 사고.... 전투기 오발로 추정 [64] EnergyFlow12849 25/03/06 12849 2
103885 [일반] 젊은 2030 세대들이 중국에대한 아주 강한 반중정서를 가지고 있는걸로 밝혀졌네요 [291] 마그데부르크21178 25/03/06 21178 10
103884 [일반] 호상 [64] dlwlrma11516 25/03/06 11516 77
103883 [일반] [설문] 부모나 연소자에게 가중투표권을 부여해야 할까요? [50] 슈테판7062 25/03/06 7062 1
103882 [일반] <콘클라베> - 신의 일이든, 신의 뜻이든, 결국 인간이 하는 것. (노스포) [14] aDayInTheLife5405 25/03/05 5405 5
103881 [일반] LP [12] 79년생4576 25/03/05 4576 3
103880 [일반] 한국에서 우러 전쟁 최고 수혜자 [33] 여기11243 25/03/05 11243 0
103879 [일반] 트럼프의 연설이 있었습니다. [147] 랜슬롯14839 25/03/05 14839 8
103877 [일반] 팀원 세 명과 VIVIZ 'Shhh!' 커버 댄스를 촬영했습니다. [4] 메존일각6176 25/03/04 6176 15
103876 [일반] G7의 상대적 경제규모 비중 하락 [55] 사부작11911 25/03/04 11911 1
103875 [일반] 아이가 중학교에 갔습니다 (+노래 추천 요청) [80] 글곰7335 25/03/04 7335 22
103874 [일반] 소리로 찾아가는 한자 81. 아들 자(子)·재상 재(宰)에서 파생된 한자들 [2] 계층방정4712 25/03/04 4712 3
103872 댓글잠금 [일반] 기사-트럼프, 우크라이나 군사지원 잠정 중단 명령 [192] 깐부19681 25/03/04 19681 5
103871 [일반] AI의 팩트체크 [35] 번개맞은씨앗8496 25/03/04 8496 3
103870 [일반] (스포) <미키17> 원작과의 차이, 그리고 봉 감독이 그리고 싶었던 것? [29] 빼사스6823 25/03/04 6823 15
103869 [일반] [웹툰소개] 에밀리의 저택(완결) [5] 카페알파6005 25/03/04 6005 3
103868 [일반] [설문] 트럼프의 외교 기조 어떻게 대응해야 하나 [29] 슈테판6386 25/03/03 6386 0
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로