PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2218
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2204
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
104238 [일반] 한우 첫 출하를 마치며+ 한우 출하 정보 구분법 [34] SAS Tony Parker 3355 25/05/30 3355 9
104186 [일반] 더 적게... 더 적게! 46키 키보드 [63] kaestro7087 25/05/15 7087 12
104138 [일반] 이제 '강의'도 필요 없어지는 걸까요? [20] Quantumwk9614 25/05/01 9614 3
104097 [일반] AI 코딩 어시스트를 통한 IDE의 새로운 단계 [43] kaestro12081 25/04/20 12081 7
104089 [일반] 최근 사용한 AI툴들 목록 [37] kaestro6057 25/04/19 6057 31
104027 [일반] 신생아 중환자실 학대 관련 대구가톨릭대학교 병원 공식 사과 [71] SAS Tony Parker 12413 25/04/06 12413 4
104006 [일반] 네이버 멤버십 롯데시네마 혜택 변경 4.9~ [13] SAS Tony Parker 6277 25/04/03 6277 0
103999 [일반] 100개 이상의 9800X3D 사망 보고. 다수는 애즈락 보드에서 발생 [38] SAS Tony Parker 13401 25/03/31 13401 3
103964 [일반] 산불 사망 18명 등 인명피해, 의성 고운사 전소, 안동 하회마을 주민 대피령 -> 안동 전 시민 대피령 [65] LuckyVicky13809 25/03/25 13809 6
103961 [일반] 팔레스타인 영화감독 이스라엘 군에 끌려가, 삼성전자 한종희 대표이사 부회장 부고 [14] SAS Tony Parker 8173 25/03/25 8173 1
103929 [일반] 대구 2호선 역세권 대형교회 출석 만 4년차 후기(중소-대형 이동) [26] SAS Tony Parker 10305 25/03/17 10305 1
103927 [일반] AMD. 2월 판매량 인텔 압도 [59] SAS Tony Parker 12244 25/03/16 12244 0
103892 [일반] 소매업체, RX 9070 “MSRP”는 첫 배송에만 적용.가격은 추후 인상될 예정 [25] SAS Tony Parker 6408 25/03/07 6408 0
103862 [일반] 수능킬러문제는 '따위'로 만들어 버리는 GPT 딥리서치 한달 사용후기 (딥리서치에 물어볼 질문도 받음) [77] Quantumwk11928 25/03/02 11928 15
103852 [일반] RX 9070 / XT 시리즈 그래픽 카드 중국 가격 공개 [35] SAS Tony Parker 7390 25/02/28 7390 1
103849 [일반] 주식투자관련해서 개인적으로 중요하다 생각하는 원칙 3개 [33] Quantumwk6328 25/02/28 6328 5
103725 [일반] 생성형 AI 뭘 써야 할까? 유료결제가 필요할까? - 모델 별 평가와 가이드 [120] Quantumwk13312 25/02/09 13312 20
103704 [일반] 그간 감사하고 죄송했습니다(자운위 사퇴) [174] SAS Tony Parker 15764 25/02/07 15764 59
103682 [일반] 보고서 쓰는 인력은 필요 없어질까요? - 서울 부동산에 대한 AI의 보고서 [59] Quantumwk9941 25/02/05 9941 0
103655 [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 [1] Quantumwk5726 25/02/02 5726 0
103651 [일반] AI가 수능 수학 킬러문제도 맞추네요 - 오류 발견, 수정 글 추가 작성 [59] Quantumwk12370 25/02/01 12370 2
103636 [일반] 음향기기 그룹 마샬, 중국 HongShan Capital Group에 인수 [11] SAS Tony Parker 9009 25/01/29 9009 3
103595 [정치] 유튜브와 확증편향의 세계 [60] SkyClouD10198 25/01/23 10198 0
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로