PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2219
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2205
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
103728 [일반] [서평]《명령에 따랐을 뿐!?》 - 부도덕한 명령에 저항하는 길을 찾고자 한 어느 신경과학자의 분투 [14] 계층방정5612 25/02/10 5612 6
103727 [정치] 민주주의에 대해서 다시 생각해 보게 된 방송. [19] 굿샷12393 25/02/10 12393 0
103726 [일반] <9월 5일: 위험한 특종> - 미디어의 맨얼굴을 보다.(노스포) [11] aDayInTheLife5794 25/02/10 5794 5
103725 [일반] 생성형 AI 뭘 써야 할까? 유료결제가 필요할까? - 모델 별 평가와 가이드 [120] Quantumwk15246 25/02/09 15246 20
103724 [일반] [일상수필] 성공(LSD)과 실패(딸기케이크) 그리고 어머니의 꽃게탕은 맛있고 [5] 판을흔들어라4317 25/02/09 4317 0
103723 [일반] 과연 결혼과 출산율은 올라갈수 있을것인가?? [113] 한사영우10570 25/02/09 10570 7
103722 [일반] 유료화 임박 웹툰 추천-<이발소 밑 게임가게> 부제: 명불허전 하일권 [9] lasd2416343 25/02/09 6343 4
103721 [일반] 마우스 포테이토에서 MY FAMICOM EXHIBITION 을 관람하고 왔습니다. [2] 及時雨3681 25/02/09 3681 2
103719 [일반] 웹소설은 왜 이렇게 되었을까? [106] 김김김10182 25/02/09 10182 18
103718 [일반] 무엇이 한국을 분열시킬 수 있는가 [67] meson8937 25/02/09 8937 9
103717 [일반] 티베트 지하 어딘가에 있다는 전설의 지하왕국, 샴발라 [18] 식별8611 25/02/09 8611 10
103716 [일반] [팝송] 제가 생각하는 2024 최고의 앨범 Best 15 [10] 김치찌개6206 25/02/09 6206 14
103715 [일반] 샘 알트만 도쿄대 질의응답 번역 [17] Q-tip10887 25/02/08 10887 9
103714 [일반] 전설의 지하왕국 아가르타와 지구 공동설을 알아보자 [9] 식별7553 25/02/08 7553 18
103713 [일반] 2차대전 종전 후 세계에서 트럼프만큼 역사를 혼자 바꾼 사람은 없겠죠?? [28] 홍철8345 25/02/08 8345 1
103712 [일반] 검찰에서 악마를 다시 만났다. [44] 간옹손건미축10716 25/02/08 10716 30
103711 [일반] 『눈물을 마시는 새』 재론 - 눈부시게 잔혹한 이야기 [11] meson4559 25/02/08 4559 6
103710 [일반] 주말엔 고양이 아닐까요? [25] 대단하다대단해5541 25/02/08 5541 23
103706 [일반] 게임게시판 등의 운영 방치 및 전반적 운영 개선에 대하여 [66] 퍼그8453 25/02/08 8453 16
103705 [일반] 글로벌 DeepSeek 논란 정리 [26] 스폰지뚱9802 25/02/08 9802 15
103704 [일반] 그간 감사하고 죄송했습니다(자운위 사퇴) [174] SAS Tony Parker 16527 25/02/07 16527 59
103703 [정치] 유시민에 대한 변 [183] 발이시려워18539 25/02/07 18539 0
103702 [일반] (삼국지) 남중 정벌 : 북벌의 전초전 (1) [19] 글곰7454 25/02/07 7454 23
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로