PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2219
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2205
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
103774 [일반] 소리로 찾아가는 한자 76. 천간 무(戊)·도끼 월(戉)에서 파생된 한자들 [9] 계층방정4576 25/02/14 4576 6
103773 [일반] AI 다단계추론에 감탄하며 [8] 초식성육식동물 8368 25/02/14 8368 1
103772 [일반] 국제우주정거장(ISS) 고립 우주비행사 2명, 9개월만에 귀환 예정 [27] 철판닭갈비10166 25/02/14 10166 4
103771 [일반] 평화협정 속도 내는 트럼프-푸틴…우크라·유럽은 '더티 딜' 경계, [86] 마그데부르크11821 25/02/14 11821 12
103770 [일반] [잡담] 서울이야.. 맞아, 서울이야. [20] 언뜻 유재석9029 25/02/14 9029 23
103769 [일반] 한겨울에 따뜻하게 찍어본 ILLIT 'Lucky Girl Syndrome' 커버 영상. [6] 메존일각5071 25/02/13 5071 8
103767 [일반] 중증외상센터 드라마와는 다른 현실 결말 [168] 홈스위트홈14356 25/02/13 14356 22
103766 [일반] BYD가 열어가는 전기차 대중화와 미래 경쟁 구도 [70] superiordd10000 25/02/13 10000 11
103765 [일반] 미국 빅테크 기업은 왜 주가가 높은가 [40] 번개맞은씨앗9474 25/02/13 9474 8
103764 [일반] 캡틴 아메리카 브레이브 뉴월드 (스포다량) [8] ph4980 25/02/13 4980 0
103763 [일반] GPT-4.5, 25년 1분기. GPT-5 25년 12월 예상 / 레딧 현자의 예상 [13] Q-tip7194 25/02/13 7194 8
103762 [일반] 김치 프리미엄이 붙은 금 가격 [31] 굄성8326 25/02/13 8326 1
103761 [일반] 트럼프 "MAGA는 용서 안해"…야유받은 테일러 스위프트에 뒤끝' [59] 마그데부르크9921 25/02/13 9921 2
103760 [일반] 수출과 무역적자에 대한 생각 [53] 번개맞은씨앗9742 25/02/13 9742 2
103759 [일반] <캡틴 아메리카: 브레이브 뉴 월드> - 이 정도면 준수한 증명.(노스포)) [56] aDayInTheLife7651 25/02/12 7651 8
103758 [일반] 25년의 소소한 일상 [4] 싸구려신사4670 25/02/12 4670 6
103757 [일반] 딸아이와 함께 진엔딩을 보았습니다 [38] 글곰9547 25/02/12 9547 109
103756 [일반] [동네약국 사용설명서#2] 이름은 달라도 같은 약입니다. [54] 우파아니고보수6887 25/02/12 6887 13
103755 [일반] [설문] "AI"는 과대평가되어 있는가 [82] 슈테판7026 25/02/12 7026 1
103754 [일반] 트럼프 "가자지구 미국이 사는게 아냐.. 가지는 것." [106] 전기쥐10216 25/02/12 10216 10
103752 [일반] 이런저런 이야기 [4] 공기청정기6573 25/02/12 6573 7
103751 [일반] AI 경제학 이야기 (대런 아세모글루 MIT 명예교수/노벨경제학상 수상자) [37] 스폰지뚱7175 25/02/12 7175 10
103750 [일반] 소리로 찾아가는 한자 75. 고무래/장정 정(丁)에서 파생된 한자들 [12] 계층방정4259 25/02/11 4259 3
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로