27일 교도통신 보도에 따르면 ChatGPT가 도쿄대·교토대 입시에서 최고점을 넘어섰지만, 논술·맥락 이해 등에서는 한계를 드러냈다. 사진 픽셀즈
생성형 인공지능 ‘ChatGPT’가 일본 도쿄대와 교토대 입학시험에서 합격자 최고점을 넘어 ‘수석 합격’ 수준의 성적을 기록한 것으로 나타났다.
27일 교도통신 보도에 따르면, 현지 AI 벤처 기업 라이프프롬프트의 분석 결과, OpenAI의 ‘ChatGPT-5.2 싱킹’ 모델을 활용해 양 대학의 2차 시험 문제를 풀린 결과 이 같은 성과가 확인됐다. 문제는 이미지 데이터 형태로 입력됐으며, 서술형 답안은 대형 입시학원 강사가 채점했다.
채점 결과 도쿄대(550점 만점 기준)에서 AI는 인문계 452점, 자연계 503점을 기록했다. 이는 도쿄대가 발표한 실제 합격 최고점(인문계 434점, 자연계 453점)을 모두 상회하는 수치다. 특히 최상위 학과인 이과 3류 기준 최고점보다 50점 높은 점수를 기록한 것으로 나타났다.
과목별로 보면 수학은 난도가 높았음에도 불구하고 만점을 기록했고, 영어 역시 약 90%의 높은 정답률을 보였다. 반면 세계사 등 논술형 문제에서는 약 25% 수준에 그쳐 취약한 모습을 드러냈다.
이 같은 결과는 불과 2년 전인 2024년 도쿄대 입시에서 전 계열 불합격에 머물렀던 것과 비교해 급격한 성능 향상을 보여준다.
전문가들은 생성형 AI의 구조적 한계를 함께 지적한다. AI는 의미를 이해해 답을 도출하기보다, 확률적으로 가장 적절한 단어를 선택하는 방식으로 작동한다. 이에 따라 정답이 명확하고 지식 기반으로 해결 가능한 수학·영어 등에서는 강점을 보이지만, 문제 의도 파악이나 논리적 서술, 역사적 맥락 이해가 필요한 영역에서는 낮은 성과를 보인다는 분석이다.
또한 AI는 도표나 그림 해석, 인간의 감정 이해에서도 한계를 드러냈다. 국어 소설 문제에서 모든 모델이 오답을 선택한 사례가 있었다.
전문가들은 생성형 AI가 높은 성능에도 불구하고 윤리 판단, 맥락 이해, 인간 심리 해석 능력은 아직 미흡하다고 평가한다. 이에 따라 실제 활용 시에는 반드시 사실 검증을 병행하고, 인간의 관리·감독 아래에서 신중히 활용해야 한다고 강조했다.