정보 !일반 상식 이야기

오픈AI, 더 똑똑한 고급 추론 AI 'o3' 공개…"수학, 과학 추론"

하나님아들 2024. 12. 22. 20:19

오픈AI, 더 똑똑한 고급 추론 AI 'o3' 공개…"수학, 과학 추론"

입력2024.12.22. 
 
인공지능(AI)을 표현한 이미지. 게티이미지뱅크 제공
GPT를 개발한 오픈AI가 한층 향상된 고급 추론(reasoning) 인공지능(AI) 모델 'o3'를 20일(현지시간) 공개했다.

o3는 지난 9월 오픈AI가 출시한 추론 모델 'o1'의 업그레이드 버전이다. 이날 오픈AI는 소형 모델인 'o3 미니'도 함께 선보였다. 샘 올트먼 오픈AI 최고경영자(CEO)는 "내년 1월 말 o3 미니를 먼저 출시하고 곧이어 o3를 내놓을 예정"이라고 말했다.

추론 능력에 초점을 둔 o3 o1과 마찬가지로 응답하기 전에 먼저 생각하도록 훈련됐다. 작업을 추론하고 계획할 수 있으며, 오랜 기간에 걸친 작업에 필요한 해결책을 찾는 데 도움이 된다는 게 오픈AI의 설명이다.

오픈AI는 "o3은 응답하는 데 몇 초∼몇 분이 걸리지만 o1에 비해 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다"라고 강조했다. 특정 조건에서는 o3가 범용인공지능(AGI)에 가까워졌다고 덧붙였다.

o3는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한다. 이후 가장 정확하다고 생각되는 응답을 요약한다. 특히 o3에서는 '추론 시간 조정'이 새롭게 도입됐다. 이용자는 연산 시간, 즉 o3의 사고 시간을 '낮음, 중간, 높음'으로 설정할 수 있는데 연산 시간이 길수록 성능은 더 좋아진다.

오픈AI o3가 벤치마크(성능 측정)에서 다른 모델을 압도한다고 설명했다. 프로그래밍 작업에 초점을 맞춘 벤치마크(SWE-Bench Verified)에서 o3 o1보다 22.8%포인트 높은 성능을 보였다. 코딩 실력 측정 지표(Codeforces)에서는 2727점을 기록했다.

올해 미국 초청 수학 시험(AIME)에서 o3는 단 한 문제만 틀려 96.7%의 점수를 기록했다. 대학원 수준의 생물학, 물리학, 화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다.

o3의 공개로 구글과 메타의 AI 모델과 경쟁이 한층 빨라질 전망이다. 구글은 이달 초 '제미나이 2.0'을 발표했다. 이전 모델보다 두 배 더 빠르며 "생각하고, 기억하고, 계획하고, 심지어 대신 조치를 취할 수 있다"고 구글은 설명했다. 페이스북 메타플랫폼도 내년 '라마 4'를 출시할 예정이다.

이채린 기자 rini113@donga.com