오픈AI, 더 똑똑한 고급 추론 AI 'o3' 공개…"수학, 과학 추론"
입력2024.12.22.
o3는 지난 9월 오픈AI가 출시한 추론 모델 'o1'의 업그레이드 버전이다. 이날 오픈AI는 소형 모델인 'o3 미니'도 함께 선보였다. 샘 올트먼 오픈AI 최고경영자(CEO)는 "내년 1월 말 o3 미니를 먼저 출시하고 곧이어 o3를 내놓을 예정"이라고 말했다.
추론 능력에 초점을 둔 o3는 o1과 마찬가지로 응답하기 전에 먼저 생각하도록 훈련됐다. 작업을 추론하고 계획할 수 있으며, 오랜 기간에 걸친 작업에 필요한 해결책을 찾는 데 도움이 된다는 게 오픈AI의 설명이다.
오픈AI는 "o3은 응답하는 데 몇 초∼몇 분이 걸리지만 o1에 비해 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다"라고 강조했다. 특정 조건에서는 o3가 범용인공지능(AGI)에 가까워졌다고 덧붙였다.
o3는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한다. 이후 가장 정확하다고 생각되는 응답을 요약한다. 특히 o3에서는 '추론 시간 조정'이 새롭게 도입됐다. 이용자는 연산 시간, 즉 o3의 사고 시간을 '낮음, 중간, 높음'으로 설정할 수 있는데 연산 시간이 길수록 성능은 더 좋아진다.
오픈AI는 o3가 벤치마크(성능 측정)에서 다른 모델을 압도한다고 설명했다. 프로그래밍 작업에 초점을 맞춘 벤치마크(SWE-Bench Verified)에서 o3는 o1보다 22.8%포인트 높은 성능을 보였다. 코딩 실력 측정 지표(Codeforces)에서는 2727점을 기록했다.
올해 미국 초청 수학 시험(AIME)에서 o3는 단 한 문제만 틀려 96.7%의 점수를 기록했다. 대학원 수준의 생물학, 물리학, 화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다.
o3의 공개로 구글과 메타의 AI 모델과 경쟁이 한층 빨라질 전망이다. 구글은 이달 초 '제미나이 2.0'을 발표했다. 이전 모델보다 두 배 더 빠르며 "생각하고, 기억하고, 계획하고, 심지어 대신 조치를 취할 수 있다"고 구글은 설명했다. 페이스북 메타플랫폼도 내년 '라마 4'를 출시할 예정이다.
이채린 기자 rini113@donga.com
'정보 !일반 상식 이야기' 카테고리의 다른 글
6.25전쟁에서 한국이 살아남은 ‘5가지 기적’ (0) | 2024.12.22 |
---|---|
"체중 줄이고 근육량 늘려"...'이 음식' 적당히 먹으면 건강, 몸매 관리에 도움 (0) | 2024.12.22 |
‘모바일 신분증’ 발급 400만명 돌파…내년엔 ‘주민등록증’도 스마트폰에 쏙 (0) | 2024.12.21 |
생성형AI의 진화 ‘AI 에이전트’, 기존 AI 비서와 뭐가 다를까? (0) | 2024.12.21 |
스마트워치 차면 암 위험 높아진다? ‘이것’이 문제 (0) | 2024.12.20 |