더스쿠프'sinfographic 인포그래픽으로 본 세상 그간 폐쇄형AI모델이 주류 오픈소스AI빠르게 따라잡아 대표적인 예로 딥시크 있어 시장 주도권 오픈소스가 잡아 한눈으로 살펴보는AI진화론
AI개발사들이 오픈소스 모델을 통해 자사AI의 성능을 빠르게 끌어올리고 있다.[사진|연합뉴스]
2022년 11월 오픈AI가 챗GPT를 세상에 내놨으니, 생성형AI가 붐을 일으킨 지도 2년이 흘렀다. 생성형AI는 과연 어디까지 진화했을까.[※참고: 생성형AI는 기존 데이터를 학습해 새로운 텍스트·이미지·음악 등 콘텐츠를 만드는AI기술을 일컫는다.]
생성형AI의 흐름은 2023년을 분기점으로 두개로 나뉘어 있다. 2023년까지 이어진 폐쇄형과 2023년부터 유행을 끈 오픈소스(개방형)다. 최근 시장에 반향을 불러일으킨 딥시크의AI가 바로 오픈소스 모델이다(표❶).
딥시크 혁신을 통해AI진화론을 따라가보자. 지금까지AI기술은 (AI의) 작동 방식을 외부에 공개하지 않는 폐쇄형 모델이 이끌어왔다(표❷). 폐쇄형 모델은 중요한 정보나 기술을 자사만 보유하고 있어서 시장경쟁력이 높다. 오픈AI의 챗GPT와 구글의 '제미나이'가 대표적인데, 이 둘은 어떤 경쟁력을 가지고 있을까.
지난해 12월에 출시한 챗GPT의 최신 모델 'o1'을 살펴보자.o1은 높은 수준의 추론을 요구하는 과학·수학·코딩 문제를 해결한다. 오픈AI에 따르면o1은AI벤치마크 테스트에서'AIME2024(수학)'는 78.0%, '코드포스(코딩)' 89.0%,'GPQA다이아몬드(박사 수준 과학 문제)' 76.0%의 정확도를 기록했다.
오픈AI는o1을 두고 "외부 전문 테스터의 평가에서o1은 더욱 신뢰할 수 있는 응답을 생성했다는 평가를 받았다"며 "전작에 비해 더 나은 성과를 보였는데 특히 코딩 문제에선 오류가 75% 감소했다"고 말했다.
챗GPT가 처음 출시된 지 4개월이 흐른 후 구글이 제미나이를 내놓았다. 제미나이는 번역과 같은 언어 표현 성능이 우수하다는 평가를 받는다. 상위 모델인 '제미나이 1.0 울트라'는 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. 이는 인간 전문가 점수인 89.8%를 넘는 수준이었다(표❸).
이런 와중에AI후발주자들이 '오픈소스 모델'을 앞세워 빠르게 성능을 끌어올리고 있다. 오픈소스 모델은AI의 개발 정보를 대중에게 공개한 거다. 많은 사람들이 이용해볼 수 있는 만큼 기능 개선이 빠르고 생태계 확장에 용이하단 장점이 있다. '메타' '앤스로픽' '딥시크'가 오픈소스AI모델을 개발하고 있다.
메타는 최신 모델 '라마 3(2024년 4월 공개)'을 운영하고 있는데, 라마 3은MMLU에서 정답률 88.6%를 기록해GPT-4o(88.7%)를 턱밑까지 추격하는 데 성공했다.[※참고:GPT-4o는o1의 직전 모델로 2024년 5월 공개됐다.] 비영어권 언어에서의 성능도 영어와 비슷한 수준으로 올렸다는 평을 받았다.
[일러스트 | 게티이미지뱅크]
앤스로픽의 '클로드V3'모델은 작문과 언어 면에서 뛰어난 성능을 보인다. 한문, 고대 그리스어, 고대 영어를 지원한다는 점이 특징이다. 앤스로픽에 따르면 가장 고성능 모델인 '오푸스'는 벤치마크에서GPT-4(2023년 3월 공개)를 비롯한 당시 경쟁사들의 최신 모델보다 앞선 성능을 보였다. 멘사IQ테스트에선 최초로IQ100을 넘겼다(표❹).
딥시크는 단기간에 성능을 챗GPT수준으로 크게 올려AI시장에서 큰 주목을 받았다. 지난 1월 세상에 내놓은 '딥시크-R1'는 고사양AI칩 없이o1보다 좋은 성과를 냈다. 특히GPT의 가장 큰 장점인 코딩 분야에도o1을 0.3%포인트 차이로 거의 따라잡았다(표❺).
업계는AI주도권이 이젠 오픈소스 모델로 향하고 있다고 평가하고 있다. 딥시크가 등장한AI시장은 앞으로 어떻게 흐를까.