- 홈
- 공공수어마당
- e브리핑
e브리핑
[과학기술정보통신부] 독자 AI 파운데이션 모델 프로젝트 1차 단계 평가 결과 (2026. 1. 15.)
관리자
·
2026.01.20
·
62
|
|
|
안녕하십니까? 과기정통부 제2차관 류제명입니다. 지금부터 독자 AI 파운데이션 모델 프로젝트 1차 단계 평가 결과에 대해 설명드리겠습니다. 먼저, 이번 독자 AI 파운데이션 모델 프로젝트의 취지 및 성과에 대해 말씀드리겠습니다. 정부는 글로벌 AI모델 의존으로 인한 기술·문화·경제·안보적 종속 문제를 해소하는 한편, 미국·중국에 버금가는 AI 3강 도약을 위한 핵심 과제로 우리가 스스로 개발·고도화하고 자유롭게 이용할 수 있는 독자 AI 파운데이션 모델 개발을 새 정부 핵심 프로젝트로 추진해 왔습니다. 작년 8월 프로젝트를 착수하고 정예팀 간 치열한 경쟁을 지속해 온 결과, 5개 정예팀이 개발한 독자 AI 파운데이션 모델이 모두 AI... 미국 AI 연구기관인 Epoch AI의 '주목할 만한 AI 모델'에 등재되는 성과를 거두기도 했습니다. 참고로 2025년 기준 국가별 주목할 만한 AI모델은 2026년 1월 14일 기준으로 미국이 43개로 1위이고, 중국이 30개로 2위, 그 뒤를 이어서 우리나라가 8개 모델이 주목할 만한 AI 모델로 등재되었습니다. 나머지 국가들은, 프랑스, 싱가폴, 영국 같은 나라들은 각각 1개가 등재돼 있는 데 불과합니다. 아울러, 이번 프로젝트를 통해 우리 AI 업계 전반에 대한민국 AI도 할 수 있다는 분위기가 조성되며 국내 AI 기업, 학계, 연구계 간 전방위적 협력과 선의의 혁신 경쟁이 확대되었습니다. 참고로 말씀드리면 정예팀에 참여한 LG AI연구원의 K-EXAONE, 또 네이버클라우드의 HyperCLOVA X SEEDThink(32B모델), 또 업스테이지의 Solar Pro2 AI모델뿐만 아니라 모티프테크놀로지스의 모델 그리고 KT가 개발한 AI모델도 미국 Artificial Analysis의 글로벌 AI모델 성능 평가 리더보드에 등재되고 있는 상황입니다. 특히 우리 인재들이 대규모 GPU 클러스터를 활용하여 모델을 개발하는 과정에서 쌓인 경험, 노하우는 우리나라 AI의 큰 자산이 되었다는 점에서 이번 프로젝트의 의의가 매우 크다고 생각합니다. 그러면 1차 단계 평가 결과를 말씀드리겠습니다. 평가 결과를 세부적으로 말씀드리기에 앞서 오늘 평가 결과에 대해 AI 업계뿐만 아니라 국민들께서도 관심이 매우 높은 것으로 알고 있습니다. 이번 프로젝트의 목적을 다시 돌이켜보면 프로젝트의 최종 승자를 가려내기 위한 그런 과정이 아니라 경쟁을 통해 우리나라 AI 기업들의 경쟁력을 글로벌 수준으로 끌어올리는 것이 가장 중요한 목표였다는 점을 다시 한번 말씀드리고 싶습니다. 이런 관점에서 프로젝트 평가 기준 그리고 결과를 투명하게 공개한다는 원칙과 아울러 우리 참가 기업들이 평가 결과 공개로 인해 예기치 않게 있게 될 직·간접적인 피해로부터 보호를 하는 것도 매우 중요한 가치라고 생각합니다. 정부는 이러한 두 가치를 균형 있게 고려하여 평가에 대한 세부 기준과 과정은 상세하게 공개를 하되, 개별 기업들의 구체적인 점수 등에 대해서는 가급적 언급을 자제하겠습니다. 다만, 개별 기업들에게는 평가 결과의 세부적인 내용과 2차 단계 진출팀 선정에 대한 구체적인 사유 등에 대해 소상하게 설명하도록 할 것입니다. 그러면 지금부터 1차 단계 평가 결과를 말씀드리겠습니다. 과기정통부는 NIPA 그리고 5개 정예팀과 여러 차례 심층 협의를 진행하며 1차 단계 평가 방안을 마련하였습니다. 1차 단계 평가에서는 첫째, 벤치마크, 두 번째, 전문가, 세 번째, 사용자 평가를 추진하며 AI모델의 성능과 실제 현장에서의 활용 가능성, 모델 크기 등의 비용 효율성을 포함한 AI 사용성, 파급 효과 등을 종합 평가하였습니다. LG AI연구원이 총 90.2점으로 가장 우수한 평가를 받았고, 5개 정예팀의 평균은 79.7점이었습니다. 각 세부 평가별로 상세히 말씀드리겠습니다. 첫 번째, 벤치마크 평가 결과입니다. 벤치마크 평가는 총 40점 배점으로 NIA의 벤치마크 평가가 10점, 글로벌 공통 벤치마크 평가가 20점, 글로벌 개별 벤치마크 평가 10점으로 구성되었습니다. 첫째, NIA의 벤치마크 평가에서는 수학, 지식, 장문이해, 안전·신뢰성에 대한 평가가 진행되었고, SK텔레콤과 LG AI연구원이 10점 만점 중 9.2점으로 최고 평가를 받았습니다. 둘째, 글로벌 공통 벤치마크 평가의 경우 에이전트, 수학, 지식·추론 등 세계적으로 인정되는 벤치마크 13종에 대한 평가가 이루어졌으며, LG AI연구원이 20점 만점 중 14.4점으로 최고점을 기록했습니다. 셋째, 글로벌 개별 벤치마크 평가는 정예팀별 글로벌 타깃 모델과 비교 가능한 벤치마크 5종을 선정하여 평가가 진행되었으며, 업스테이지와 LG AI연구원이 10점 만점 중 10점으로 최고점을 득점했습니다. 위 세 가지 벤치마크 평가를 종합한 결과, LG AI연구원이 총 33.6점으로 가장 높은 평가를 받았으며, 평균은 30.4점이었습니다. 두 번째, 전문가 평가 결과입니다. 전문가 평가는 총 35점 배점으로 총 10명의 산학연 외부 AI 전문가로 구성된 평가위원회를 운영하여 개발 전략 및 기술, 개발 성과 및 계획, 파급효과 및 기여계획을 다각적으로 평가했습니다. 평가위원들은 정예팀이 공개한 테크니컬 리포트, AI모델 훈련 상태 로그 등을 심층 분석하여 정예팀의 기술개발 과정, 독자성을 포함한 기술력 등을 종합적으로 검토하였습니다. 전문가 평가에서는 LG AI연구원이 35점 만점 중 31.6점으로 가장 높은 평가를 받았습니다. 평균은 28.5점입니다. 다음으로는 세 번째, 사용자 평가 결과입니다. 사용자 평가는 총 25점을 배점으로 AI 스타트업 대표 등 49명의 AI 전문 사용자가 참여한 가운데, 실제 현장에서 AI모델의 활용 가능성과 추론 비용 효율성 등을 포함한 AI 사용성 평가를 심층적으로 진행하였습니다. 그 결과, LG AI연구원이 25점 만점 중 25점으로 가장 높은 평가를 받았으며, 평균은 20.7점입니다. 이상의 벤치마크, 전문가, 사용자 세 가지 평가점수를 종합한 결과 LG AI연구원, 네이버클라우드, SK텔레콤, 업스테이지가 4개 팀에 포함되었습니다. 다음으로, 이번 프로젝트의 핵심이라 할 수 있는 각 정예팀 모델에 대한 독자성 분석 결과에 대해 말씀드리겠습니다. 프로젝트 공모 안내서에서도 독자 AI 파운데이션 모델을 해외 모델 미세조정 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전학습 과정 등을 수행한 국산 모델로서 타사 모델에 대한 라이선싱 이슈가 없는 것을 의미한다고 제시한 바 있습니다. 이러한 측면에서 각 정예팀이 개발한 모델의 독자성 여부를 기술적·정책적·윤리적 세 가지 측면에서 심층적으로 분석했습니다. 첫째, 기술적 측면에서는 독창적 AI모델 아키텍처 설계부터, 대량의 데이터를 스스로 확보·가공하고, 독자적 학습 알고리즘 기법 적용 등을 통해 전 과정 학습을 수행한 'AI모델의 독자적 구현'을 지향합니다. 최근 글로벌 AI 생태계에서 오픈소스를 활용하는 것이 일반적인 추세이기는 하나 국내외 AI 업계·학계에서 통용되는 독자 AI모델의 기본조건은 가중치를 초기화한 후 학습하면서 AI모델을 개발, 즉 가중치를 형성·최적화하는 것으로 볼 수 있습니다. 따라서, 정예팀도 검증된 기술 활용과 글로벌 AI 생태계와의 정합성 확보 등을 위해 검증된 오픈소스를 전략적으로 활용하더라도 가중치를 초기화한 후 학습·개발을 수행하는 것이 모델의 독자성 확보를 위한 최소조건이라고 판단하였습니다. 둘째, 정책적 측면에서는 국방·외교·안보 그리고 전력망·교통·통신망 등 국가 인프라 등에 외산 AI모델을 활용할 경우 국가 기밀 유출 우려나 국가 안보에 대한 위협 등이 발생할 가능성을 해소하기 위해 AI모델을 언제든 스스로 개발·고도화할 수 있고, 어떠한 상황에서도 주체적으로 AI모델의 운영·이용을 통제할 수 있는 역량을 확보하는 것을 지향합니다. 즉, 완전한 우리 기술로 AI모델을 개발하거나 라이선스 제약 없는 오픈소스를 활용해 스스로 개발·고도화할 수 있어야 하며, 오픈소스 활용으로 인한 외부의 통제와 간섭으로부터 자유로울 수 있어야 할 것입니다. 셋째, 윤리적 측면입니다. 오픈소스 활용에 대한 레퍼런스 고지 등 라이선스 정책을 준수함으로써 모델의 신뢰 확보와 공개 검증 강화, 투명성을 제고하여 AI 생태계의 건전한 발전을 도모해야 할 필요가 있습니다. 이러한 세 가지 관점을 고려 시, 과기정통부는 네이버클라우드 정예팀의 AI모델이 기술적·정책적 부분에서 독자성 기준을 충족하지 못하는 것으로 판단했으며, 전문가 평가위원들도 네이버클라우드의 기술적 독자성에 대한 한계를 지적하였습니다. 결론적으로 네이버클라우드 컨소시엄은 본 프로젝트의 기준을 충족하지 못한다고 판단되는바, 독자 AI 파운데이션 모델 조건에 부합하지 못하는 것으로 결정하였습니다. 그 결과, 1차 단계 평가를 거쳐 기존 5개 정예팀 중 LG AI연구원, 업스테이지, SKT 정예팀이 2차 단계로 진출하게 되었습니다. 마지막으로, 향후계획을 말씀드리겠습니다. 과기정통부는 이번 프로젝트가 모든 참여 기업이 글로벌 수준으로 도약할 수 있는 기회를 주는 모두가 승자인 결과를 도출하는 데 그 목적이 있었던 만큼 공석이 된 네 번째 자리를 최초 프로젝트 공모에 접수한 컨소시엄, 그리고 이번 1차 단계 평가 탈락 컨소시엄, 그 외 역량 있는 기업 등 모두에게 기회를 열어 독자 AI 파운데이션 모델 개발 역량을 갖춘 정예팀 1곳을 추가로 선정할 계획입니다. 추가로 선정되는 정예팀에게는 GPU 데이터 지원, 'K-AI 기업' 명칭 부여 등 독자 AI 파운데이션 모델 개발에 도전할 수 있는 기회를 제공할 예정이며, 행정적 절차를 조속히 진행하여 정예팀 1곳의 추가 공모를 신속히 추진하고 다른 3개 정예팀과 동일한 수준의 지원이 이루어지도록 노력할 계획입니다. 이번 프로젝트는 대한민국이 글로벌 AI 경쟁에서 독자적 기술로 당당히 맞서기 위한 역사적 도전이며, 정부는 독자 AI 파운데이션 모델을 반드시 확보하여 지속 가능하고 건강한 AI 생태계를 구축하고 대한민국이 글로벌 AI 기술 경쟁의 선두에, 선두 대열에 설 수 있도록 가용한 모든 국가 역량과 자원을 집중하는 등 글로벌 톱 수준의 모델 개발을 위한 기술혁신 경쟁을 계속 이어나갈 것입니다. 이상으로 브리핑을 마치겠습니다. 질의응답을 시작하기에 앞서 한 가지 부탁을 드리고 싶습니다. 저는 이번 프로젝트에 직접 참여한 모든 기업들과 개발자들이, 그리고 1단계에 포함되지 않은 우리 AI 기업들이 얼마나 치열한 노력을 해왔는지 잘 알고 있습니다. 앞서 말씀드린 대로 이 프로젝트를 통해 벌써 많은 가시적 성과를 만들어 내고 있습니다. 모두가 승자입니다. 그리고 모두가 우리나라 AI 3강을 만들 주역들입니다. 2단계에 포함되지 못한 기업들과 개발자들 그리고 관계자들 그리고 글로벌 AI 경쟁에서 치열하게 노력하고 있는 나머지 우리 AI 기업들에게도 아낌없는 격려와 응원 부탁드리겠습니다. 정부도 지원을 아끼지 않겠습니다. 지금부터 질의·응답을 받도록 하겠습니다. [질문·답변] ※마이크 미사용으로 확인되지 않는 내용은 별표(***)로 표기하였으니 양해 바랍니다. <질문> 안녕하세요? 추가 1개 팀 모집을 할 때 선발 기준이나 심사 시기가 궁금하고요. 그리고 예비심사에서 떨어진 기업들에게도 기회가 주어지는지 말씀 부탁드립니다. <답변> 말씀드린 대로 지금 평가가 아시다시피 지금 최대한 신속하게 마무리를 하고 바로 발표를 드리는 것이기 때문에, 그리고 또 1곳이 네 번째 자리가 공석이 된 그런 예기치 못한 상황이 발생했기 때문에 2단계에 참여할 새로운 기업을 공모하는 과정은 저희가 최초 프로젝트를 설계했을 때 그런 것들을 참조해서 최대한 빨리 행정절차를 마무리할 것이고요. 브리핑에서도 말씀드린 것처럼 이번에 2단계에 참여하지 못한 기업들뿐만 아니라 1단계 평가에서 합류하지 못하신 10개의 컨소시엄 그리고 또 새롭게 컨소시엄을 구성할 역량 있는 기업들에게 기회를 모두 드리려고 합니다. 가장 빠른 시간 내에 공고가 이루어질 수 있도록 하고 행정절차를 최대한 조속하게 마무리할 계획입니다. <질문> 안녕하세요? 아무래도 '모두가 승자'라고 말씀을 강조해 주셨지만 짚고 넘어가고 싶은 부분이 독자성 관련해서 논란이 있었지 않았습니까? 그래서 그 부분 설명도 좀 해... 세 가지 측면에서 설명을 해주시긴 했는데요. '종합적으로 고려해서 네이버 클라우드가 탈락을 하게 됐다.'라고 말씀을 해주셨는데, 네이버 클라우드 같은 경우에 인코더 부분에서 조금 문제가 있었던 걸로 알고 있습니다. 그래서 세 가지 측면에서 구체적으로 어떤, 예를 들어 인코더의 뭐, 가중치라든지 이런 부분에서 기술적 측면에서 요건이 달성되지 않았다든지 이런 구체적인 설명이 있어야 2차 평가에서도 관련된 논란을 대응하는 데 더 도움이 될 것 같아서 구체적인, 조금 더 구체적인 설명 부탁드리겠습니다. <답변> 네이버가 지금 공개한 기술보고서에서도 언급이 돼 있습니다. 언급이 돼 있고, 문제가 된 비디오 인코더, 오디오 인코더에 대해서 저희가 기술적·정책적·윤리적 측면에서 세 가지, 조금 더 세분화해서 평가를 분석해 봤을 때 모두에 말씀드린 대로 공모안내서에 독자 파운데이션을... 독자 AI 파운데이션 모델이 갖춰야 될 기본적인 조건들이 거기에 포함돼 있습니다. 그런 측면에서 보았을 때 특히 가중치를 직접, 기존의 오픈 모델을 활용했다 하더라도 그걸 깨끗이 비우고 스스로 확보한 데이터를 가지고 가중치를 채워나가는 그런 실제적인 일들이 이루어지고, 그래서 그런 경험들이 입증이 되고 검증이 됐어야 되는데 가중치를 그대로 갖다 쓴 그런 부분에 대해서 기술보고서에서도 언급이 돼 있어서, 저희가 또 평가위원들도 그러시고 저희가 분석을 했을 때도 그 부분에 기술적 측면에서의 문제, 그리고 라이선싱 이슈가 없는 오픈소스를 활용한 건 맞습니다. Apache 2 단계 오픈소스라는 것이 라이선싱 이슈에 자유로운 그런 조건이긴 합니다만 여러 가지 측면에서 우리가 본질적으로 독자 AI 파운데이션 모델을 지향하는 그런, 어떤 조건에서도 처음부터 스스로 직접 설계하고 학습을 한, 그런 것들을 충족하지 못하는 점에서 일부 기준에 안 맞은 그런 점들을 저희가 좀 그런 사유로 보았다는 점을 말씀드리겠습니다. 그리고 평가위원들께서도 그런 부분들에 대해서는 이런 프로젝트가 지향하는 그런 부분의 기술적 요건에 좀 미흡했다는 점들을 다수의 평가위원들이 지적을 했습니다. <질문> 일단 1개 팀 선발하는 걸 최대한 빨리 하겠다고 말씀해 주시긴 했는데 어떤 방식으로 선정할 예정이신지, 그리고 2차 평가 일정 같은 향후 로드맵에 대해서도 설명 부탁드립니다. <답변> 지금 3개 팀은 2단계에 바로 시작을 할 수 있도록 지금 할 거고요. 1개 팀에 대해서는 지금 공모 절차가 필요하고, 또 한 가지 말씀드린 거는 1단계 평가 결과에 대해서 참여 기업들이 이의제기를 할 수가 있습니다. 그래서 저희가 기업들한테 이의제기 여부를 지금 안내를 해드렸고요. 그래서 10일의 기간을 두고 이의제기를 받은 다음에 이 결과가 확정이 됩니다. 그래서 기업들이 아마, 저희가 오전에 각 개별 기업들한테는 설명을 드렸고, 그래서 평가 결과에 대해서 자체적으로 판단들을 하시고 입장들을 정하고 있으리라 생각됩니다만, 만약에 이의제기를 하신다 그러면 10일의 기간이 소요되고, 이의제기를 안 하신다 그러면 저희가 행정적으로 그 시간까지 세이브를 해서 바로 공모가 진행될 수 있도록 할 것이고요. 저희가 최대한 지금 격차가 벌어지면 안되기 때문에 갭을, 행정적인 절차를 최대한 단축시켜서 할 예정이고요. 좀 궁금해하실 텐데 지금 저희가 임차된 GPU를 가지고 지금 사업자들이, 참여 기업들이 쓸 수 있도록 제공을 하고 있는데 지금 3개 기업들이 나머지 추가되는 기업들을 기다리게 되면 지금 임차한 GPU 자원을 지금 놀려야 되는 상황에 예산 낭비가 또 되고 그런 상황이 발생해서, 일단 3개 기업은 바로 출발할 수 있게 할 것이고요. 행정 절차를 최대한 단축해서 추가 선발해서 진행을 하되, 총 그 프로젝트의 참여 기간과 제공되는 GPU 양이나 이런 것들은 먼저 출발하는 3개 기업과 동일한 조건에서 할 수 있도록 그렇게 지금 설계를 하고 있습니다. <질문> 인코더 관련해서 그럼 인코더는 외부의 것을 사용해도 괜찮은 것인지 여쭙고 싶고, 또 패자부활전은 어떤 형식으로, 어떤 기간으로 이루어지는지 여쭙고 싶습니다. <답변> 인코더 문제는 우리 PM님이 하시는 게 나을까요? PM님께서 한번 답을 해주시고. <답변> (정혜동 정보통신기획평가원 AI PM) 인코더 문제는 외부 인코더를 활용하는 것들이 개발 단계에서 일반적으로 활용하는 방법이긴 합니다만 저희가 이번에 판단한 내용에서는 인코더를 활용했을 때 가중치를 업데이트할 수 있는 형태가 아니라 프로즌돼 있는 형태였기 때문에 외부의 인코더와 가중치를 그대로 활용한 거는 저희가 독자 파운데이션 모델로 인정하기 어렵다, 라는 내부 판단이 있었던 것으로 말씀드리도록 하겠습니다. <답변> (김경만 인공지능정책실장) 지금 저희가 프로젝트를 추가로 어떻게 할 건가에 대한 고민을 하고는 있는데요. 지금 차관께서 설명을 드린 바와 같이 애당초 생각했던 팀이 3개가... 4개가 아니라 3개가 줄어... 3개로 줄어들기 때문에 이 공석을 어떻게 메울 건가에 대한 말씀은 드렸고요. 그다음에 저희가 누누이 말씀을 드렸지만 새로운 프로젝트의 여부에 대해서도 고민하겠다고 말씀을 드렸는데 지금 단계에서는 4개 공석... 4개로 가려고 했는데 3개가 되고 1개가 공석이 됐기 때문에 이쪽 부분에 더, 조금 더 신경을 쓰면서 프로젝트를 만들까 합니다. <질문> 안녕하세요? 패자부활전 하겠다고 말씀 주셨고 새롭게 뽑는 한 팀한테 조금 신경 많이 쓰겠다고 말씀 주셨는데 어찌 됐건 이게 시기적으로 격차가 날 거란 말이죠. 그 격차는 어떻게 메꿀 건지, 새로운 한 팀에게는 어떤 어드밴티지를 주면서 이 사업을 진행할 건지 궁금합니다. <답변> 아까 말씀드렸다시피 추가로 참여하는 기업에게도 같은 기간, 총 프로젝트 기간과 사용할 수 있는 정부가 지원하는 GPU, 데이터 이런 부분에 대해서는 동일하게 설계해서 제공을 할 것이고요. 지금 출발하는 기간에 차이가 있어서 저희가 그 부분은 지금 일단, 아까도 말씀드린 대로 저희가 GPU, 지난 작년 추경을 통해서 임차한 GPU 사용 기간이 있기 때문에 먼저 쓸 수 있게 하고, 그다음에 평가 기간이나 프로젝트 종료하는 시점은 다르더라도 동일한 기간에 2단계를 마치는, 기간 순서는 차이가 있더라도 같은 기간을 줘서, 마지막에 저희가 평가가 그럼 6월 말에 안 될 수도 있어서 그 부분들은 6~7월 정도 한 달 정도 갭에 대해서는 유연하게 그렇게 해서 관리를 할 계획이고요. 하여튼 중요한 거는 저희가 새롭게 추가되는 기업이 늦게 출발한다고 해서 기간이 짧아지거나 전체 동일한 조건에서 차등이 있거나 하지는 않을 거라는 점을 말씀드리겠고요. 그 행정적인 절차는 이번에 이의제기 여부를 저희가 빨리 판단해서 기업들이 의향을 밝히시면 가장 빠른 시간에 해서 그 기간도 최소화시킬 수 있는 그런 방안을 찾으려고 합니다. <질문> 안녕하세요? 다름 아니라 과락이라는 게 원래 있었는지 궁금하고요. 또 추가적으로 네이버클라우드, NC AI도 부활할 수 있다고 하셨는데 만약에 이들이 부활하게 되거나 아니면 새로운 팀이 합류하게 됐을 때 다음 라운드에서 페널티는 없는 것인지 여쭙고 싶습니다. <답변> 일단 새롭게 2단계로 출발하는 거에 대해서는 저희가 모두에, 브리핑문에서도 말씀드렸습니다만 지금 이거는 소수 경쟁 압축 방식으로 하자는 취지가 최종적인 두 기업을 최종적으로 선정하는 그런 목표보다는 가장 치열한 경쟁 환경을 만들어서 가장 치열하게 경쟁을 해서 짧은 기간에 많은 성과를 낼 수 있는 그런 구도로 설계를 한 것이거든요. 그래서 또 직접적으로 이런 과정에 참여하는 그런 기업들도 직접적인 경쟁에서 하시지만, 또 지금 독자 파운데이션, 독파모 프로젝트에서 직접 경쟁은 안 하지만 자극이 돼서 추격하는 그런 기업들이 그런 자극을 통해서 또 경쟁에 효과가 있다고 저희는 판단을 했거든요. 그래서 제가 모두에서 참고로 말씀드린 모티프테크놀로지나 KT 같은 경우에도 1라운드의 본선에 진출하지 못했지만 그런 경쟁을 통해서 기술개발에 박차를 가해서 Artificial Analysis Intelligence Index, 저희가 글로벌 벤치마킹으로 가장 많이 쓰는데 그런 데서 유사 모델에 비해서 우리나라, 다른 나라에 비해서 상위권에 드는, 그런 성과를 보여주고 있지 않습니까? 그래서 저희는 이 프로젝트의 궁극적인 효과와 목표가 그렇다고 보는 것이고요. 그래서 본질적으로 전자의 그런 구도가 아니라 후자의 그런, 우리 생태계에 많은, 되도록 직접 경쟁을 하든 같이 생태계 안에서 경쟁을 하는 모든 기업들이 자극을 통해서 성장하도록 그런 취지에서, 2라운드에서 그런 것들은 1라운드 결과는 전혀 영향을 받지 않도록 새롭게 출발하고 재도전을 할 수 있도록 그렇게 하자는 것이고요. 용어도 '재도전'이나 그런 쪽으로 긍정적으로 봐주시면 좋을 것 같습니다. <질문> AI 기술 특성상 외부 인코더 활용 가능 여부 같은 세부 기준이 사실 첫 공모 당시에는 들어갈 수 없었던 게 당연했을 것 같은데, 그럼 일련의 논란들도 있었고 앞으로는 추가 공모나 아니면 다음 평가에 앞서서 독자성 판단에 대한 명확한 가이드라인을 주실 건지 그것도 궁금합니다. <답변> 아까 오픈소스 활용 문제가 지금 전 세계적으로도 글로벌 프런티어 기업들 포함해서 오픈소스를 활용하지 않는 기업들은 없다고 봐도 괜찮을 것 같습니다. 지금 현재 생성형 AI의 가장 원천적인 출발점이 되는 트랜스포머를 모두가 다 활용하고 있고, 또 글로벌 빅테크들 간에도 오픈소스를 쓰는 거는 당연시하고 당연히 또 그런 게 처음부터 누구... 해야 되는 그런 것들을 생략하면서 인류의 AI 기술과 지식 발전에 기여를 하는 그런 것들이지 않습니까? 그래서 오픈소스를 죄악시한다는 그런 거로는 절대 보지는 않아야 되고요. 각 단계별로 오픈소스의 라이선싱 조건에 따라서 적절하게 가장 전략적으로 활용하는 것은 이 AI 생태계에서 글로벌하게 당연한 것이고요. 다만 지금 우리 독자 AI 파운데이션 모델 이 프로젝트에서 저희가 해보자고 하는 것은 그럼에도 불구하고 저희 스스로 모델도 설계해 보고, 또 그 오픈소스를 가져다 쓰더라도 학습이 이미 된 가중치가 만들어진 걸 그대로 갖다 쓰는 거는 남의 경험을 어떻게 보면 무임승차하는 것이고 그런 경험, 학습 경험 자체를 새롭게 해보자는 것이기 때문에 그런 최소조건은 우리가 직접 해보자, 그래야 앞으로 우리가 오픈소스를 활용하더라도 더 경쟁력 있는 AI모델을 만들 수 있다, 그런 공감대와 목표를 가지고 하는 것이기 때문에, 저희가 오늘 브리핑에서도 기술적 측면, 정책적 측면, 윤리적 측면에서 좀 더 세분화되고 세부적인 말씀을 드렸던 것이고요. 이미 저희는 사실 출발할 때 그 정도의 어떤 독자 파운데이션 모델의 개념 정도로, 또 현재 글로벌 AI 생태계에서 공감대하에서 출발하면 일종의 우리 국내 AI 기업들에게도 일종의 공감대라고 생각을 했었는데, 그런 약간의, 어떻게 보면 정부도 그렇고 기업들도 그렇고 짧은 기간에 개문발차한 성격이 있습니다. 제가 이게 워낙 AI 경쟁 속도가 빠르다 보니까 모든 걸 완비하고 모든 게 확실해졌을 때 이런 프로젝트를 시작하는 것보다는 여러 가지가 아직 불확실성이 있지만 빨리 출발하고 여러 가지를 보완해 가면서 이렇게 하는 과정으로 저희가 해왔고요. 또 여러분들 아시겠지만 4개월 반 정도, 실제 8월부터 해서 12월 말까지, 어떻게 보면 굉장히 짧은 기간입니다. 짧은 기간에 아주 방대한 또 기존에 활용해 보지 않은 대량의 GPU 자원들을 설치하고 개발자들이 원활하게 쓸 수 있게 준비하는 데도 저희가 예상했던 것보다 시간이 걸렸고, 여러 가지 그런 저희가 예측하지 못했던 변수들이 생기고 해서 정예팀들하고도 계속 개발해 가면서 또 그런 당초에 제시한 목표하고 지금 여러 가지 새로운 환경상 목표 자체가 조정될 그런 필요성도 있었기 때문에 한 번 정도는 사업계획서 변경에 대한 사업자들 요청도 저희가 각 정예팀들하고 협의를 해서 다 공감대하에 개별 기업들은 사업계획 승인도, 변경 승인도 한 차례 이루어진 적도 있습니다. 그래서 그런 개발 과정에 있어서의 계속 맞춰 가면서 정부도 관리하고 사업자들도 정부와 커뮤니케이션해서 진행을 해왔고, 그다음에 평가와 관련돼서도 평가 기준과 방법 모든 거를 이 정예팀들하고 협의하에 상호 도출할 수 있는 공감대를, 최대한 공감대를 맞추고 합의한 수준에서 평가가 이루어졌다는 점도 같이 한번 말씀드리겠습니다. <질문> 죄송합니다. 당초 패자부활전이라는 염두에 두고 있지 않았던 것 같은 표현이 있었거든요. 처음에 특화 모델을 개발하는 등 다른 지원 사업을 제공하는 정도라는 표현이 됐었는데, 이번에 패자부활전을 넣는 게 다른 사업자들, 그러니까 현재 참여하는 사업자들한테 형평성 논란을 줄 수도 있다고 생각하거든요. 5개 떨어진 사업자가 아닌 또 새로운 사업자를 넣는 것도 기존 사업자한테 불만을 줄 수 있는 여지가 될 수 있어서, 어떻게 보면 결국 떨어진 2개 사업자 중 누군가에게 기회를 주는 게 유력한 것 아니냐는 해석이 지금 나오고 있거든요. 그래서 왜 이런 결정을 하셨는지, 그러니까 자원을 놀릴 수 없어서 그런 건지 궁금하고요. 이게 사실 어제 라이브 업무보고에서 연내 2개 팀을 선정하겠다고 했는데 추가 선정하는 건 오히려 소모적인 것 아닌지 궁금합니다. <답변> 일단 저희는 최초 1차, 1차 단계에 참여하지 못한 기업들도, 저희가 그래서 가용할 수 있는 자원을 활용해서 특화, '특파모'라고 해서 특화 분야에 대한 파운데이션 모델 사업을 만들어서 지금 2개 팀, 2개 컨소시엄이 해나가고 있지 않습니까? 그래서 저희는 지금 저희가 갖고 있는, 특히 GPU 자원 그리고 예산도 일단 한계가 있습니다만, 저희가 갖고 있는 자원의 제약하에서 최대한 많은 우리 AI 기업들한테 어떤 방식으로든 GPU를 많이 써보게 하고 AI 기술개발에 참여할 수 있는 조건을 만든다는 것이 1단계, 1차 평가, 1차 단계 평가 이후에 특파모를 만든 배경이기도 했고요. 그래서 전혀 저희가 특... 1차 단계에서 이게 2차 단계로 나가지 못하는, 제가 용어를 굉장히 긍정적인 용어를 쓰려고 자꾸 지금 말씀을 드리는 이유가 아까도 말씀드렸지만 이 참여 과정에서 얻은 것들이 많고 앞으로도 그런 것들로 우리 지금 4개 기업, 3개 기업 또는 4개 기업, 최종적인 2개 기업을 위한 프로젝트가 아니라 지금 1차, 1단계 평가에 참여하려고 했던 15개 컨소시엄도 다가 아니고요. 지금도 많은 AI 기업들이 경쟁에 뛰어들고 시도를 하지 않습니까? 정부가 지원해 줄 수 있는 예산이나 그런 제약이 있기 때문에 다 못 하는 건데, 하여간 저는 최대한 1차 단계 평가 이후에서도, 본선 5개를 뽑을 때도 그랬고 특파모를 만들었을 때도 그렇고 이번도 똑같은 배경입니다. 절대 특정 기업을 배려하거나 특정 기업을 위해서 급하게 급조된 그런 접근 방법은 절대 아니라는 말씀을 드리겠고요. 모든 참여 기업들한테도 저희가 개별적으로들 다 협의하고 공감대가 이 기업들이 만들어낸 성과 자체도 개별 특정 기업의 소유물이나 이런 것들이 되어선 안 되고, 우리나라 AI 또 많은 AI 서비스 기업들이 활용할 수 있는 그런 데 오픈소스를 기여를 해야 되고, 또 나아가서는 지금 허깅페이스에서도 지금 굉장히 짧은 기간에 많은 다운로드들이 이루어지고 있고 우리 AI 기업들 5개 모델들이 모두 다 허깅페이스에서 대표가 그렇게 코멘트를 남길 정도로 굉장히 주목받는 그런 모델들을 지금 공개를 한 거거든요. 그래서 글로벌사에서도 오픈소스로 저희가 공개를 해서 우리 AI 기술이 다른 나라, AI 기술을 갖지 못한 다른 나라 연구자들, 개발자들한테 또 많은 기여를 하고 있습니다. 그래서 저희는 최대한 많은 기업들이, 우리나라가 갖고 있는 GPU 한계가 분명한 거니까요. 그래서 지금 빨리 정부가 구매하고 또 확보하고 있는 그런 자원들을 활용해서 최대한 많은 기업들이 이런 수혜를 받아서 기술개발에 박차를 가했으면 하는 게 저희들 목표고요. 모르겠습니다. 지금 패자부활전 용어를 쓰는 대신에 재도약, 추격 프로그램, 재도약 프로그램, 재도전 프로그램 이런 것들을 해주셨으면 좋겠는데 이게 당사 기업들이 참여할지 여부에 대해서는 아마 판단들 하고 계실 텐데요. 저희가 미리 수요조사를 할 수 있는 시간적 여유도 없었고 그런 상황이 안 됐었는데 일단 상황을 지켜보겠습니다. 그리고 저희는 원칙이 지금 지원해 줄 수 있는 자원은, GPU 자원은 최대한 지금 독파모 기업들이 가급적 많은 GPU를 활용해 볼 수 있도록 그렇게 그런 경험을 제공해 드리고 싶고요. 그래서 아마 시나리오, 그러니까 저희가 예상해서 말씀드린다는 게 적절할지는 모르겠습니다만 만약에 네 번째 참여하지 않고 다른 프로그램으로 하겠다는 그런 결정들을 하시면 지금 확보된 자원들은 3개 기업에 더 많... 추가적으로 공급을 해서 하는 그런 방안을 우선적으로 고려하고 있습니다. <질문> 고생 많으십니다. 전문가 위원들 사이에서 네이버클라우드의 독자성 한계에 대한 문제 제기가 있었다고 하셨는데 사실 클라우드만, 네이버클라우드만 프롬 스크래치 이슈가 있었던 건 아니라서요. 해당 기준이 다른 정예팀에도 동일한 잣대로 적용이 됐고, 이 부분에 대해서 위원들 간 이견은 없었는지, 만장일치 의견이 맞았는지 궁금합니다. <답변> 네이버를 제외한 나머지 기업들의 기술보고서 이런 것들을 우리 평가위원들이 다 검증을 하셨고요. 아까 말씀드린 여러 가지 기술적 측면의 요소들, 모델을 직접 설계하고 또 가중치나 이런 학습, 학습을 직접 한 이런 것들을 설명드린 조건에는 다 부합했다는 평가들이시고요. 그 부분에 문제 제기는 없었습니다. 문제 제기는 아까 말씀드린 이 경우에서만 그런 평가들을 하셨고요. 다른 4개 업체들에 대해서는, 추가적인 설명 우리 인공지능정책실장님이 하시겠습니다. <답변> (김경만 인공지능정책실장) 학습데이터 가중치 문제에 대해서는 차관께서 말씀드린 것처럼 전문가들이 언급을 하셨고요. 그 부분과 관련해서 다른 4개 참여 업체가 가중치 문제가 있다는 말씀은 없었습니다. 단지 업스테이지 같은 경우도 레퍼런스 언급 문제에서 말씀들이 있었고요. 그 부분도 평가위원들께서도 지적한 바는 있습니다. 저희가 독자 파운데이션 모델의 기준을 삼을 때 '세 번째, 윤리적인 기준'이라고 말씀드렸었는데요. 그럴 때 남의, 그러니까 공개된 오픈소스를 쓸 때도 당당하게 어떻게 썼고 그리고 나는 어떤 부분을 고쳤고 그게 기술적으로 어떤 검증을 거칠 때 대한민국 인공지능 생태계가 더 발전한다고 생각을 했었고요. 그런 측면에서 본다면 업스테이지의 레퍼런스 비언급 문제도 사실상은 저희 기준에 부합하지 않다고 볼 수는 있습니다. 하지만 그게 당락을 결정할 정도의 아주 큰 하자냐, 그리고 참여하셨던 전문가분들이 이게 절대적인 하자냐, 이렇게 지적하지 않았다는 점을 말씀드리겠습니다. 물론 SKT 같은 경우도 그런 측면에서 약간의 지적이 있긴 있습니다. 그렇지만 그게 절대적인 평가 기준이 아니었다는 말씀드리겠습니다. <답변> 그리고 제가 좀 추가의 말씀드리면 언론을 통해서나 일부 논란이 됐던 그런 사안들에 대해서는 평가위원들께서 그런 부분을 감안해서 다 점수에 반영한 것으로 저희는 이해를 하고 있고요. 그렇게 보시면 좋을 것 같습니다. <질문> 이게 어떻게 보면 명확성이랄까, 구체성이 부족한 상황에서 먼저 프로젝트 시행하다 보니까 5개 컨소시엄의 경우에 불확실성한 부분에 대해서는 PM님이나 과기정통부 쪽에 아마 질의를 하지 않았을까 생각이 드는데요. 이 인코더 문제에 대해서 혹시 사전에 네이버클라우드 컨소시엄 쪽에서 이런이런 것에 대해서 어떻게 생각해야 되느냐, 라고 질의한 적이 있었는지, 그리고 그거에 대해서 혹시 과기정통부나 IITP 쪽에서 적입한다, 라는 식으로 비구체적으로 답변하신 건지 그런 것 내용 알고 싶습니다. <답변> 저희가 확인한 바로는 사업자, 업체 측에서 그런 부분에 대한 문의는 없었습니다. 문의는 없었고요. 그리고 저희가 사업공고 안내서에 아까 말씀드린 표현이 들어 있고 또 예시가 들어 있습니다. 그래서 그게 기준점이 됐을 것 같고요. 그 이후에 사업자들 설명회를 통해서 이 부분도 다시 한번 독자 AI 파운데이션 모델이 어떤 걸 의미하는지는 한번 설명을 한 적이 있어서 그런 부분에 대해서 참여업체들이 그걸 기준으로 판단을 했을 것 같고요. 참고로 말씀드리면 논란이 되고 나서 네이버 측에서 소명서를 보내 왔습니다. 소명서를 보내 왔는데 여러 가지 판단의 문제나 또 보는 관점에 따라서 여러 가지 해석의 여지가 있는 그런 지점들이 있고, 무엇보다 중요한 거는 이게 논란 이후에 이미 평가가 진행 중인 그런 상황에서 추가적으로, 사전적으로 12월 31일 사업 종료 이전에 평가가 진행되기 전에 어떤 소명이나 이런 것들이 이루어지지 않고 이후에 평가 진행 중인 상황이어서 평가에 그거를 반영하지는 않았습니다. 이미 절차적으로 끝난 이후에 저희가 받은 거를 그 이후에 또 평가에 반영한다는 거는 여러 가지 절차적인 문제가 있다고 판단을 했고요. 네이버 측에서는 자체 보유한 인코더도 보유하고 있고, 또 지금 사용한 인코더들 이런 것들이 전체 프로젝트에 차지하는 비중이 상당히 낮다, 이런 내용 중심으로 소명을 했습니다만 또 여러 가지 견해 차이가 있고 전문가들이 보는 관점과 좀 다른 부분도 있고 해서 종합적으로 저희가 그런 판단을 하게 된 겁니다. <질문> 1차 평가 같은 경우는 벤치마크와 전문가, 사용자 평가로 진행하셨는데 2차 평가 같은 경우도 이렇게 나눠서 똑같이 진행이 되는 건지, 아니면 바뀌신다면 조금 어떤 거를 더 기준으로 보실 예정인지 여쭙고 싶습니다. <답변> (김경만 인공지능정책실장) 평가기준 같은 경우는 아까 말씀드렸다시피 평가를 받는 업체들과 저희가 협의를 하면서 만들어왔는데요. 근데 이 기준이 보면 의미가 있는 게 세 가지가 되겠습니다. 벤치마크하고 전문가 평가 그리고 실사용자 평가인데요. 전문가 평가 같은 경우는 결국 객관적인 성능에 대한 평가가 되는 거고요. 그리고 전문가 평가 같은 경우는 기술적 독창성이라든지 그리고 실제 기술력을 확보해서 어떻게 다음을 대비할 수 있느냐 하는 이런 전문적인 기술적인 분야에 초점을 둔 겁니다. 그리고 사용자 평가 같은 경우는 아까 말씀드렸다시피 실제 인공지능을 사용하는 필드에 계신 분들이 이 인공지능 얼마나 유용한가, 예를 들자면 인공지능 크기, 파라미터 크기가 크다 해서 좋은 것만은 아니거든요. 작은 크기지만 큰 효율을 내고 실제 산업현장에서 내가 얼마나 잘 쓸 수 있느냐, 이런 활용성도 대단히 중요합니다. 그래서 저희가 생각할 때는 이 세 가지 큰 틀에서 변화가... 큰 변화는 없을 것 같고요. 하지만 아까 말씀드린 것처럼 프롬 스크래치에 대한 이런 부분들, 좀 더 학계나 업계 그리고 전문가분들의 의견을 수렴해서 정도에 따른 어떤 차등, 배점 이런 부분들은 좀 더 구체화시켜서 앞으로 개발하는 데 있어서 같은 호흡으로, 같은 기준으로 개발할 때 이런 문제가 좀 더 발생하지 않도록 하도록 하겠습니다. <답변> 평가 관련돼서 저희가, 아까 여러 분이 지적해 주셨습니다만 저희가 짧은 기간에 이게 모든 게 다 정리된 이후에 하는 것보다 일단 최소한의 참여 업체들하고 공감대하에 출발하고 또 하나하나 이렇게 만들어가는 과정이었습니다. 그래서 저희는 그런 과정에서 여러 가지 업체들 간에, 예컨대 벤치마크 평가도 공통 벤치마킹만 적용해야 된다, 라는 주장도 있고 또 개별 벤치마킹도 사용해야 되지 않느냐는 여러 주장들, 이런 것들을 업체들하고 사업관리기관, 정보... 우리 과기정통부가 다 같이 논의하고 불가피한 측면, 수용... 참여자들이 모두 수용하고 동의한 방법을 채택한 겁니다. 근데 그 준비 과정이나 짧은 기간의 한계, 이런 과정을 말씀드렸는데 이런 평가와 관련돼서도 저희가 이 사업 자체를 특정 목표와 특정 모델 하나만을 제시하고 여기에 모든 동일한 조건으로 참여하도록 한 것이 아니라 각자의 기업들이, 거기 또 다양한 기업들 또 학교나 연구자들이 참여하는 컨소시엄 형태로, 그 컨소시엄들의 특색들이 다양합니다. 그래서 저희는 어떻게 보면 어느 한 곳에 이렇게 하나의 목표만 가지고 경쟁에 올인하는 것보다는 각 컨소시엄이 다양하지만 각자가 갖고 있는 장점을 최대한 활용할 수 있는 그런, 약간 개방적이고 다양성을 허용한 그런 프로젝트였습니다. 그러다 보니까 평가를 할 때도 어떤 특정 회사는 그런 옴니모달, 또 어떤 업체는 전형적인 LLM을 기준으로 하는, 또 그 안에서도 보면 강조점들이 약간씩 차이가 있고 해서, 저희가 그래서 모든 이 5개 참여 업체를 하나의 공통 또는 공통 벤치마크로만 동일한 잣대로 재는 거는, 물론 그중에 사과는 사과끼리 비교해야 된다, 그런 논란도 있었습니다만 여기 바구니에는 사과만 있는 게 아니고 사과와 또 다른 종류의 과일을 섞어서 전체 과일바구니를 만들어내겠다는 그런 목표가 있는 회사도 있고 해서, 그런 개별 벤치마크도 활용하는 방법이 필요하다는, 그렇지만 가중치나 이런 것들을 통해서 나머지 기업들이 합의하고 동의하는 수준에서 저희가 이런 배점과 방식을 선택했다는 말씀을 드리겠고요. 이런 방식과 관련돼서 언론에서 개별 벤치마크로 활용하는 게 어떤 특정 기업에 유리한, 유불리를 해석하는 그런 시각도 있었습니다만, 이 부분도 참여자들 간에 많은 논란이 있었습니다만 결과론적으로는 업스테이지하고 LG AI연구원이 개별 벤치마크에서도 가장 우수한 평가를 받았고 우려했던 결과하고는 다른 결과가 나왔습니다. 그러니까 우리 참여 업체들도 이게 처음 해보는 그런 과정이기 때문에 방식과 결과에 대한 판단들이 사실은 다 정확한 그런 것들을 토대로 진행되기 어려웠다는 점들 말씀드리겠고요. 그렇지만 결과적으로 논란이 됐던 부분에서도 저희가 확인한 결과로는 우려했던 그런 어떤 특정 업체에 유리한 평가나 그런 기준이 아니었다는 점도 확인됐다는 걸 다시 한번 말씀드리겠습니다. 말씀드리지만 지금 이번 1단계 평가의 교훈으로 저희가 2단계에 들어갈 때는 조금 더 출발선상에서 그런 불확실성을 최소화하고, 여전히 불확실성이 있을 것 같습니다. 왜냐하면 저희가 또 추가적으로 리소스가 확보되면, GPU가 더 확보되면 GPU 공급을 더 제공할 수도 있고, 아직 정해진 건 아닙니다만. 그래서 목표치를 더 높일 수도 있고, 또 AI 글로벌 기업들의 경쟁 상황상 지금 CS도 있었습니다만 피지컬 AI나 이런 부분들로 저희가 예상치 못한 속도로 다양한 지금 기술혁신들이 AI 쪽에서 이루어지고 있기 때문에, 저희가 미리 정한 목표와 방식 그걸 계속 고수하는 것보다는 주변에 변화된 상황에 적응을 하고 수용해 가면서 다이내믹하게 가는 것도 좋지 않을까 하는 생각들을 갖고 있습니다. 그래서 하여튼 최소한, 최대한 불확실성 없이 출발하겠지만 그렇다고 너무 이렇게 정해진 규칙에 얽매여서 저희가 원하는 목표 달성에 제약이 된다는 부분이 있으면 그거는 조금 더 유연하게 설계하겠다는 말씀을 드리겠습니다. <질문> 어제 NIPA 업무보고 때 2027년 최종 2개 정예팀을 선정하려던 목표를 올해 말로 앞당기셨는데요. 앞당기신 이유가 궁금하고, 그리고 보도자료에 보면 모든 평가에서 LG AI연구원이 1위로 나왔는데 2위가 업스테이지인지 SKT인지 구체적인 점수가 공개될 수 있을지도 궁금합니다. <답변> 아까 제가 모두에 양해 말씀을 구한 것처럼, 양해 말씀을 드린 것처럼 일단 저희가 분야별로는 당연히 LG AI연구원이 최종 가장 높은 점수를 받았다는 게 당연히 해석될 것 같습니다. 그리고 제가 모두에도 말씀을 드렸고요. 나머지 순위는 지금 여러분들이 아까 제가 말씀드린 허깅페이스나 글로벌 벤치마킹에 정부 기술보고서나 이게 완전히 적나라하게 공개가 돼 있어서 글로벌하게 다 평가를 받고 있습니다. 그런데 어떻게 보면 그런 평가가 기업이 최종적으로 받은, 어떻게 보면 외부의 평가를 받기에 조금 더 종합적일 것 같고, 그런데 저희 평가가 그렇지 않다는 뜻은 아니지만 순서나 서열이나 점수가 이런 걸 또 다른 해석이 가능한 우려들이 있어서 실제적으로 저희가 1단계 그때 평가 이후에도 그런 난감한 상황들을 경험한 기업들도 있고 해서 양해해 주시면 서열이나 순서, 점수 이 부분은 저희가 공개하지 않고, 아까도 말씀드렸지만 5개 기업 모두가 Epoch AI라는 그런 주목할 만한 AI에 4개월 반 만에 등재하는 것도 굉장히 놀라운 성과입니다. 그리고 글로벌 벤치마킹에서도 계속 그 성과들을 내고 있고, 허깅 페이스에서도 지금 한 달도 안 됐지만 네이버의 모델들 같은 경우에는 3만 건 이상의 다운로드가 있고, 다 비슷한 다운로드가 짧은 기간에 이루어지는 이런 것들이 굉장히 글로벌 AI 커뮤니티에서도 주목받는 그런 성과들을 내고 있기 때문에 지금 2단계 진출하지 못했거나 또는 1단계부터 진출하지 못한 기업들의 어떤 그런 해석에 따른 피해가 좀 최소화될 수 있도록 배려를 해 주시면 좋겠고요. 제가 거듭 이런 자리에서 홍보를 해 드리고 싶은 게 아까 모티프테크놀로지나 또 KT나 또 나머지 지금 우리 생태계에서 하는 AI 기업들이 글로벌 벤치마킹에서 성과를 내려고 굉장한 노력들을 하고 있습니다. 그런 기업들한테도 격려와 지원이 필요하다는 말씀을 부탁드리겠습니다. 말씀드리세요. <답변> (김경만 인공지능정책실장) NIPA 업무보고에서 올해 말 2개 보고드렸다는 그 점이 약간 헷갈리실 수 있는데요. 실제 저희가 올 초에 만약에 정상적으로 평가가 되고 1개 팀이 탈락했다 그러면 4개가 되는 거고요. 그리고 6월이나 7월쯤 평가를 하게 되면 3개가 되는 거고, 그리고 12월에 평가를 하게 되면 2개가 되는 거지 않습니까? 그런데 저희 사업계획은 2027년까지 지속하는 겁니다. 그리고 저희가 이 계획을 처음 수립을 할 때 한정된 자원을 가지고 얼마나 압축적으로 잘 쓸 것인가에 대한 고민이었고 그 혜택을 받는 기업을 선발하는 과정입니다. 그래서 2026년에, 예를 들어서 이렇게 결과적으로 잘 진행이 된다 그런다면 2026년 말은 분명히 2개가 생길 거고요. 그 2개에는 1년 정도가 되든 아님 6개월이 되든 좀 더 정해봐야 되겠지만 자원을 최대한 정말로 몰아드려서 이 2개 기업이 세계 어디를 가든지 간에 대한민국 인공지능을 대표하고, 장관께서도 말씀을 주셨지만 대한민국의 자긍심이 되는 그런 기업이 돼서 우리나라 AX뿐만 아니라 일반 국민들이 정말 편안하게 쓸 수 있게끔 하는 게 목표입니다. <질문> 1차 평가 내용 관련해서 궁금해서 여쭤보겠습니다. 당초 목표는 글로벌의 95% 수준을 목표로 했었고 또 일부 사업자들은 그 이상의 목표를 제시하기도 했었는데요. 1차 평가에서 서열이 나눠지고 1위 기업이 뽑힌 건 알겠는데 글로벌 빅테크도 그 반 년 사이 엄청나게 발달했습니다. 어느 정도 수준까지 달성했다고 보시는지 좀 관련해서 평가 부탁드립니다. <답변> (김경만 인공지능정책실장) 많은 발전들이 있었고 저희가 개발하는 와중에 실질적으로 다른 빅테크 기업들이 자신의 모델들을 많이 발표를 했습니다. 그런데 저희가 벤치마크 아까 말씀드렸다시피 자기 자신, 개발한 인공지능 업체가 과연 나의 사이즈나, 여기서 사이즈는 모델의 크기가 되겠죠. 그리고 어떤 학습량이나 이런 걸 비교했을 때 내가 생각하는 타깃 모델이 뭔가를 본 겁니다. 그래서 저희가 LG 같은 경우에는 100% 넘어갔다고 이야기했었을 때 그 타깃 모델이 GPT-OSS 모델이라고 예를 든다 그런다면 그 모델이 나온 시점이 사실 8~9월 정도 됩니다. 그러니까 저희보다는 조금 앞서나갔는데 저희가 3~4개월 뒤에 그 모델과 비교를 했었을 때 벤치마크를 보니까 상향이 됐다는 이야기는 저희가 비슷하게 간다고 볼 수 있는 거고요. 저희 95%라고 이렇게 추상적으로 말씀드린 것은 정말 톱티어의 인공지능, 프런티어급의 인공지능과 저희가 진짜 견주려고 그러면 아직도 낮은 건 사실입니다. 그렇지만 무빙 타깃을 목표로 했듯이 실제 그다음 시점에 가장 좋은 인공지능, 성능이 좋은 인공지능을 비교하는, 비교를 통해서 계속 따라잡는 이런 거라고 보시면 될 것 같습니다. <답변> 제가 마무리하기 전에 다시 한번 말씀드리고 싶은 거는 경쟁에 직접 참여하는 기업들이 갖는 부담도 굉장히 큰 것 같습니다. 저희 팀이 계속 접촉을 하고 또 저도 직접 가서 현장도 가서 말씀을 들어보면 정말 극도의 경쟁 환경 속에서 정말 치열하게 많은 스트레스, 압박 속에서 정말 치열하게들 하고 계시고요. 또 직접 경쟁에 지금 참여를 못 하고 하는 우리 기업들은 더, 더 악착같이 본인의 어떤 기술을, 기술력을 높이기 위해서 정말 현장에서 열심히들 하고 계십니다. 이 과정에서 이 프로젝트에 참여하는, 일부 정예팀이라고 하는 이 기업들에게만 너무 많은 관심들이 당연히 집중될 수밖에 없는데요. 그렇지 않은 우리 AI 기업들이 다 우리 AI 3강을 위해서 반드시 이분들의 경쟁력이 같이 커지고 이런 것들이 절대적으로 필요하기 때문에 보이지 않은 곳에서 하는 모든 분들한테 격려를 부탁드리겠습니다. <답변> (김경만 인공지능정책실장) 제가 금방 말씀드릴 때 비교 모델이 잘못돼서 수정해 드리겠습니다. 그러니까 예를 들자면 업스테이지 같은 경우에는 100B이지 않습니까? 그러니까 파라미터가 100개 정... 1,000억 개 정도 된다 그러면 1,000억 개에 해당되는 외국의 제일 앞선 오픈소스 모델을 경쟁해야 되고요. 그때 보면 GPT OS에서 120B 정도 갖고 비교를 했고요. LG 같은 경우는 236B니까 그 정도 사이즈의 가장 앞선 모델이 뭐냐 그러면 Qwen3의 235B 모델이 있습니다. 그런 식으로 자기가 타깃할 수 있는 모델을 비교해 가면서 따라잡든지 아니면 앞서든지 이런 목표라 보시면 될 것 같습니다. <답변> 거듭 이번 1단계에 참여해 주신 모든 개발자분들께 감사의 말씀을 드립니다. 이상으로 마치겠습니다. <답변> (사회자) 이상으로 브리핑을 마치겠습니다. 장시간 수고하셨습니다. <끝> [출처] 대한민국 정책브리핑(www.korea.kr) |