스탠포드大, 2025 AI 인덱스 보고서 요약

스탠퍼드 대학교에서 운영하는 스탠퍼드 인간중심 인공지능연구소(Human-Centered Artificial Intelligence. 이하, HAI)는 2025년 4월 7일(현지 시간) 연례보고서인 '인공지능 인덱스 2025 (AI Index 2025)'를 발표하였다. AI Index는 인공지능에 관한 데이터와 통찰력을 제공하는 자료 중 하나로 인공지능 기술의 발전과 그로 인한 사회적 변화를 종합적으로 조명하고 있다. 올해로 8번째인 이 보고서는 정량 데이터를 기반으로 작성되었으며, AI 기술의 최신 동향과 미래 전망을 포괄적으로 다루며, 기술적 진보, 경제적 영향, 정책 변화, 공공 인식 등 여러 차원에서 AI의 진전을 추적하고 평가하였다.



이번에 발표된 AI Index 2025는 AI 연구 개발, 기술적 성능, 책임감 있는 AI, 경제, 과학 및 의학, 정책 및 거버넌스, 교육 등 지난 1년간의 주요 발전 상황을 살펴보고 AI 모델 성능의 주요 향상, 사상 최대의 민간 투자 수준, 새로운 규제 조치, 그리고 현실 세계에서의 채택 확대, 추론, 안전, 그리고 공평한 접근성과 같은 지속적인 도전 과제를 강조하고 있다.

첫째, 비즈니스 전반에서 AI 분야에 대한 투자가 증가하고 있다.

2024년 미국의 민간 AI 투자는 1,091억 달러에 달했는데, 이는 중국이 투자한 93억 달러의 12배, 영국이 투자한 45억 달러의 24배에 해당한다. 특히 생성형 AI는 특히 두드러진 모멘텀을 보이며, 전 세계적으로 339억 달러의 민간 투자를 유치했는데, 이는 2023년에 비해 18.7% 증가한 수치이다. 또한, 2024년 조사에 따르면 조직의 78%가 AI를 사용하고 있다고 보고되었는데, 이는 전년도 55%에서 상승한 수치다.

둘째, 미국과 중국이 전 세계 AI 산업을 선도하고 있다.

2024년, 미국은 40개의 주목할 만한 AI 모델을 생산하여 15개를 기록한 중국과 3개를 기록한 유럽을 크게 앞질렀다. 미국이 양적 측면에서 선두를 유지하고 있는 반면, 중국의 AI 모델들은 급속하게 질적 격차를 줄여나갔으며, MMLU와 HumanEval과 같은 주요 벤치마크에서 성능 차이는 2023년의 두 자릿수에서 2024년에는 거의 동등한 수준으로 축소되었다. 한편, 중국은 AI 관련 출판물과 특허에서도 계속해서 선두를 유지하고 있다.

셋째, AI가 점점 더 효율적이고, 저렴하며, 접근성이 높아지고 있다.

딥시크 등 새로운 소형 AI 모델에 힘입어, GPT-3.5 수준의 성능을 내는 시스템의 추론 비용은 2022년 11월부터 2024년 10월 사이에 280배 이상 하락했다. 하드웨어 측면에서는 비용이 매년 30%씩 감소하고 있으며, 에너지 효율은 매년 40%씩 향상되고 있다. 이러한 추세들이 함께 작용하면서 AI 모델 이용 비용이 빠르게 감소하고 있다. GPT-3.5에 해당하는 점수(64.8% 정확도)를 MMLU에서 기록하는 AI 모델의 쿼리 비용이 2022년 11월 백만 토큰당 20달러에서 2024년 10월 기준(예: Gemini-1.5-Flash-8B 기준)에는 0.07달러로 떨어졌다. 이는 약 18개월 만에 280배 이상의 감소를 의미한다.

추론 비용 변화 추이(2022~2024), 출처: AI Index 2025

투이 인사이트에서는 총 8개로 구성된 챕터중에서 챕터1과 챕터2에서 다룬 주요 내용을 정리하였다.


<챕터 1 : AI 연구 개발(Research and Development) 동향>

챕터 1에서는 AI 연구 개발의 양적 성장, 주도적인 연구 주체, 모델 성능 향상을 위한 컴퓨팅 자원 및 하드웨어 발전, 그리고 AI 개발 생태계의 활발한 움직임을 보여주는 GitHub 활동 등을 주요 내용으로 다루고 있다.

  • AI 논문: 2013년부터 2023년까지 AI 분야 컴퓨터 과학 논문은 전체 논문 수에서 산업계(Industry)가 가장 큰 비중(2023년 84.91%)을 차지하고 있으며, 그 뒤를 학계(Academia), 비영리 단체(Nonprot), 정부(Government), 기타(Other) 순으로 나타났다. 특정 상위 주제별 AI 논문 수는 머신러닝(Machine learning) 분야가 2023년 가장 많았고, 컴퓨터 비전, 자연어 처리, 지식 기반 시스템 등의 순으로 나타났다. 반면 국가별 AI 논문수는 중국이 가장 많았다. 2021년부터 2023년까지 상위 100편의 가장 많이 인용된 AI 논문 수를 기준으로 Google과 중국 칭화대학교(Tsinghua University)가 1, 2위를 기록했고 Carnegie Mellon University, Microsoft, 베이징 인공지능 학원(Beijing Academy of Artificial Intelligence), 홍콩과기대, 상하이 AI 랩, 메타, 엔비디아 등이 포함됐다.
상위 100편의 가장 많이 인용된 AI 논문 수 순위, 출처: AI Index 2025
  • 주목할 만한 AI 모델: AI Index는 주목할 만한 모델들의 출신 국가를 제시했다. 2024년, 미국이 40개의 주목할 만한 AI 모델을 공개하면서 선두를 달렸으며, 그 뒤를 이어 중국이 15개, 프랑스가 3개, 한국은 1개를 기록했다. 2024년의 경우 전년도보다 주목할 만한 모델의 수가 줄어들었다. 2024년 기준으로 주목할 만한 AI 모델을 가장 많이 개발한 기관은 구글이며, 그 다음 OpenAI, 알리바바, 애플, 메타, 엔비디아, 엔트로픽 등으로 나타났다. 이러한 모델들의 접근 방식은 API 접근, 호스팅 접근, 오픈 웨이트(비상업적/제한적/무제한적 사용) 등 다양하다. AI 모델의 파라미터 수는 2010년대 초반 이후 급격하게 증가했으며, 이는 모델 아키텍처의 복잡성 증가, 데이터 가용성 증가, 하드웨어 개선, 대규모 모델의 효능 입증 등에 기인한다. 특히 산업계에서 높은 파라미터 수를 가진 모델이 두드러지는데, 이는 막대한 컴퓨팅 비용을 감당할 수 있는 재정적 자원을 시사하며 모델 훈련에 필요한 컴퓨팅 자원 또한 지수적으로 증가하는 추세다. 주목할 만한 AI 모델 훈련에 사용된 주요 가속기는 A100, V100, TPU v3, Other, TPU v4, H100, P100 순으로 나타났다. 머신러닝 하드웨어의 에너지 효율성은 시간이 지남에 따라 연간 약 40%씩 향상되고 있다.
국가별 주목할만한 AI 모델수 비교, 출처: AI Index 2025
기관별 주목할만한 AI 모델수, 출처: AI Index 2025

<챕터 2: AI의 기술적 성능(Technical Performance) 동향>

챕터 2에서는 2024년 AI 기술의 발전과 함께 모델 성능 평가를 위한 새로운 벤치마크의 등장, 그리고 미국과 중국 간의 기술 격차 축소 움직임을 소개한다. 특히 더 작고 효율적인 AI 모델의 발전과 특정 분야 (언어, 코딩, 로보틱스)에서의 혁신적인 모델 및 기술에 대한 내용을 제시한다.

  • 미국과 중국간 연구 및 기술 격차 감소 : 미국과 중국 간의 기술적 성능 격차가 빠르게 줄어들고 있다. 2021년부터 2023년까지, 미국은 매년 가장 많은 상위 인용 논문을 보유하였으며, 2021년에는 64편, 2022년에는 59편, 2023년에는 50편을 기록하였다. 반면 2021년 이후, 미국의 상위 AI 출판물 점유율은 점차 감소하는 추세이다. 또한 AI 특허의 대부분은 중국(69.7%)과 미국(14.2%)에서 출원되었는데 미국에서 출원한 AI 특허의 비중은 2015년 정점이었던 42.8%에서 감소하였다.  2022년 MMLU 벤치마크에서 60% 이상을 달성한 가장 작은 모델은 PaLM (5400억 파라미터)이었으나, 2024년에는 Microsoft의 Phi-3 Mini (38억 파라미터)가 동일한 기준을 충족하면서 불과 2년 만에 모델 크기가 142배 감소했다.
연도별 가장 많이 인용된 상위 100편의 출판물, 출처: AI Index 2025
지역별 AI 특허 보유 비중(2010~2023, 전 세계 총 특허 대비 %), 출처: AI Index 2025
  • AI와 인간의 격차 감소: 수학 문제를 위한 벤치마크인 MATH에서, 최신 AI 모델은 인간보다 7.9 %p 앞선 것으로 나타났다. 이는 2024년의 0.3%p 격차에 비해 크게 앞선 수치이다. 또한 복잡하고 다학제적인 전문 수준의 질문을 평가하는 벤치마크인 MMMU에서는 오픈AI o1이 78.2%의 점수를 기록해, 인간 벤치마크인 82.6%보다 4.4%p 낮은 점수를 나타내면서 거의 인간과 근접한 결과를 보여줬다.
  • 폐쇄형 모델과 오픈형 모델간 성능 격차 감소 : 2023년에는 폐쇄형 모델이 거의 모든 주요 벤치마크(MMLU, HumanEval, MMMU, MATH)에서 오픈형 모델보다 지속적으로 우수한 성능을 보였으나, 2024년에는 그 격차는 크게 줄어들었다. 2023년 말 폐쇄형 모델은 MMLU에서 개방형 모델보다 15.9%p 앞섰으나, 2024년 말에는 그 차이가 단 0.1 %p로 축소되었는데, Meta의 Llama 3.1 출시와 DeepSeek의 V3의 출시가 영향을 미친 것으로 보인다.

폐쇄형 모델 vs. 오픈소스 모델간 벤치마크 결과, 출처: AI Index 2025
  • 자율주행 차량의 대중화: GM의 자회사인 크루즈는 2022년 말 샌프란시스코에서 자율주행 차량을 출시했으나, 2023년에 여러 안전 사고로 인하여 라이선스가 정지되었다. 알파벳의 자회사인 웨이모는 2022년 초 피닉스에서 로봇택시 운행을 시작하여 2024년에는 샌프란시스코로 확대했고, 2025년 1월부터 피닉스, 샌프란시스코, 로스앤젤레스, 오스틴 등 미국 4개 도시에서 운영중이다. 웨이모는 2024년 10월 기준 4개 도시에서 웨이모는 주당 150,000회의 유료 승차를 제공하며, 총 100만 마일 이상을 주행하고 있다. 또한 중국의 자율주행 차량 혁명 역시 가속화되고 있으며, 바이두의 Apollo Go와 같은 기업이 주도하고 있다. Apollo Go는 2024년 3분기 중국 전역에서 988,000회의 승차를 보고하였으며, 이는 전년 대비 20% 증가한 수치이다. 2024년 10월 기준, 400대의 로봇택시를 운영 중이며, 2025년 말까지 플릿을 1,000대로 확대할 계획을 발표하였다. 2024년 10월, 테슬라는 핸들 및 페달이 없는 2인승 자율주행 차량인 Cybercab를 공개하였으며, 이 차량은 2026년 생산될 예정이며 가격은 30,000달러 미만으로 책정될 예정이다. 테슬라는 또한 최대 20명의 승객을 수송할 수 있도록 설계된 전기 자율주행 밴인 Robovan을 공개하였다. 한편, 바이두의 Apollo Go는 중국 여러 도시에서 최신 세대의 로봇택시인 RT6를 출시했는데 30,000달러에 판매되는 RT6는 자율주행 기술을 보다 비용 효율적이고 확장 가능하게 만드는 데 중요한 단계를 의미한다. 또한, 우버가 세계 최초로 상장된 로봇택시 기업인 WeRide와 협력하여 아부다비에서 자율주행 라이드셰어 플랫폼을 개발하고 있다.

  • 휴머노이드 로봇의 등장 : 2024년은 로봇공학 분야에서 매우 중요한 해였으며, 인간의 기능을 모방하도록 설계된 휴머노이드 로봇 보급이 증가한 해로 기록되었다. Figure AI는 2024년 Figure 02를 출시하였다. Figure 02는 신장이 5피트 6인치(약 167.6cm), 무게가 154파운드(약 70kg)이며, 44파운드(약 20kg)의 하중을 처리할 수 있고, 단일 충전으로 최대 5시간 동안 작동 가능하다. Figure 로봇은 커피 제조, 자동차 조립 시 시트 금속을 자동차 기구에 배치하는 등 복잡한 작업을 수행할 수 있다. 또한, 이 로봇들은 OpenAI와 통합되어 음성-음성 추론(speech-to-speech reasoning)을 수행할 수 있는데, 이를 통해 로봇은 자신의 행동을 설명하고, 행동에 관한 질문에 응답할 수 있다. 엔비디아는 자연어를 이해하고 인간의 움직임을 모방하도록 설계된 범용 인간형 로봇을 위한 기초 모델인 GR00T(Generalist Robot 00 Technology)와 데이터 파이프라인, 시뮬레이션 프레임워크, 그리고 Thor 로봇 컴퓨터를 공개하였다. 이와 같은 로봇 개발 제품군은 로봇 커뮤니티가 점점 더 첨단의 로봇을 확장하고 구축하는 과정을 용이하게 하는 데 목적이 있다.