2025.04.04
share
스크랩

AI 모델 중 IQ 1위는?

✅ IQ 테스트에서 제미나이 2.5프로가 1위를 차지했어요.
✅ 상위 10개 모델 중 7개가 오픈 AI의 제품이에요.
✅ IQ 테스트는 특정 인지 능력을 측정하는 데 유용해요. 

생성형 AI를 사용해 본 사원님 계신가요? ‘생성형 AI’란 스스로 새로운 콘텐츠를 생성할 수 있는 모든 유형의 인공지능을 뜻하는데요. 그 예로 챗GPT, 제미나이(Gemini) 등이 있죠. 이 외에도 다양한 종류의 생성형 AI 모델이 있는데요. 🔎그중 IQ가 가장 높은 모델은 무엇일까요?

IQ 128의 주인공

‘Tracking AI’는 최근 17개의 텍스트 기반 AI 모델과 6개의 비전 기반 AI 모델을 대상으로 IQ 테스트를 실시했는데요. 멘사 노르웨이(Mensa Norway) 테스트에서 구글의 제미나이 2.5 프로(Gemini 2.5 Pro Exp.)가  IQ 128점을 기록하며 가장 높은 점수를 획득했어요.🥇 이는 일반적으로 인간의 ‘매우 우수한’ 지능 수준으로 평가되는 점수로, AI가 인간 수준의 인지 능력에 근접하고 있음을 시사한다고!

멘사 노르웨이 테스트/ 출처: Tracking AI

🥈2위는 오픈AI의 o1, 🥉3위는 앤트로픽의 클로드 3.7 소넷 익스텐디드(Claude 3.7 Sonnet Extended)이 차지했는데요. 각각 125점, 120점을 기록하며 제미나이와 함께 선두를 달렸어요.

상위 10개 중 7개가 오픈 AI

오프라인 테스트에서도 1위는 역시 제미나이 2.5프로, 2위는 o1 프로, 3위는 클로드 3.7 소넷 익스텐디드였는데요. 각각 116점, 110점, 107점을 차지했어요. 특히 오프라인 테스트에서 💥주목할 점은 상위 10개 모델 중 7개가 오픈AI의 제품이라는 것이었는데요. 오픈AI의 o1 프로, o3 미니, GPT-4.5 프리뷰, o1, o3 미니 하이, o1 프로(비전), o1(비전) 모델이 모두 상위권에 위치했어요. 이는 오픈AI가 다양한 유형의 AI 모델 개발에서 선두를 달리고 있음을 보여준다고!

오프라인 테스트/ 출처: Tracking AI

한편, 딥시크의 R1과 V3 모델은 각각 13위와 16위를 차지했으며, xAI의 그록-3(Grok-3)과 그록-3 씽크(Grok-3 Think)는 11위와 18위를 기록했는데요. 메타의 라마-3.3(Llama-3.3)과 라마-3.2(비전)(Llama-3.2 Vision)은 하위권에 머물렀어요.📉

IQ 높은 게 제일 좋을까?

그렇다면 가장 높은 IQ 점수를 받은 AI 모델이 실제 사용에서도 가장 우수할까요?🤔 반드시 그렇지는 않다고 하는데요. IQ 테스트는 특정 유형의 문제 해결 능력을 측정하지만, 실제 사용에서는 문맥 이해, 사용자 의도 파악, 안전성, 편향성 등 다양한 요소가 중요해요. 따라서 특정 사용 사례에 가장 적합한 모델은 IQ 점수만으로 결정할 수 없는 거죠. 하지만 IQ 테스트는 패턴 인식, 논리적 추론 등 특정 인지 능력을 측정하는 데 유용한데요. 특히 Tracking AI의 테스트는 AI 모델 간의 상대적 성능을 비교하는 하나의 지표로 활용될 수 있다고!

오늘 소개해 드린 생성형 AI 모델 중 사용해 보고 싶은 모델이 있나요? 있다면 그 이유도 궁금하네요!

Top