안녕하세요!
인공지능아카데미 대표 아재입니다.
몇 차례의 영상을 통해 소개했던 그록4의 출시 시기가 다가오면서 예상 성능과 기능의 윤곽이 드러나고 있습니다.
우선 지금까지 밝혀진 기능을 다 설명 드릴 수는 없고 3편의 저의 영상과 오늘 새벽에 나타난 팩트를 기반으로
그록4의 성능을 살펴 보겠습니다.
아주 놀라운 성능입니다.
이 그록4에 대한 위 두 편의 영상에는 그록4의 기능 및 예상 성능 뿐 만 아니라 다양한 인공지능 뉴스도 포함되어 있습니다.
머스크가 밝혔듯이
그록4의 First of Principles 의 새로운 방법으로 학습된, 인간의 영역에 도전하는 인공지능 모델입니다.
그래서인 지 아래의 벤치마크 예상 비교자료를 보시면 HLE(인간 최우의 시험)에서 O3, Gemini 2.5 Pro, Claude에 비하여
그록4의 성능 벤치마크 점수는 2 ~ 4배 가까이 향상된 성능을 보여 줍니다.
기존의 벤치마크가 너무 쉬워서 새로운 벤치마크로 대체할 필요가 있다는 문제의식에서 시작된 이 벤치마크는
세계 50여 개국의 전문가가 참여하여 문제가 채택될 경우 5천 달러의 상금을 주는 것은 물론이고
논문의 공동저자가 될 수 있는 특권까지 부여하여 인공지능의 발전에 기여하기 위하여 신설된 새로운 측정 지표입니다.
눈여겨 보실 부분은 HLE(인류 최후의 시험) 지표와 더불어 Grok4 코드 모델이 별도로 출시된다. 는 점입니다.
Code Forces와 같은 기계적인 코딩 실력이 아니라 실제 소프트웨어 엔지니어링에서 구현하는 것을 측정하는 SWE 벤치마크에서 그록4가 압도하는 수준은 아니지만, 그록4가 재미나이 2.5 Pro는 완전히 넘어서고, 실제 개발자들이 압도적으로 만힝 활용하는 클로드 4와 거의 대등한 수준까지 발전이 되어 출시 이후의 튜닝 과정을 더 거치게 되면 성능이 현재 보다 더 향상될 것으로 추정됩니다.
두 개의 영상 속에서는 새로운 기능에 대한 것도 상세하게 소개하고 있으니 즐청하시길 바랍니다.
인공지능은 자본과 기술, 지식과 학력의 장애물로 인하여 어릴 적 또는 현실적 여건으로 인해 간직만 하고 있는 여러분의 꿈을 현실로 만들어 줄 수 있는 지식의 민주화 도구입니다.
아무쪼록 변화하는 메가 트렌드에 잘 적응하시어 변화를 이끌어가는 리더이자 사업가로 행복한 성공을 누리시길 늘 기원합니다.
인공지능아카데미 인공지능아재가 그록4의 예상 성능과 기능을 소개드리면서 또 유익과 즐거운 콘텐츠로 찾아뵈겠습니다.
'LLM 챗봇' 카테고리의 다른 글
그록4가 촉발한 인공지능 지각 변동 레딧과 쿼라의 열띤 논쟁 (1) | 2025.07.07 |
---|---|
그록4의 업데이트 상황 (0) | 2025.07.06 |
Gemini CLI Plan Mode 계획 모드 설정 (0) | 2025.07.03 |
인공지능 비지니스를 위한 무료 강의 코스 (3) | 2025.01.10 |
GPTo1 Pro와 Claude Sonnet 3.5 비교 사용자 경험 (2) | 2025.01.06 |