기사 메일전송
카카오, 국내 최고 성능 경량 멀티모달·국내 최초 MoE 모델 동시 오픈소스 공개
  • 오정민
  • 등록 2025-07-24 16:29:36

기사수정
  • 카카오톡 운영 경험 기반 `독자 AI 파운데이션 모델 프로젝트` 박차
  • 이미지 이해 능률 탁월한 `Kanana-1.5-v-3b`…GPT-4o와 견줄 성능 과시
  • 비용 효율 혁신 `MoE 모델` 국내 첫 공개…AI 개발 트렌드 선도

카카오가 자체 개발한 AI 기술력을 다시 한번 입증하며 국내 AI 생태계에 새로운 활력을 불어넣고 있다. 지난 5월 언어모델 4종 공개에 이어 약 두 달 만에 국내 공개 모델 중 최고 성능을 자랑하는 경량 멀티모달 언어모델과 국내 최초로 MoE(Mixture of Experts) 모델을 오픈소스로 공개했다고 24일 밝혔다.

 

카카오(대표이사 정신아)는 24일 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`와 MoE 언어모델 `Kanana-1.5-15.7b-a3b`를 공개했다.

카카오(대표이사 정신아)는 오늘 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`와 MoE 언어모델 `Kanana-1.5-15.7b-a3b`를 공개했다. 이는 카카오가 독자적인 모델 설계 기반의 기술 경쟁력을 지속적으로 강화하고 있음을 보여주는 대목이다.

 

정부가 추진하는 `독자 AI 파운데이션 모델 프로젝트`에 참여하고 있는 카카오는 이러한 자체 모델 개발 역량과 카카오톡 등 대규모 서비스 운영 경험을 바탕으로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력 강화에 기여하겠다는 방침이다.

 

이미지와 텍스트를 동시에 처리하는 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`는 지난 5월 공개된 Kanana 1.5 모델을 기반으로 한다. 이 모델은 개발의 처음부터 마지막 단계까지 카카오의 자체 기술로 구축하는 `프롬 스크래치(From Scratch)` 방식으로 개발되었다.

 

`Kanana-1.5-v-3b`는 이용자의 질문 의도를 정확히 이해하는 높은 지시 이행 성능과 뛰어난 한국어·영어 이미지 이해 능력을 자랑한다.

 

경량 모델임에도 이미지로 표현된 한국어와 영어 문서 이해 능력은 글로벌 멀티모달 언어모델인 GPT-4o와 견줄 만한 수준이며, 한국어 벤치마크에서는 유사 사이즈의 국내외 공개 모델 중 최고 점수를 기록했다.

 

카카오는 인간 선호 반영 학습(Human Preference Alignment Training)과 지식 증류(Knowledge Distillation) 기술을 통해 이 모델의 성능을 극대화했다고 설명했다.

 

이를 통해 `Kanana-1.5-v-3b`는 이미지 및 글자 인식, 동화 및 시 창작, 국내 문화유산 및 관광지 인식, 도표 이해, 수학 문제풀이 등 다양한 분야에서 유연하게 활용될 수 있다.

 

이와 함께 카카오는 국내 최초로 MoE(Mixture of Experts) 구조의 언어모델 `Kanana-1.5-15.7b-a3b`를 오픈소스로 공개했다. MoE 모델은 입력 데이터 처리 시 모든 파라미터가 연산에 참여하는 기존 `밀집(Dense)` 모델과 달리, 특정 작업에 최적화된 일부 전문가 모델만 활성화되어 컴퓨팅 자원 활용 효율성과 비용 절감에 강점을 가진다.

 

이러한 장점으로 MoE는 글로벌 AI 모델 개발의 새로운 트렌드로 자리 잡고 있다. `Kanana-1.5-15.7b-a3b`는 전체 15.7B 파라미터 중 추론 시 약 3B 파라미터만 활성화되며, `업사이클링(Upcycling)` 방식을 적용해 효율적으로 개발되었다.

 

활성화되는 파라미터가 3B에 불과함에도 성능은 `Kanana-1.5-8B`와 동등하거나 그 이상을 기록해, 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자들에게 큰 도움이 될 것으로 기대된다.

 

카카오는 이번 오픈소스 공개를 통해 AI 모델 생태계에 새로운 기준을 제시하고, 더 많은 연구자와 개발자가 효율적이고 강력한 AI 기술을 자유롭게 활용할 수 있는 기반을 마련해 나갈 계획이다.

 

김병학 카나나 성과리더는 "이번 오픈소스 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로, 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물"이라고 밝혔다.

 

카카오는 자체 기술 기반의 모델을 지속적으로 고도화하고, 글로벌 플래그십 수준의 초거대 모델 개발에 도전하며 국내 AI 생태계의 자립성과 기술 경쟁력 강화에 기여할 방침이다.

 

0
  • 목록 바로가기
  • 인쇄


포토뉴스더보기
이전 기사 보기 다음 기사 보기
유니세프
하단배너_06 코리아넷
많이 본 뉴스더보기
  1. U+tv, 고객 경험 혁신 위해 실시간 채널 UI/UX 개편 LG유플러스가 자사 IPTV 서비스 `U+tv` 고객의 실시간 채널 탐색 시간을 단축하기 위해 UI(사용자 인터페이스)/UX(사용자 경험)를 개편했다고 7일 밝혔다. LG유플러스가 자사 IPTV 서비스 `U+tv` 고객의 실시간 채널 탐색 시간을 단축하기 위해 UI(사용자 인터페이스)/UX(사용자 경험)를 개편했다고 7일 밝혔다.개편은 7월부터 순차 적용 중이며 올...
  2. 코로나19 입원환자 4주 만에 2배 증가…질병청, 고위험군에 예방수칙 준수 당부 질병관리청은 최근 4주간 병원급 의료기관의 코로나19 입원환자가 약 2배 증가했다며, 고령층과 면역저하자 등 고위험군과 요양병원·요양시설 등 감염취약시설에서 감염 예방수칙을 철저히 지켜달라고 8일 당부했다. 질병관리청은 최근 4주간 병원급 의료기관의 코로나19 입원환자가 약 2배 증가했다고 밝혔다. 31주차(7월 27일~8월 2
  3. 미추홀구, 초등학생 대상 `제6회 레이저사격 체험 교실` 성황리에 마무리 인천 미추홀구(구청장 이영훈)는 지난 4일부터 5일간 구청 대회의실에서 관내 초등학생을 대상으로 진행한 `제6회 레이저사격 체험 교실`을 성공적으로 마무리했다. 미추홀구, 초등학생 대상 `제6회 레이저사격 체험 교실` 성황리에 마무리이번 체험 교실은 초등학교 3학년부터 6학년 학생을 대상으로 진행됐으며, 특히 미추홀구청 사
  4. 광명시, 돌봄통합추진위원회 출범…민·관 협력으로 `돌봄통합도시` 향해 광명시(시장 박승원)가 초고령 사회 대응과 돌봄 사각지대 해소를 위한 지역 중심 통합지원체계 구축에 속도를 낸다. 광명시는 8일 시청 컨퍼런스룸에서 `광명시 돌봄통합추진위원회 위촉식 및 제1차 회의`를 열고, 2026년 3월 시행 예정인 `돌봄통합지원법`에 대비한 지역 중심 통합지원체계 구축에 착수했다.시는 8일 시청 컨퍼런스룸
  5. 1·2차 추경 집행 ‘속도전’… 7월까지 1차 74%, 2차 한 달 만에 53.4% 정부가 2025년 1·2차 추가경정예산 집행에서 ‘속도전’에 나섰다. 기획재정부에 따르면 1차 추경은 7월 말 기준 74%가 집행돼 목표치를 4%p 초과 달성했으며, 2차 추경도 의결 한 달 만에 절반 이상이 집행됐다. 이형일 기획재정부 차관이 8월 8일 오전 서울 중구 은행회관에서 열린 `시장상황점검회의`를 주재, 모두발언을 하고
  6. 서울시, 주거용 위반건축물 지원 나선다… “민생 어려움 덜어줄 것” 서울시가 주거용 소규모 위반건축물 문제로 고통받는 시민들을 위한 지원책을 마련했다. 생활 편의를 위해 설치했다가 이행강제금 부담을 지게 된 시민들의 어려움을 해소하기 위한 규제 개선의 일환이다. 주거용 위반건축물 현황 서울시는 올해 상반기 `주거용 위반건축물` 실태를 조사한 결과, 다세대·다가구 주택을 중심으로
  7. 기후위기 대응 위한 법적 투쟁…“2035년 온실가스 감축목표 졸속 결정 중단하라” 기후위기 대응을 위한 법적‧시민운동이 본격화되고 있다.  `탄소중립기본법 개정운동본부`는 8월 14일 서울중앙지방법원 앞에서 기자회견을 열고, 정부의 `2035년 국가온실가스감축목표(NDC)` 졸속 결정을 막기 위한 가처분 신청을 제출했다.‘탄소중립기본법 개정운동본부’는 8월 14일 서울중앙지방법원 앞에서 기자회견을 열
TOP TODAY더보기
    게시물이 없습니다.
모바일 버전 바로가기