딥시크 DeepSeek LLM, 오픈소스 AI 왜 화제일까? : 네이버 블로그

딥시크 DeepSeek LLM, 오픈소스 AI 왜 화제일까?

안녕하세요.

매일 좀 더 나은 사람이 되고픈 초록연못입니다.

어제 밤 사이에 미국 주가 폭락이 있었습니다. 중국의 인공지능 AI 딥시크 (Deepseek) 의 출시 후 나타난 큰 변화였는데요. 저도 궁금해서 그 이유를 찾아봤어요.

현지시각 26일 중국의 딥시크가 공개한 ‘딥시크-V3(DeepSeek-V3)’ 는 역대 최대 규모의 오픈 소스 대형언어모델(LLM)인데요. 이 모델은 메타의 라마 3.1 405B, 오픈AI의 GPT-4o 를 능가하는 성능을 자랑한다고 해요.

딥시크-V3는 코딩, 번역, 에세이 작성, 이메일 작성 등 설명적 프롬프트에 기반한 다양한 텍스트 작업을 수행할 수 있는데요. LLM 을 기반으로 하고 있습니다.

대규모 언어 모델/대형 언어 모델(LLM) 뜻

LLM 은 Large Language Model의 줄임말로 텍스트 데이터를 처리하는 데 특화된 인공지능 모델입니다. 우리가 사용하는 자연어, 즉 사람들의 말을 이해하고 생성하는 데에 사용됩니다.

우리가 쓰는 글, 이메일, 소셜미디어 글, 책등 수많은 글을 학습해서 그 안에서 언어의 규칙과 문맥을 파악하고 다음 단어를 예측하는 방식으로 작동합니다.

LLM의 종류에는 Open AI의 ChatGPT 와 Google의 Bert, Meta의 LLaMA 등이 있으며 고객 지원, 챗봇, 코드 생성, 언어 번역, 글쓰기 보조, 질문 응답 시스템 등 언어 관련 작업에 많이 사용됩니다.

딥시크 오픈소스 AI 왜 화제일까?

딥시크 오픈소스 AI 가 큰 화제가 된 것은, 딥시크 V3가 6710억개의 매개변수를 보유하고 있어 오픈 소스로 제공되는 모델 가운데 최대규모라는 점이에요. 이는 4050억개의 매개변수를 가진 라마 3.1의 1.5배에 달한다고 해요.

코딩, 번역, 수학 등의 분야에서 특히 뛰어난 성능을 보인다고 합니다.

그 뿐 아니라 딥시크 AI 모델 훈련을 시키는 데 겨우 557만 달러 (82억) 밖에 들지 않았기 때문이라고 해요. 라마 3.1의 경우 5억 달러(약 7300억원) 이상의 훈련비가 들었을것으로 추정되기 때문에 약 1/9 가격 밖에 안 든 셈이죠.

따라서 기존의 AI 모델 개발 비용을 크게 절감함으로서 AI 관련 주들에 대한 거품 논란과, 시장 점유율에 대한 불신 등으로 미국 증시의 하락을 촉발시켰습니다.

알파벳 , 마이크로소프트, 엔비디아 등 주요 기술주들의 주가가 큰 폭으로 하락했으며, 특히 AI 산업의 하드웨어를 공급하는 엔비디아는 17% 이상 큰 폭의 하락을 보였습니다.

▶️LLM 뜻과 종류, LMM 과의 차이가 궁금하신 분은 아래 포스팅을 활용해 보세요!

LLM 뜻, 종류, LMM 과 차이? 대형언어모델 딥러닝(Deep Learning)은 인공지능(AI)의 한 분야로, ...

blog.naver.com

블로그