도대체 챗GPT란 어디에 써야 하는 물건인가? [윤영돈의 AI채용](7)
상태바
도대체 챗GPT란 어디에 써야 하는 물건인가? [윤영돈의 AI채용](7)
  • 뉴스앤잡
  • 승인 2023.12.18 08:20
  • 댓글 0
이 기사를 공유합니다

‘챗GPT’는 2022년 12월  공개 된  채 팅 을  하 는  챗(Chat)과 GPT(Generative Pre-trained Transfor mer)의 합성어이다. 오픈AI닷컴(https://chat.openai.com)에 가서 회원가입을 하고 채팅을 하듯이 쓰면 된다는 것이다. 챗(Chat)은 말 그대로 대화를 나눌 수 있는 인공지능(AI)이라는 의미로 붙은 말이다. 


GPT는 오픈AI가 개발한 언어 모델이고, ‘언어 모델’이라는 건 하나의 단어 다음에 어떤 단어가 오는 게 좋을지 적절한 단어를 통계적·확률적으로 예측하는 모델을 의미한다. 예컨대 ‘홍길동’이라는 단어를 주었을 때, 그 뒤에 어떤 단어가 오는 게 적절할지 통계적·확률적으로 예측하는 것이다. 주어진 데이터에 따라 답변이 달라질 수 있는데, 빅데이터가 많을수록 답변도 더 그럴싸해진다. 


GPT를 그대로 풀면 ‘Generative Pre-trained Transformer(사전 훈련된 생성 변환기)’가 된다. ‘Generative(생성)’는 답변을 생성한다는 의미에서 붙었다. ‘Pre-trained(사전 훈련된)’는 조금 기술적인 표현인데, GPT의 핵심 언어 모델이 미리 학습을 끝낸 뒤에 필요한 작업에 맞춰서 약간의 수정을 가한 답변을 만든다는 의미에서 붙은 표현이다. GPT 이전의 언어 모델은 작업별로 별도의 모델을 처음부터 학습했다고 한다. GPT는 사전에 학습을 통해 성능을 높인 것이다. 


‘LLM’은  ‘Large Language Model’의 약자로 단순히 대형언어모델을 뜻한다. 빅데이터를 사용할수록 언어 모델의 정확도나 활용도가 높아지기 때문에 그냥 언어 모델이 아니라 ‘대규모’ 언어 모델을 쓰게 된다. GPT-3의 경우 파라미터(매개변수)를 1750억 개를 썼다고 한다. 파라미터는 AI가 사용자의 의도를 이해하는 데 필요한 데이터라고 생각하면 된다.  LLM에서는 데이터가 많을수록 성능이 좋다고 했으니 이 파라미터의 숫자가 곧 성능을 의미한다. 

 

2018년 처음 나온 GPT-1은 파라미터가 1700만 개, GPT-2(2019년)는 15억 개, GPT-3(2022년)은 1750억 개로 100배 커졌다. GPT-2는 파라미터가 15억 개였으니 GPT-3은 얼마나 성능이 개선됐는지 짐작할 수 있다. 이제 GPT-4는 파라미터가 100조 개까지 늘어났으며 앞으로도 커다란 증가가 있을 예정이다.

 

AI는 인간이 아니기 때문에 자연어 처리를 위해서는 별도의 과정을 거쳐야 한다. 어떻게 보면 컴퓨터 환경에서 AI가 인간의 언어를 이해하게 하는 것이 AI 기술의 전부라고 할 수도 있다. 트랜스포머(Transformer)는 자연어를 이해하고 활용에 큰 강점을 보이며 단숨에 대세가 됐다. 트랜스포머를 이용한 챗GPT가 그동안 나온 AI 챗봇 중 가장 사람에 가까운 대화가 가능한 것도 이런 맥락이다. 사람의 질문에 답하기, 번역하기, 긴 문장 요약하기 등이 바로 트랜스포머의 강점이다. 


물론 지금은 텍스트 기반뿐만 아니라 다양한 방식으로 응용돼서 쓰이고 있다. Open AI가 DA LL·E 2로 Text-To -Image AI 모델의 붐을 일으키고 있다. 


챗GPT에 100억 달러(약 12조 5000억 원)를 투자한 마이크로소프트(MS)는 검색 엔진 ‘빙(Bing)’에 챗GPT와 유사한 AI 챗봇을 추가하기로 했다. 새로운 빙 엔진에서는 기존의 검색 결과 외에 챗GPT처럼 대화형으로 검색 내용에 답하고 추가 질문 등으로 대화를 이어갈 수 있다. 


챗GPT의 등장으로 IT업계는 분주해진 모습이다. 가장 먼저 비상등을 켠 곳은 구글이다. 세계 최대 검색 엔진인 구글의 위상에 챗GPT가 위협이기 때문이다. 구글의 최고경영자(CEO) 순다르 피차이는 최근 홈페이지를 통해 AI ‘바드(Bard)’를 발표했다. 바드는 초거대 언어 모델인 LaMDA(Language Model for Dialogue Applications)를 기반으로 한다. 람다는 1370억 개에 달하는 매개변수로 학습한 AI로, 30억 개의 문서와 11억 개의 대화를 익혔다고 한다. 이제 언어 모델을 바탕으로 하는 챗 GPT가 일상에 커다란 변화를 일으키고 있다. 

 

최근 출시된 ‘바드’는 사용자가 생성형 AI를 활용할 수 있도록 돕는다. 창의성이나 상상력을 발휘하고, 중요한 의사결정을 내릴 때 장단점을 살펴보거나 복잡한 주제를 간단하게 이해할 때 도움이 된다. 아직 실험 버전이나 바드가 특정 웹페이지에서 장문의 글을 인용할 때 해당 페이지를 출처로 표시하기도 하며 이미지 썸네일이 포함된 대답의 경우 사용자가 이미지를 확인하고 클릭하면 해당 이미지 출처로 이동할 수도 있다. 


특히, 챗GPT는 시, 코드, 대본, 음악 작품, 이메일, 편지 등과 같은 창의성이 있는 문장 생성에 더 적합하며 바드는 질문에 대한 답변, 언어 번역, 다양한 콘텐츠 작성, 사용자의 지시를 따르고 그 요청을 신중하게 결정할 때 도움을 준다. 그 가운데 바드는 자기소개서 맞춤법이나 문법 오류 확인, 일관성, 적합성, 효과성 확인 등으로 완성도를 높일 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토