‘DO’는 로이드케이의 기술연구소가 연구/개발한 기업용 솔루션으로, 로이드케이는 보다 많은 데이터가 가치있게 활용될 수 있도록 기업 환경에 맞는 다양한 데이터 운영을 위한 제품 라인업을 지속적으로 개발 및 보유하고 있습니다.
빅데이터의 통합 수집 / AI 분석 / GenAI 활용을 위한 LLM 연계 비즈니스 활용 플랫폼인 DO 솔루션은 대표적으로, 챗봇 형식으로 AI 데이터 분석 결과를 제공하는 형태를 취하고 있다는 특징이 있습니다(※관련 특허 보유). 사용자 친화적인 인터페이스 구성을 통해, 기업 경영 및 업무에 있어 담당자가 가장 효율적인 방식으로 AI를 활용할 수 있도록 지원합니다. 멀고 어려운 것으로 느껴지는 AI 기술을 업무에 실용적으로 접목하여 쉽게 활용할 수 있도록 하는 것은 DO 솔루션이 가장 중요하게 여기는 핵심가치 중 하나입니다.
이번 글에서는 DO 솔루션의 핵심이 되는 LLM이 무엇인지 살펴봄으로써 DO 솔루션에 대한 이해를 돕고자 합니다. 실제로 업무에 있어 AI를 자주, 그리고 많이 활용하는 입장에서 봤을 때 LLM은 어떻게 유용한지 공유해드리고자 하는데요. LLM이 어떠한 가능성을 열어주고, 또 어떻게 업무에 도움이 되는지 등에 대하여 이야기해보고자 합니다.
Foundation Model이란?
파운데이션 모델(FM)은 레이블이 지정되지 않은 광범위한 대규모 데이터셋을 기반으로 비지도 학습(unsupervised learning)을 통해 훈련된 대규모 AI 신경망입니다. 광범위한 작업에 응용이 가능한 파운데이션 모델은 상대적으로 몹시 적은 양의 fine-tuning을 요구합니다. AI 모델의 다양한 응용에 있어 토대가 되는 파운데이션 모델은, 자기지도학습(self-supervised learning)과 전이학습(transfer learning) 과정을 거쳐 학습한 정보를 각기 다른 상황에 적용할 수 있습니다. 예를 들어, 세단 승용차를 운전하는 법을 배운 사람이 SUV나 트럭 등을 운전하는 방법도 비교적 수월하게 배울 수 있는 것과 같습니다. LLM은 바로 이 파운데이션 모델 중 하나에 해당합니다.
transformer란?
LLM을 포함한 모든 파운데이션 모델의 근간에는 트랜스포머라고 하는 AI 아키텍처가 존재합니다. 이는 방대한 양의 원시데이터를 기반으로 학습된 AI 알고리즘을 말합니다. 구글에서 개발한 BERT(Bi-directional Encoder Representations from Transformers)는 가장 먼저 만들어진 LLM 파운데이션 모델 중 하나이며, 자기지도학습을 통해 방대한 양의 영문 데이터셋을 학습하였습니다. 다양한 분야에 응용 가능한 BERT는 고객 감정 분석, 고객 문의 답변, 입력 데이터를 기반으로 한 자동완성, 유저 프롬프트에 의한 데이터 생성 및 다량의 복잡한 데이터 요약 등의 기능을 수행할 수 있습니다.
트랜스포머는 산처럼 쌓인 원시 데이터를 그에 해당하는 기본 구조의 압축된 표현으로 변환합니다. 이 압축된 표현으로부터 출발하여, 파운데이션 모델은 높은 정확도를 지니고 데이터 분류, 이미지 내의 물체 식별, NLP (Natural Language Processing) 등의 다양한 작업을 수행할 수 있게 됩니다.
NLP(자연어 처리)란?
자연어 처리(Natural Language Processing, NLP)란 컴퓨터 과학–보다 구체적으로는 인공지능(AI)–의 한 분야로, 사람과 거의 유사한 방식으로 컴퓨터가 텍스트 및 음성을 이해할 수 있도록 능력을 부여하는 과정을 말합니다. NLP는 인간 언어의 규칙 기반 모델링과 통계, 기계 학습, 그리고 딥러닝 모델을 결합합니다. 이렇게 함께 결합된 기술들을 사용함으로써 컴퓨터는 텍스트나 음성 데이터 형태의 인간 언어를 처리하고, 말하는/쓰는 사람의 의도와 감정을 포함하여 그 종합적인 문맥과 의미를 “이해”할 수 있게 됩니다. NLP의 적용 사례로는 Bard, ChatGPT, Grok과 같은 인기 있는 생성형 AI 모델들을 꼽을 수 있습니다.
LLM이란?
LLM(Large Language Models)은 대규모 데이터셋에서 학습된 인공지능 기반의 언어 모델입니다. 이러한 모델들은 수많은 텍스트 데이터를 분석하고 이해하여, 자연어 처리(Natural Language Processing, NLP) 작업에 사용됩니다. LLM은 문장의 구조, 문맥, 의미를 파악할 수 있는 능력을 갖추고 있어, 질문에 대한 답변을 생성하거나, 텍스트를 요약, 번역, 그리고 생성하는 등 다양한 언어 기반 작업을 수행할 수 있습니다.
LLM의 대표적인 예로는 OpenAI의 GPT 시리즈(GPT-3, GPT-4 등), Google의 BERT 및 T5, 그리고 최근 출시되고 있는 다양한 변형 모델들이 있습니다. 이 모델들은 매우 큰 규모의 파라미터를 가지고 있으며, 이를 통해 복잡한 언어 이해 및 생성 작업을 수행할 수 있는 능력을 발휘합니다.
LLM은 그 용량과 복잡성 때문에 고도의 언어 이해 능력을 제공하지만, 학습 데이터의 편향이나 오류를 반영할 수 있으며, 때로는 예상치 못한 결과를 생성할 수도 있습니다. 그럼에도 불구하고, 이들은 자연어 처리와 인공지능 분야에서 혁신을 주도하고 있으며, 검색 엔진 및 콘텐츠 생성 도구 등의 형태로 다양한 분야에서 활용되고 있습니다.
LLM의 단점
LLM은 기본적으로 정적입니다. 특정 시점의 데이터에 고정되어 있으므로 최신 정보를 실시간으로 제공할 수 없으며, 이를 위해 방대한 양의 훈련 데이터셋을 매분매초 업데이트하는 것은 현실적으로 실현이 불가능합니다. 또, LLM이 제공하는 답변에 있어 어떠한 출처로 그러한 결론에 도달했는지는 알기가 어렵습니다.
또한 LLM은 답변에 있어 일관성이 없을 수 있습니다. LLM은 각 단어들이 통계적으로 어떻게 연관되어 있는지에 대한 지식은 있지만, 이는 의미를 “이해”하고 연결짓는 것은 아닙니다. 따라서 미세 조정만으로는 모호할 수 있는 사용자 질문에 대하여 전체적인 맥락을 바로 파악하여 구체적으로 답변하기 위한 기반 지식을 전부 갖추는 것이 매우 어렵습니다. 사용자의 질문이 항상 직관적이지는 않으며, 사용자는 때에 따라 모호하게 표현하거나 복잡하게 돌려말하는 등 LLM이 쉽게 파악하지 못하거나 아예 정보를 가지고 있지 않은 지식을 요구할 수 있습니다. 이런 경우, LLM은 답변을 허구로 만들어내는 경향이 있습니다 (Hallucination Effect).
아울러 LLM은 특정 분야에 특화된 지식이 부족합니다. 거대한 데이터셋을 학습하여 이해하고, 요약하고, 새로운 내용을 생성하는 LLM은, 하나의 모델이 많은 종류의 작업을 수행하거나 질문에 응답하는 등 넓은 범위에서의 작업을 수행할 수 있도록 공개된 데이터를 기반으로 훈련됩니다. 일단 훈련된 LLM은 훈련 데이터의 컷오프(cut-off) 포인트를 넘어서 데이터에 접근할 수 있는 능력이 일반적으로 없습니다. 따라서 특정 기업 또는 전문분야에 특화된 신뢰할 수 있는 정보에 접근할 수 없는 LLM은, 매일 실시간으로 변화하는 내부 데이터에 대응해야 하는 기업 단위에서 활용하기에는 신뢰도 및 유익함의 정도에 있어 적합하지 못한 경우가 많습니다.
덧붙여, 도입에 있어 또 하나의 장벽으로 작용하는 것은 LLM의 비효율성인데, 바로 개발 및 유지과정에 있어 천문학적인 비용이 든다는 점입니다. 이러한 이유로 몇 안되는 조직들만이 모델의 개발 및 배포를 위해 요구되는 인적 및 재정적 자원을 보유하고 있습니다. 이러한 이유로 일반적인 기업에서 LLM을 도입하여 해당 기업에 맞춤화 되어있으며 실시간 데이터에도 대응 가능한 모델을 운용하기는 현실적으로 무척 어렵다고 볼 수 있습니다.
챗봇
LLM 활용의 대표적인 사례는 단연 챗봇입니다. LLM은 챗봇 기술을 여러 방면에서 혁신적으로 발전시켰습니다. LLM을 활용함으로써, 챗봇은 더욱 자연스러운 대화를 구현하고, 사용자의 질문에 대해 더 정확하고 유용한 답변을 제공할 수 있게 되었습니다. 특히 많은 사용자들이 반복적으로 문의하는 질문들의 경우에는 답변에 있어 챗봇의 활용이 두드러집니다. 또한 연관된 제품을 추천하거나, 관련 정보를 제공하는 등의 간단한 질의응답에 있어서도 챗봇은 유용한 역할을 수행합니다.
LLM은 수십억 개의 단어와 구문을 학습하여, 다양한 언어 패턴과 대화의 맥락을 이해할 수 있습니다. 이를 통해 챗봇은 사용자의 질문이나 요청을 더 정확하게 파악하고, 자연스러운 언어로 응답할 수 있게 되었습니다. LLM 이전의 챗봇 모델들은 대화의 전후상황과 맥락을 답변에 충분히 반영하지 못하는 경우가 많았습니다. 하지만 LLM을 사용하게 되면서 챗봇은 대화의 흐름을 더 잘 이해하고, 이전의 대화 내용을 기반으로 응답을 생성할 수 있게 되었습니다.
LLM의 학습 데이터는 광범위한 주제를 포함하고 있어, 챗봇이 다양한 분야의 질문에 대해 답변할 수 있는 능력이 크게 향상되었습니다. 이는 챗봇을 다양한 용도로 활용할 수 있게 만들었습니다. 아울러 사용자의 선호도, 이전 대화 내용 등을 기반으로 개인화된 맞춤 응답을 생성할 수 있게 되었습니다. 또한 다양한 언어로 번역을 해주기도 합니다.
LLM의 도입은 챗봇을 단순한 스크립트 기반 대화에서 벗어나, 보다 지능적이고 상호작용적인 서비스로 발전시키는 데 큰 역할을 하였습니다. 이러한 발전은 챗봇이 고객 서비스, 교육, 엔터테인먼트 등 다양한 분야에서 더욱 효과적으로 활용될 수 있는 기반을 마련하였습니다.
<출처: Unsplash>
챗봇, 특히 인공지능 기반 챗봇은 이렇듯 다양한 분야에서 광범위하게 사용되고 있지만, 그 사용에는 여러 한계점 또한 존재합니다. 이러한 한계점을 잘 이해해야만 챗봇을 적절하고 효과적으로 활용할 수 있습니다. 위에서 이야기한 LLM의 단점과 일맥상통하는 대표적인 한계점을 몇가지만 꼽아보자면 다음과 같습니다:
- 사용자가 대화를 주도해야하는 수동적 형태를 띄고 있는데, 사용자는 종종 본인이 정확히 어떤 것을 질문하고 싶은지 모호할 때가 있고, 전후사정을 충분히 설명하지 않고 대뜸 질문부터 던지는 경우도 많습니다. 이런 경우, 챗봇은 복잡한 문맥이나 미묘한 언어의 뉘앙스를 완전히 이해하지 못할 수 있으며, 맥락을 완전히 파악하지 못해 엉뚱한 대답을 할 수 있습니다.
- 이렇듯 챗봇은 오류를 범할 수 있으며, 특히 사용자의 질문이 모호하거나 질문의 내용이 챗봇의 학습 범위를 벗어난 경우에는 부정확한 정보를 제공할 수 있습니다. 따라서, 사용자는 정확한 답변을 얻어내기 위해 프롬프트 엔지니어링 등의 복잡한 추가과정을 거쳐야 할 수도 있습니다. 이는 사용자 경험(UX)의 품질을 낮추는 결정적 문제로 작용할 수 있습니다.
- 학습 데이터나 지식 베이스에 의존적인 챗봇 답변의 경우, 최신 정보, 전문 분야, 또는 학습 데이터에 포함되지 않은 정보 등에 대해서는 정확한 답변을 제공하기 어려울 수 있습니다. 또한 챗봇은 학습 데이터에 내재된 편향을 반영한 응답을 제공 할 수도 있습니다. 이런 경우, 출처가 모호한 응답의 특성에 의해 사용자는 그것이 잘못된 정보인지도 모르는 채로 해당 답변을 수용할 수도 있습니다.
- 챗봇과 상호작용을 하는 과정에 있어 개인 정보 보호와 데이터 보안은 중요한 고려사항입니다. 사용자의 데이터를 안전하게 처리하고 보호하는 보안 시스템이 제대로 갖춰지지 않은 경우, 심각한 보안 위협으로 이어질 수 있습니다.
<출처: Leveraging LLMs in product design: opportunities and challenges>
AI 기술에는 LLM 외에도 다양한 기술들이 존재합니다. 따라서 각각의 기술들의 장단점과 특성을 이해하고, 업무의 성격과 목적에 맞는 기술을 선택하여 적절하게 도입하는 것이 무엇보다도 중요합니다. 하지만 하루하루 쏟아져 나오는 각종 AI 기술들 속에서 어떠한 것이 나에게 필요하고, 또 나에게 맞는지 파악하고 이해하여 도입하는 것은 무척 어려운 일일 수 밖에 없습니다. 이 과정을 돕고자 로이드케이는 ‘DO’를 개발하였으며, 기업과 함께 고민하고 나아갈 방향을 찾고 있습니다.
AI는 어디까지나 도구이며, 주체는 사람입니다. 어떻게 다루고 활용할지, 그리고 그를 통해 얼마만큼의 효과를 볼 수 있는지는 결국 사용자에게 달려있습니다. 기업에게 있어 그 어느 때보다도 빠른 변화와 유연한 적응이 필요한 이 때, 최적의 길을 찾도록 돕는 맞춤형 솔루션, 로이드케이의 ‘DO’가 함께 하겠습니다.