11편: Transformer와 GPT, 생성형 AI의 기반이 만들어지다

알파고 이후 AI에 대한 관심은 크게 높아졌습니다.

많은 사람들은 AI가 단순히 계산을 빠르게 하는 기술이 아니라, 인간이 어렵다고 생각했던 영역까지 도전할 수 있다는 사실을 알게 되었습니다. 바둑처럼 복잡하고 직관이 중요하다고 여겨졌던 분야에서도 AI가 인간 최고수를 이길 수 있다는 장면은 강한 충격을 남겼습니다.

하지만 알파고가 주목받은 이후에도 AI에게는 또 다른 큰 과제가 남아 있었습니다.

바로 언어였습니다.

사람의 말과 글을 이해하고, 자연스럽게 대화하고, 문장을 만들어내는 일은 AI에게 매우 어려운 문제였습니다. 이미 음성 인식이나 번역, 검색, 추천 같은 분야에서 AI가 활용되고 있었지만, 사람처럼 자연스럽게 글을 쓰고 대화하는 AI는 아직 제한적이었습니다.

그러다 2010년대 후반부터 AI 언어 모델의 흐름이 빠르게 바뀌기 시작했습니다. 그 중심에 있던 기술이 바로 Transformer입니다.

언어는 왜 AI에게 어려웠을까?

이미지를 인식하는 것도 어려운 일이지만, 언어를 이해하는 일도 만만치 않습니다.

사람은 문장을 읽을 때 단어 하나만 보는 것이 아니라 전체 맥락을 함께 이해합니다. 같은 단어라도 문장 안에서 어떤 위치에 있는지, 앞뒤에 어떤 표현이 있는지, 어떤 상황에서 쓰였는지에 따라 의미가 달라집니다.

예를 들어 “차가 막힌다”라는 문장을 생각해볼 수 있습니다.

여기서 “차”는 자동차를 의미할 수도 있고, 마시는 차를 의미할 수도 있습니다. “막힌다”도 도로가 막힌다는 뜻일 수도 있고, 무언가 흐르지 않는다는 뜻일 수도 있습니다.

사람은 문맥을 보고 자연스럽게 의미를 판단합니다.
하지만 컴퓨터에게는 이런 구분이 쉽지 않습니다.

또 다른 예로 “그 사람 말이 좀 차갑다”라는 표현이 있습니다.
이 문장에서 차갑다는 말은 실제 온도가 낮다는 뜻이 아닙니다. 말투가 무뚝뚝하거나 감정이 담겨 있지 않다는 뜻에 가깝습니다.

사람은 이런 비유와 뉘앙스를 쉽게 이해하지만, AI에게는 매우 어려운 문제였습니다.

언어는 단어의 조합이지만, 단어를 단순히 이어 붙인다고 의미가 완성되는 것은 아닙니다. 문맥, 의도, 분위기, 이전 대화 내용까지 함께 고려해야 합니다.

AI가 자연어를 제대로 다루기 어려웠던 이유가 여기에 있습니다.

이전의 언어 AI는 어떤 방식이었을까?

Transformer가 등장하기 전에도 언어를 처리하려는 AI 기술은 계속 발전하고 있었습니다.

초기에는 사람이 직접 문법 규칙을 정해주는 방식이 많았습니다.
단어의 품사를 분석하고, 문장 구조를 나누고, 정해진 규칙에 따라 의미를 해석하려고 했습니다.

하지만 사람의 언어는 규칙만으로 설명하기 어렵습니다.
예외도 많고, 같은 표현이 상황에 따라 다른 의미를 갖는 경우도 많습니다.

이후에는 머신러닝과 딥러닝을 활용한 방식이 등장했습니다. 특히 문장처럼 순서가 중요한 데이터를 처리하기 위해 RNN이나 LSTM 같은 신경망 구조가 많이 사용되었습니다.

이 방식은 이전보다 훨씬 발전된 접근이었습니다.
문장의 앞부분을 보고 뒷부분을 예측하거나, 이전 단어의 정보를 다음 단어 처리에 반영하는 방식으로 언어를 다루었습니다.

하지만 한계도 있었습니다.

문장이 길어질수록 앞부분의 정보를 끝까지 잘 기억하기 어려웠고, 계산을 순서대로 처리해야 해서 학습 속도에도 한계가 있었습니다.

예를 들어 긴 문서의 앞부분에 중요한 정보가 나오고, 한참 뒤에 그 정보와 연결되는 내용이 나온다면 AI가 그 관계를 잘 파악해야 합니다. 하지만 기존 구조는 긴 거리의 문맥을 안정적으로 처리하는 데 약점이 있었습니다.

AI가 언어를 더 잘 다루려면 문장 전체에서 어떤 단어가 중요한지, 어떤 단어와 어떤 단어가 연결되는지 더 효과적으로 파악할 방법이 필요했습니다.

Attention이라는 아이디어

Transformer를 이해하려면 먼저 Attention이라는 개념을 알아야 합니다.

Attention은 말 그대로 “어디에 주목할 것인가”에 대한 아이디어입니다.

사람도 문장을 읽을 때 모든 단어를 똑같이 중요하게 보지 않습니다. 어떤 단어는 핵심이고, 어떤 단어는 보조적인 역할을 합니다. 또 멀리 떨어진 단어끼리도 서로 강하게 연결될 수 있습니다.

예를 들어 “철수는 어제 산 책을 오늘 학교에 가져갔다”라는 문장이 있습니다.

이 문장에서 “가져갔다”라는 행동을 이해하려면 누가 가져갔는지, 무엇을 가져갔는지, 어디에 가져갔는지를 함께 봐야 합니다. “철수”, “책”, “학교”가 중요한 정보가 됩니다.

Attention은 이런 식으로 문장 안에서 어떤 단어가 어떤 단어와 관련이 깊은지 계산하는 방식입니다.

이 아이디어는 언어 처리에서 매우 강력했습니다.

AI가 문장을 앞에서부터 순서대로만 읽는 것이 아니라, 문장 전체를 보면서 중요한 관계를 더 잘 파악할 수 있게 되었기 때문입니다.

단어와 단어 사이의 관계를 더 유연하게 볼 수 있게 되면서, AI는 문맥을 이해하는 능력을 크게 높일 수 있었습니다.

Transformer의 등장

2017년에 Transformer라는 구조가 등장하면서 AI 언어 모델의 흐름은 크게 바뀌었습니다.

Transformer는 Attention을 중심으로 설계된 신경망 구조입니다.
기존 방식보다 긴 문맥을 처리하는 데 유리했고, 대규모 데이터를 학습하는 데도 효율적이었습니다.

특히 중요한 점은 병렬 처리가 가능했다는 것입니다.

기존의 일부 언어 모델은 문장을 순서대로 처리해야 했습니다. 앞 단어를 처리한 뒤 다음 단어를 처리하는 식이었습니다. 이 방식은 자연스럽지만, 대규모 학습을 할 때는 속도와 효율에 한계가 있었습니다.

Transformer는 문장 전체의 단어 관계를 한꺼번에 계산할 수 있는 구조를 가지고 있었습니다. 덕분에 훨씬 큰 데이터와 큰 모델을 학습시키기 쉬워졌습니다.

이것은 AI 발전에서 매우 중요한 변화였습니다.

AI 성능은 좋은 알고리즘만으로 올라가는 것이 아닙니다.
많은 데이터, 강력한 컴퓨팅 파워, 그리고 그 둘을 잘 활용할 수 있는 구조가 필요합니다.

Transformer는 이 조건과 잘 맞았습니다.

인터넷에는 방대한 텍스트 데이터가 있었고, 컴퓨터 성능은 빠르게 좋아지고 있었으며, Transformer는 그 데이터를 대규모로 학습하기에 적합한 구조였습니다.

이 조합이 이후 대형 언어 모델의 발전으로 이어졌습니다.

GPT는 무엇을 의미할까?

GPT는 Generative Pre-trained Transformer의 약자입니다.

이 말을 하나씩 나눠보면 의미가 조금 더 분명해집니다.

Generative는 무언가를 생성한다는 뜻입니다.
Pre-trained는 미리 학습했다는 뜻입니다.
Transformer는 앞에서 말한 신경망 구조를 의미합니다.

즉 GPT는 대량의 텍스트를 미리 학습한 뒤, 새로운 문장을 생성할 수 있는 Transformer 기반 언어 모델이라고 볼 수 있습니다.

GPT의 핵심은 다음에 올 단어를 예측하는 방식입니다.

예를 들어 “오늘 날씨가 너무”라는 문장이 있다면, 그다음에 어떤 말이 올지 예측합니다. “좋다”, “춥다”, “덥다”, “흐리다” 같은 단어가 올 수 있습니다.

AI는 방대한 문장을 학습하면서 어떤 단어 뒤에 어떤 단어가 자주 오는지, 어떤 문맥에서는 어떤 표현이 자연스러운지 익혀갑니다.

겉으로 보면 단순히 다음 단어를 맞히는 것처럼 보입니다.
하지만 이 과정을 엄청난 규모로 반복하면 놀라운 능력이 생깁니다.

문장을 이어 쓰고,
질문에 답하고,
글을 요약하고,
번역을 하고,
코드를 작성하고,
문체를 바꾸고,
대화의 흐름을 유지하는 능력이 나타나기 시작합니다.

AI가 언어의 패턴을 대규모로 학습하면서 다양한 작업을 수행할 수 있게 된 것입니다.

미리 학습한다는 것의 의미

GPT에서 중요한 개념 중 하나는 사전 학습입니다.

사전 학습은 AI가 특정 작업을 하기 전에 대량의 데이터를 먼저 학습하는 과정입니다. 마치 사람이 책을 많이 읽고 세상에 대한 배경지식을 쌓는 것과 비슷하게 볼 수 있습니다.

물론 AI가 사람처럼 세상을 경험하는 것은 아닙니다.
하지만 많은 텍스트를 학습하면서 단어, 문장, 지식, 표현 방식, 논리 구조, 대화 패턴 등을 익힙니다.

예전에는 AI를 특정 작업에 맞춰 따로 훈련시키는 경우가 많았습니다.

번역 AI는 번역 데이터를 학습하고,
분류 AI는 분류 데이터를 학습하고,
요약 AI는 요약 데이터를 학습하는 식이었습니다.

하지만 대형 언어 모델은 먼저 광범위한 텍스트를 학습한 뒤, 다양한 작업에 활용될 수 있습니다.

이것은 큰 변화였습니다.

하나의 모델이 여러 작업을 수행할 수 있게 된 것입니다.
글쓰기, 요약, 질의응답, 번역, 아이디어 정리, 코드 작성 등 다양한 언어 작업을 하나의 모델이 처리할 수 있게 되었습니다.

이런 범용성이 GPT 계열 모델의 가장 큰 특징 중 하나입니다.

언어 모델이 커질수록 달라진 점

Transformer 기반 모델은 크기가 커질수록 성능이 좋아지는 경향을 보였습니다.

모델의 크기를 키우고, 더 많은 데이터를 학습시키고, 더 많은 계산을 사용하면 언어 이해와 생성 능력이 개선되었습니다.

물론 단순히 크기만 키운다고 모든 문제가 해결되는 것은 아닙니다.
데이터의 품질, 학습 방식, 안전성, 평가 방법도 중요합니다.

하지만 대규모 언어 모델은 기존 AI와 다른 가능성을 보여주었습니다.

예전의 AI는 특정 작업에 맞춰 설계된 도구에 가까웠습니다.
하지만 GPT 같은 모델은 다양한 작업을 자연어 지시만으로 처리할 수 있었습니다.

사용자가 “이 글을 요약해줘”라고 말하면 요약하고,
“좀 더 친근하게 바꿔줘”라고 하면 문체를 바꾸고,
“이 코드를 설명해줘”라고 하면 설명하고,
“블로그 제목을 추천해줘”라고 하면 아이디어를 제안합니다.

이처럼 사람의 언어로 지시하고, AI가 언어로 결과를 돌려주는 방식은 매우 강력했습니다.

AI를 사용하기 위해 복잡한 명령어를 배울 필요가 줄어들었습니다.
일반 사람도 자연어로 AI를 사용할 수 있게 된 것입니다.

생성형 AI의 기반이 만들어지다

GPT의 발전은 생성형 AI 시대를 여는 중요한 기반이 되었습니다.

생성형 AI는 기존 데이터를 분석하는 데 그치지 않고, 새로운 결과물을 만들어내는 AI를 말합니다. 텍스트, 이미지, 음악, 코드, 영상 등 다양한 형태의 콘텐츠를 생성할 수 있습니다.

기존 AI가 주로 분류와 예측에 강했다면, 생성형 AI는 창작과 생산에 가까운 역할을 하기 시작했습니다.

예를 들어 이전의 AI는 이메일이 스팸인지 아닌지 판단하거나, 사용자가 좋아할 만한 영화를 추천하거나, 사진 속 사물이 무엇인지 분류하는 데 많이 쓰였습니다.

하지만 생성형 AI는 직접 글을 작성하고, 광고 문구를 만들고, 보고서를 요약하고, 이미지를 생성하고, 코드 초안을 만들 수 있습니다.

AI의 역할이 크게 바뀐 것입니다.

분석하는 AI에서,
예측하는 AI로,
그리고 이제는 생성하는 AI로.

이 흐름의 중심에 Transformer와 GPT가 있었습니다.

사람과 AI의 관계도 달라졌다

Transformer와 GPT의 등장은 사람과 AI의 관계도 바꾸기 시작했습니다.

이전의 AI는 대부분 뒤에서 조용히 작동했습니다. 검색 결과를 정렬하고, 상품을 추천하고, 스팸을 걸러내고, 사진을 분류하는 식이었습니다. 사용자는 AI가 작동한다는 사실을 크게 의식하지 못하는 경우도 많았습니다.

하지만 GPT 계열 모델은 사람과 직접 대화합니다.

사용자가 질문을 하면 답하고,
요청을 이해하고,
글을 만들어주고,
아이디어를 정리해줍니다.

AI가 화면 뒤의 보이지 않는 기술에서, 눈앞의 대화 상대처럼 느껴지는 도구로 바뀐 것입니다.

이 변화는 매우 큽니다.

기술을 잘 모르는 사람도 AI를 사용할 수 있게 되었고, 업무 방식도 달라지기 시작했습니다. 글쓰기, 기획, 번역, 자료 조사, 코딩, 공부, 상담, 콘텐츠 제작 등 다양한 영역에서 AI가 보조 도구로 활용되기 시작했습니다.

AI는 더 이상 전문가만 다루는 기술이 아니었습니다.
일반 사용자도 문장 하나로 AI에게 일을 시킬 수 있는 시대가 열리고 있었습니다.

GPT는 정말 이해하는 걸까?

GPT가 자연스럽게 글을 쓰고 대화할 수 있게 되면서 중요한 질문도 다시 등장했습니다.

AI가 이렇게 답을 잘한다면, 정말 이해하고 있는 것일까?

이 질문은 AI 역사 초반부터 계속 이어진 질문입니다.
ELIZA가 사람처럼 대화하는 것처럼 보였을 때도 비슷한 질문이 있었습니다.

GPT는 ELIZA와 비교할 수 없을 정도로 복잡하고 강력합니다. 방대한 데이터를 학습하고, 긴 문맥을 처리하며, 다양한 주제에 대해 답할 수 있습니다.

하지만 여전히 AI가 사람처럼 의식이나 감정을 가지고 이해하는 것은 아닙니다.

GPT는 학습한 언어 패턴을 바탕으로 다음에 올 가능성이 높은 표현을 생성합니다. 그 과정에서 매우 그럴듯하고 유용한 답변을 만들 수 있지만, 인간처럼 경험을 통해 세상을 이해하거나 감정을 느끼는 것은 아닙니다.

이 점은 중요합니다.

AI가 자연스럽게 말한다고 해서 반드시 사람처럼 생각하는 것은 아닙니다.
AI가 좋은 답을 만든다고 해서 항상 정확하다는 뜻도 아닙니다.

그래서 생성형 AI를 사용할 때는 결과를 검토하고, 사실 여부를 확인하고, 중요한 판단에는 사람의 책임 있는 검증이 필요합니다.

강력해진 만큼 새로운 문제도 생겼다

Transformer와 GPT는 AI의 가능성을 크게 넓혔지만, 동시에 새로운 문제도 만들었습니다.

첫 번째는 잘못된 정보입니다.
AI는 그럴듯한 문장을 만들 수 있지만, 항상 사실만 말하는 것은 아닙니다. 틀린 내용을 자신감 있게 말할 수도 있습니다.

두 번째는 편향입니다.
AI가 학습한 데이터에 편향이 있으면, 그 결과에도 편향이 나타날 수 있습니다.

네 번째는 일자리와 업무 방식의 변화입니다.
AI가 글쓰기, 코딩, 디자인, 상담 등 여러 업무를 도와주면서 일부 직업과 업무는 큰 변화를 맞고 있습니다.

이런 문제들은 단순히 기술만으로 해결하기 어렵습니다.
사회적 합의, 제도, 윤리, 사용자의 책임이 함께 필요합니다.

AI가 강력해질수록 “무엇을 할 수 있는가”뿐 아니라 “어떻게 사용해야 하는가”가 더 중요해졌습니다.

Transformer가 연 AI의 새로운 시대

Transformer와 GPT는 AI 역사에서 매우 중요한 전환점입니다.

초기 AI가 규칙을 따라 움직였다면,
머신러닝은 데이터에서 패턴을 배웠고,
딥러닝은 이미지와 음성 같은 복잡한 데이터를 처리했으며,
Transformer와 GPT는 언어를 중심으로 AI의 활용 범위를 크게 넓혔습니다.

이제 AI는 단순히 정답을 고르는 기술이 아닙니다.
사람과 대화하고, 글을 쓰고, 아이디어를 만들고, 코드를 작성하고, 정보를 정리하는 도구가 되었습니다.

물론 이것이 AI가 인간과 같아졌다는 뜻은 아닙니다.
AI는 여전히 도구이고, 그 결과를 어떻게 사용할지는 사람에게 달려 있습니다.

하지만 한 가지는 분명합니다.

Transformer와 GPT의 등장은 AI를 전문가의 연구실에서 일반인의 일상으로 끌어오는 데 큰 역할을 했습니다. 사람들이 AI와 직접 대화하고, AI에게 일을 맡기고, AI를 창작과 업무의 도구로 활용하는 시대가 열린 것입니다.

AI의 역사는 여기서 또 한 번 방향을 바꿨습니다.

기계가 생각할 수 있는지를 묻던 시대에서,
기계가 배울 수 있는지를 실험하던 시대를 지나,
이제는 기계가 사람의 언어로 함께 일할 수 있는 시대가 시작되고 있었습니다.

9편: 딥러닝 혁명, AI가 이미지를 알아보기 시작하다

by Joshua 7월 05, 2026

자세한 내용 보기

슈아의 데일리 이슈 체크

11편: Transformer와 GPT, 생성형 AI의 기반이 만들어지다

언어는 왜 AI에게 어려웠을까?

이전의 언어 AI는 어떤 방식이었을까?

Attention이라는 아이디어

Transformer의 등장

GPT는 무엇을 의미할까?

미리 학습한다는 것의 의미

언어 모델이 커질수록 달라진 점

생성형 AI의 기반이 만들어지다

사람과 AI의 관계도 달라졌다

GPT는 정말 이해하는 걸까?

강력해진 만큼 새로운 문제도 생겼다

Transformer가 연 AI의 새로운 시대

이번 주 인기 글

작성자: Joshua

댓글 쓰기

0 댓글

Contact form

이 블로그 검색

신고하기

10편: 알파고 쇼크, AI가 인간 최고수를 이긴 순간

9편: 딥러닝 혁명, AI가 이미지를 알아보기 시작하다

5편: 첫 번째 AI 겨울, 기대가 식어버린 이유