크리스토퍼 힘내!

들어가며

영화 이미테이션 게임(The Imitation Game, 2014) 을 보면, 주인공인 앨런 튜링이 자신이 만든 암호 해독 기계, ‘크리스토퍼’를 바라보며 마치 사람을 대하듯 중얼거리는 장면이 있습니다. 이 장면은 비록 허구에 가깝더라도 컴퓨터 및 인공지능 (AI) 역사에서 매우 의미 있는 장면입니다. 앨런 튜링이라는 인물은 2차대전 중 조합 최적화 문제를 푸는 기계 즉, 프로그램 가능한 문제 해결 능력을 갖춘 기계를 창조해 독일군의 암호를 해독, 연합군 승리에 결정적 기여를 해낸 사람입니다. 영화에서 튜링은 기계를 마치 진정 스스로 생각하는 의지를 갖고 있다고 여기는 듯 간절히 결과를 기다립니다.

앨런 튜링이라는 인물과 컴퓨터, 튜링 테스트 등에 대해 이 글에서 자세히 다루지는 않지만 이 즈음이 바로 현대적 컴퓨터와 AI의 시작점이라 할 수 있기에 언급하였습니다. 이 글을 통해 AI에 대한 잡다한 이야기들을 풀어내 보려고 합니다.

AI라는 주제 자체가 매우 광범위하기 때문에 글에서 다루는 내용이 다소 딱딱할 수 있고 내용이 다소 정론과 맞지 않고 개인적으로 틀어 생각하거나 틀린 부분도 있을 수 있으니 혹 그런 점을 발견하더라도 너그러이 양해를 부탁드리겠습니다.

개요

위키백과에서 말하는 인공지능에 대한 정의를 요약하면 다음과 같습니다.

인공지능은 지능의 이해에서 더 나아가 실체를 구축하려 하는 학문입니다. 2차 세계 대전 직후 연구가 시작되었다고 할 수 있으며 ‘인공지능’이라는 단어가 최초로 등장하는 때는 1956년입니다. AI는 최근 갑자기 튀어나온 것은 아니며 약 100여 년의 시간 동안 여러 번 인기와 외면을 동시에 겪으며 발전해 왔습니다. 최근의 긴 침체기를 겪은 후 다양한 연관 학문과 컴퓨터 연산 능력의 발달로 AI는 다시 혁신의 중심에 위치하게 되었습니다.

AI는 그 중심에 인간에 대한 이해와 모방이 있기 때문에 인간에 대한 모든 학문은 AI와 연관된 학문(신경과학, 뇌과학, 심리학, 컴퓨터 공학, 물리학, 철학, 수학, 경제학 등)이라고 할 수 있습니다. 이러한 연관 학문과 함께 발전한 AI는 최근 여러 방면에서 괄목할 만한 성과를 이뤘습니다. 시각 정보를 구분해 내고(Vision 기반), 사람처럼 말하고 대화할 수 있으며(GPT, Transformer 기반의 언어 모델), 학습한 것을 인간이 구분해 낼 수 없을 만큼 흉내 내거나 새로운 것을 창조하기도 하고(GAN), 연결된 정보와 지식을 통해 질문에 답을 내기도 합니다 (GNN). 이제 특정 영역에서 인간의 능력을 뛰어넘고 있는 AI. 때문에 AI를 바라보는 시선에는 열광과 걱정이 공존합니다.

이제 좀 더 AI를 가까이 들여다볼까요?

AI가 문제를 해결하는 방법

현대적 AI는 데이터 기반 접근을 중심으로 발전하고 있으며, 이 때문에 데이터 기반 기계 학습(ML - Machine Learning)에 대한 이해가 필수적입니다. 개인적인 입장에서 데이터 기반의 AI 추론과 ML의 관계를 한 마디로 정의한다면,

‘데이터에 기반해 귀납적으로 수학적 형태를 도출해(ML), 다시 연역적으로 추론하여 적용한다(AI).’

라고 말할 수 있습니다. AI의 역사에서 문제 해결을 위한 접근법은 매우 중요한 부분입니다. 이는 크게 규칙 기반 접근과(연역적 시도) 경험 기반 접근(귀납적 시도) 이 두 가지로 요약할 수 있습니다.

근 100년의 AI 발전의 역사에서 이 두 가지 시도는 해당 시점의 상황에 따라 앞서거니 뒤서거니 발전해 왔습니다. (마치 리커다인에서 FFlex와 RFlex가 교대로 주목받았던 것과 비슷한 이유가 여기에도 적용됩니다.)

연역적 방법의 대표적인 예는 논리 기호로 표현된 문제를 푸는 GPS (General Problem Solver)가 있고, 귀납적 방법의 대표적인 예는 최근의 딥 러닝을 들 수 있습니다. 인공지능 태동기에는 연역적 시도가 주로 이뤄졌는데 당시에는 컴퓨터의 연산 능력의 한계로 귀납적 시도보다 연역적 시도가 더 효과적이었기 때문입니다. 비약적으로 증가한 컴퓨터 연산 능력은 데이터 기반의 문제 해결을 실용적인 시간 안에 해결할 수 있는 환경을 제공해 주었습니다. 최근 현대적인 AI/ML을 다루는 데 있어 데이터 기반 방법이 차지하는 비중은 절대적이어서 이 글에서 앞으로 AI/ML에 대한 언급은 데이터 기반의 귀납적 방법을 말한다고 생각하시면 되겠습니다. 데이터 기반의 접근법은 최근 여러 분야에서 풀 수 없었던 문제들을 해결하거나 기존 방법으로 미처 살펴보지 못했던 문제점들을 파악하는 성공적인 결과를 보여줌으로써 AI가 주목받는 원동력이 되었습니다.

과연 그렇다면 데이터 기반 AI/ML은 현실 세계의 문제를 어떻게 해결하는 걸까요? 과정은 다음과 같습니다.

풀고자 하는 문제에는 현실 세계에 축적된 수많은 데이터 또는 작성 가능하거나 만들어 낼 수 있는 데이터가 존재합니다. 이 데이터들 간의 관계를 수학적으로 규명해서 문제를 풀고자 하는 과정이 기계 학습이며 이를 통해 훈련한 모델을 사용해 실제 문제 해결을 위한 추론을 수행합니다.

기계학습은 최적화를 통해 수학적으로 문제를 해결합니다. 일단 데이터를 준비합니다. 준비된 데이터에서 입력 데이터와 출력 데이터를 결정합니다. 입력과 출력에 적절히 정합하도록 수학 모델을 찾아냅니다. 이 과정에서 최적화된 결과물을 얻기 위해 대부분의 경우 매우 많은 데이터를 필요로 합니다. (큰 모델의 경우 자유도는 억 단위가 되고 최고 수준의 데이터 센터에서 오랜 시간 풀어내야 합니다. 이 때문에 컴퓨터의 연산 능력이 부족했던 시절에는 제대로 된 시도를 해보기조차 힘들었습니다.) 계산 결과물은 준비한 데이터가 아우르는 영역 내에서 최적화된 답안이기 때문에 다루는 데이터 영역 내의 새로운 데이터를 대입하면 해당 공간 내에서 최적화된 결과를 추론할 수 있게 됩니다.

영어 공부에 비유하면 이러한 해법은 영어 문법을 모르는 상태에서 직접 많은 대화와 독서를 통해 주어진 상황에 맞게 접했던 표현들을 잘 기억 및 배열해서 말하는 방법을 배워가는 과정과 유사하다고도 할 수 있겠습니다.

AI는 믿을 만 한가?

대충 데이터 기반 AI가 어떻게 문제를 해결하는지는 알겠는데 여기서 잠깐. 이렇게 문제를 해결하고자 하는 과정에서 일반적이고 현실적인 의문을 가질 수밖에 없습니다. 이러한 접근법이 정말 수학적으로 타당할까? 내가 이걸 적용해도 될까? 고객에게 설명 가능할까? 문제 해결에 있어 정확도가 100%가 아니라는데 이걸 정말 써도 될까? 즉, “이 결과가 맞아요?” 라는 질문. 이에 대한 답이 필요합니다.

AI/ML이 인기를 얻기 시작한 초기에는 이 부분에 대한 설명이 빠지거나 취약했으나 최근에는 이러한 신뢰성에 대한 중요도(Explainable AI)가 크게 부각되고 있습니다. AI 관련 라이브러리나 프레임워크를 발표하는 경우 빠지지 않고 논문이 따라다니는 이유이기도 합니다. 여러 방법과 이론들은 수많은 수학적 토대들 위에 존재합니다. AI/ML을 뒷받침하는 데에는 수많은 수학적 정리들이 존재하는 데 예를 들면 가우스-마르코프 정리(Gauss-Markov Theorem), 특이 값 분해(Singular Value Decomposition), 머서의 정리(Mercer’s Theorem), 표현 정리(Representer Theorem), 시벤코 정리(Universal Approximation Theorem) 같은 것들이 있습니다. 특히 이 중 시벤코 정리는 최근 AI/ML에 가장 큰 영향을 준 인공 신경망의 수학적 의미를 다루고 있기도 합니다. 하나하나를 자세히 설명할 수 없지만 주목해야 할 사실은 데이터 기반 기계학습과 이를 통해 만들어 낸 AI가 수학적으로 신뢰할 만한 것이다라는 것입니다.

수학적 증명에 있어서 연역법과 귀납법 사이에 옳고 그름이 없듯, 규칙 기반의 AI와 데이터 기반 기계학습을 적용한 AI 역시 옳고 그름이 없다고 보는 것이 맞습니다. 지배 방정식을 풀어(규칙 기반으로 문제를 해결해) 적용하는 것은 수학적으로 아름답지만 수식 전개에는 드러나지 않는 오차가 있어 현실과 차이가 있는 경우가 많습니다. 마찬가지로 귀납적으로 수학적 표현을 구해(데이터 기반으로 문제를 해결해) 적용하는 것은 사용한 데이터에 대해서 100% 정확도를 얻어내지 못합니다. 즉, 이론과 현실의 괴리가 언제 어디에서 드러나는지에 대한 차이가 있을 뿐 현실과의 오차는 존재합니다. 데이터 기반 방법이 얼핏 보기엔 장님 코끼리 다리 만지는 기분이 들기도 하지만 잘 디자인된 해결법은 연역적 추론 방법과 마찬가지로 절대 틀린 것이 아닙니다. 만약 AI/ML 세계에서 100%로 문제를 해결할 수 없어서 연구와 적용을 꺼리고 외면한다면 내가 익숙한 것만 보고 듣고 싶어 하는 행위일 뿐이겠죠. 데이터 기반 접근은 해결이 힘든 문제를 해결할 수 있는 가능성을 지닌 매우 훌륭한 방법입니다.

문제 해결에 있어 올바른 접근은 어떤 방법을 동원하든 간에 잘 풀어내는 것입니다.

우리는 AI를 어떻게 바라보아야 할까?

AI 연구자가 아닌 우리의 입장에서 철저히 중요한 것은 AI 시대에 우리가 무엇을, 어떻게, 왜, 언제 해야 하는지를 아는 것입니다. 남들이 모두 AI를 얘기하는 광경을 보고 있노라면 나만, 우리만 뒤처지는 것은 아닌지 두렵지만 언제나 그렇듯 차분하고 냉정하게 현실을 바라봐야 합니다. 다음 문장들을 살펴보시죠.

( ) 안에 AI를 넣는다면 요즘 자주 듣는 말이 됩니다.

그런데 사실 ( ) 안에 들어가는 단어는 AI가 아니어도 자연스럽습니다. 최소 몇 년에 한 번씩은 ( ) 안에 들어가는 단어가 바뀌어 가며 반복되니까요. 인터넷, 소프트웨어, 석유, 자동차, 종이, 화약, 심지어 저기에 청동기를 대입해도 대충 말이 됩니다.

이 문장들은 제품, 기술 등에 과장된 인기가 동반된 경우 자주 듣게 됩니다. 실제로 이러한 협박에 가까운 말들은 때론 사실이지만 틀리는 경우도 있으며 본질은 강력한 권유에 가깝습니다. 실제로 짧은 시간 내에 세상이 천지가 개벽하거나 내 회사가 당장 망하거나 하지는 않습니다. 기존에 가던 길을 묵묵히 가서 여전히 잘 먹고 잘 사는 사람도 많고 오히려 혁신적인 것으로 알려졌지만 너무 이르거나 쓸모가 없어서 다시 묻히는 경우도 많습니다. AI도 그런 때가 있었습니다. 지금 당장 AI 없으면 망할 것 같아도 언제 다시 80년대 같은 AI의 겨울이 올지도 모를 일입니다. 다만 어느 시점에 기술적인 임계점을 넘어선 순간 준비되어 있지 않다면 마지막 문장의 경고처럼 시장은 기업을 차갑게 배신할 테고 어느 순간 망해 거리에 나앉게 될지도 모릅니다.

우리는 이러한 위협에 대처해 호기심 어린 시선과 차분한 지성으로 알맞게 대처하는 것이 중요합니다. 그 기저에는 AI의 본질에 대한 이해와 우리가 가진 능력, 환경에 맞는 대처와 노력이 있어야 합니다. 원천 기술 개발에 도전할지, 기술 동향을 빠르게 따라붙을지, 이미 출시된 기술과 이론을 접목하여 응용할지 차분하게 생각해서 결정하면 됩니다. 개인적으로 AI/ML 기술은 현실적으로 기초 기술을 연구 개발해야 하는 대상이 아닌 Visual Studio처럼 우리가 잘 다루고 이용해야 하는 대상일 수 있다고 생각합니다.

the-4-trends-that-prevail-on-the-gartner-hype-cycle-for-ai--2021-0.png

▲ 세계적인 IT분야의 리서치 기업인 가트너(Gartner)가 2021년발표한 AI 분야의 Hype Cycle. AI와 관련된 키워드들은 대부분 Innovation Trigger(기술 혁신), Peak of Inflated Expectations(기대 정점) 단계에 위치해 있다.

AI는 정면 도전해야 하는 대상일까요? 정말로 우리의 생존을 위협할까요? 언제나 답은 ‘그럴 수도 아닐 수도’ 입니다. 이런 가운데 반드시 우리가 짚고 넘어가야 할 중요한 점은 우리가 기술을 연구하고 제품을 개발하는 과정에 AI를 도입한다면 연구와 적용에 있어 고객에 기반해야 한다는 것입니다. 고객이 잠재적으로 필요로 하는지 알아야 하고, 그렇다면 제품을 통해 분명한 가치를 전달할 수 있어야 합니다. 선도적인 기업들이 갖춘 공통점을 거울삼아 새로운 기술에 대한 우리 자신에 대한 신뢰와 비전은 기본이고 높은 수준의 전문지식을 미리 갖춰 놓아야 합니다. 기술 적용을 결정했다면 가능한 단편적인 일부 적용이 아니라 제품과 조직 전체에 포괄적으로 시너지를 창출할 수 있는 방향으로 전개해야 할 것입니다. 이를 통해 최종적으로 사용자 경험을 획기적으로 향상시킬 수 있어야 합니다.

AI는 매력적입니다. 유의미한 시간에 해결하지 못하는 어려운 문제를 해결할 방법을 제공합니다. 우리 또한 유의미한 시간 안에 해결하지 못하는 많은 문제들을 가지고 있으니 그러한 문제들의 해결에 대해 데이터 기반 접근법을 통한 문제 해결을 모색해 볼 수 있습니다.

마치며

최근 현대적 AI는 특정 문제에서 좋은 결과를 내는 과정을 지나 여러 영역을 묶어 함께 문제 해결을 시도하는 방향으로 향하고 있습니다. 그러한 흐름이 드러나는 대표적 예는 언젠가 구현될 최고 수준의 자율주행 같은 것이 될 것입니다. 시간이 지나 이러한 흐름의 끝에는 강인공지능(‘범용 인공지능’을 말함)의 구현이 있을지도 모릅니다.

사람은 매우 빠르고 유연한 병렬 연산 지능을 갖추고 있습니다. 여러 감각 기관에서 들어온 모든 정보를 순식간에 종합적으로 해석해 앗 뜨거! 하는 동작을 손으로 전달해 뜨거운 물체에서 회피하도록 지시할 수 있습니다. 현시점의 AI는 아직 이런 매우 복잡하고 많고 빠른 병렬 프로세스의 동작을 할 수는 없습니다. 바꿔 말해 전체 여정에서 AI는 특정 부분에서 인간을 훌쩍 뛰어넘게 되었지만 강인공지능 면에서는 여전히 초기라 할 수 있습니다. 전체 도메인에 걸쳐 아직 기회는 있습니다. 실질적으로 AI 만으로 엄청난 매출을 올리는 회사는 아직 없고 향후 성장이 기대되는 회사들이 대다수입니다. 개인적으론 우리가 가진 수학을 잘 다루는 능력과 소프트웨어 엔지니어링 능력이 AI라는 문제 해결 방법과 만나 한 단계 도약하는 모습을 보고픈 소망이 있습니다.

먼 미래에 우리도 튜링이 크리스토퍼를 만들었듯 우리의 크리스토퍼를 만들어 첫 번째 의미 있는 결과를 두근거리는 마음으로 기다리고 있을 수 있습니다. 자, 그래서 마지막으로 한 마디.

“미래의 우리 크리스토퍼 힘내!”

Technical Support

{{ post.title }} 글 편집 글 편집 (이전 에디터) 작성자 {{ post.author.name }} 작성일

펑션베이(주)