SCIENCE

머신러닝은 어떻게 소비자들의 생각패턴을 예측할까?

< Illustration by Jessica Li >

[객원 에디터 3기 / 김예은 기자]기계학습 혹은 머신러닝 (machine learning)은 인공지능에 속한 분야로 사람이 지식을 학습하듯이 컴퓨터에도 데이터를 제공하여 기계가 스스로 학습하게 하는 방법이다. 더욱 많은 양의 데이터를 학습시킬수록 인공지능은 더욱 정밀한 결과를 낼 수 있다. 

과거에는 데이터를 모으기 어려워 컴퓨터에 규칙을 주입하는 방식을 사용했다. 하지만 이러한 방식은 경우의 수를 고려하지 않기 때문에 정확하지 않은 경우가 많았다. 머신 러닝이 최근 주목받는 이유는 기존 규칙 기반의 인공지능보다 성능이 훨씬 뛰어나기 때문이다. 기존의 컴퓨터 프로그램의 경우 사람이 직접 컴퓨터에 필요한 규칙을 입력했지만 머신 러닝은 컴퓨터가 수많은 데이터를 스스로 분석하여 알맞은 규칙을 스스로 찾아 나가는 방식으로 일일이 대입해야 하는 수고가 사라졌다. 컴퓨터가 스스로 규칙을 찾아 나가면서 사람들이 좋아하는 영상이나 상품을 추천해주는 등 여러 분야에서 무궁무진하게 사용되고 있다.      

머신러닝은 3가지 유형으로 나뉜다. 첫 번째는 지도학습 (supervised learning)으로 답안이 정해져 있는 문제를 컴퓨터가 풀면서 학습하는 방식이다. 일명 주입식 방식으로 input이 있으면 요구하는 output이 나오도록 하는 방식이다. 두 번째로 비지도 학습 (unsupervised learning)은 답안이 정해져 있지 않은 데이터의 문제들을 이용하여 스스로 규칙을 발견하게 하는 학습 방식이다. 따라서 비지도 학습에는 어떠한 형태의 풀이도 답으로 인정하며 정해진 답이 없는 학습 방식이다. 마지막으로 강화학습 (reinforcement learning)은 실패와 성공의 과정을 반복해 나가며 학습하는 방식이다. 강화학습은 지속되는 시행착오를 통하여 학습을 강화해 나간다.

실제 출력 값과 정확한 출력 값을 비교하며 오류를 검출하는 지도학습은 과거 데이터를 기반으로 앞으로 있을 이벤트를 예측하는 데 사용된다. 정답이 없고 데이터를 탐색하고 구조를 파악하는 것이 목적인 비지도 학습은 트랜잭션 데이터, 즉 유사성을 근거로 마케팅을 하는 것에 사용된다. 시행착오를 거쳐 보상을 극대화하는 강화학습은 로봇, 게임, 내비게이션 등 알고리즘이 의사 결정권자가 일정한 시간 내에 예상되는 보상을 극대화할 수 있는 동작을 선택하는 것에 많이 사용된다.

3가지 유형 각각에 제한되지 않고 유형들을 조합하여 머신러닝을 사용하는 사례 또한 다양하다. 예컨대 제조 업체에서는 공장 센서 및 사물인터넷 (loT)에서 많은 양의 데이터를 수집하여 품질 관리에 사용한다. 그리고 재무에서 머신 러닝이 쓰이는 사례는 대량의 데이터와 이력 레코드가 제공되는 금융이다. 주식 거래, 대출 승인, 사기 감지, 위험 평가 등 머신 러닝의 알고리즘이 사용된다.

의료 기관 또한 머신 러닝에서 사용된 알고리즘으로 더욱 많은 패턴을 발견할 수 있다. 예를 들어 loT 기술을 이용하여 환자의 건강 상태를 실시간으로 파악하며 환자가 어떤 방향으로 악화하거나 개선될 수 있는지에 대한 데이터를 얻는다. 또한 마케팅 및 영업 분야에서는 구매자가 좋아할 만한 상품을 추천하는 머신 러닝을 사용한다. 이 방법으로는 구매자들의 과거 검색 기록 및 구매 기록을 학습하고 분석하여 구매자가 좋아할 만한 혹은 다음에 구매할 가능성이 높은 상품을 추천한다. 

또다른 예시로 데미지맵 (damage map)이라는 머신 러닝의 시스템이 있다. 이 시스템은 산불 이후 어떤 건물들이 붕괴하였고 어떤 건물이 멀쩡한지 빠르게 분류하는 데 도움을 준다. 데미지맵은 화재 이전의 사진과 화재 이후의 사진을 비교하는 것 대신 머신러닝 이미지를 이용하여 화재 전 이미지만 가지고 붕괴할 가능성이 높은 건물들을 골라내는 프로그램을 훈련한 것이다. 이러한 방법은 불이 난 곳의 시민들이 자기 집이 불에 타버렸는지 아닌지에 대한 정보를 불과 몇분 이내라는 이른 시간 안에 받을 수 있게 한다.

이처럼 머신러닝은 실생활 많은 곳에 도움을 주고 있다. 인간의 지식과 지혜로 예측하기 힘든 부분을 머신 러닝은 방대한 양의 데이터와 정보를 토대로 학습한다. 그리고 여기서 학습한 데이터는 실제 사례와 대동소이한 값을 출력하는 방식으로 인간들을 도와왔다. 물론 데이터와 정보가 많을수록 오차가 줄어들므로 데이터 수집 기술이 발전하는 지금은 머신러닝의 정확도 또한 발전될 것이라 기대를 모은다. 기술자들은 지금 이 시각에도 머신러닝을 더욱 발전시키고 일상에 대입하는 방법을 찾아보는 것에 힘쓰고 있다.

Leave a Reply

error: Content is protected !!