단백질 공학, AI 기반 단백질 설계, AI 플랫폼 전략 활용
[위즈덤 아고라 / 김정윤 기자] 신약 개발의 속도와 정확성이 나날이 발전한 현재, 이제는 사람의 손으로 수년이 걸리던 단백질 설계가 인공지능의 계산으로 단 몇 분 만에 완성되는 시대가 열렸다. 단백질 공학에 인공지능 분석 기능이 결합되면서 앞으로의 신약 개발 방식은 ‘발견’이 아닌 ‘설계’로 전환될 가능성이 커지고 있다. 최근 신약 개발 분야에서 주목받고 있는 표현 ‘드노보(de novo)’는 라틴어로 ‘기존에 없던 새로운’이라는 뜻을 가지고 있다. 이 표현이 주목받는 이유는 기존에 존재하지 않은 단백질을 인공지능을 통해 새롭게 설계하는 ‘드노보 항체 설계’ 기술이 등장했기 때문이다. 드노보 항체 설계는 인공지능 기반 단백질 구조 연구의 전형적인 기술이며, 최근 노벨 화학상 수상 분야와도 깊은 연관이 있는 영역이다. 그렇다면 단백질 공학은 무엇이며, 도대체 어떤 부분에서 인공지능이 도움이 되는 걸까? 이번 칼럼에서는 신약 개발 과정 중 단백질 공학의 역할과 이로 인해 변화하는 글로벌 제약 산업의 흐름을 살펴보고자 한다.
드노보 항체 설계 시대
앞서 언급한 드노보 항체 설계는 최근 특히 주목받고 있는 분야다. 이 기술은 자연에 존재하지 않는 완전히 새로운 단백질을 컴퓨터가 처음부터 끝까지 설계하는 방식이다. 과거에는 연구진들이 자연계에서 단백질 후보를 일일이 선정하고 수천 가지 아미노산 배열 조합을 실험했다면, 이제는 인공지능의 등장으로 가상 실험을 통해 가장 안정적이고 우수한 후보를 제안할 수 있다.
뿐만 아니라 이러한 방식으로 개발되는 드노보 단백질은 기존 항체보다 부작용이 낮을 뿐 아니라 특정 표적에 대한 특이성이 더 높아, 차세대 항체 치료제의 중요한 기술 기반으로 평가되고 있다. 특히 기존 항체의 한계로 지적되던 면역반응 유발 위험을 낮출 수 있어 산업적 기대가 더욱 높아지고 있다.
우리 몸의 생체 분자 단백질
단백질은 우리 몸에서 거의 모든 생명 현상을 수행하는 기본 단위다. 면역 반응, 세포 분열, 호르몬 전달, 효소 작용 등 단백질은 형태·크기·아미노산 서열에 따라 제각기 다른 기능을 수행한다. 단백질 구조는 총 4단계로 나뉜다. 1차 아미노산 서열, 2차 (α-나선, β- 병풍), 3차 (입체 구조), 마지막으로 4차 (복합체 – 3차 구조가 여러 개 있는 형태) 구조로 나뉜다. 이때 단백질에서 가장 중요한 역할을 하는 것은 아미노산 배열이다. 이 순서가 곧 단백질의 접힘 모양을 결정하며, 이 시퀀스는 조금만 바뀌어도 구조와 기능이 크게 달라질 수 있다. 단백질 접힘으로 생성된 고유 구조가 각 단백질의 기능을 결정하기 때문이다. 대표적으로 혈관을 통해 산소를 공급하는 혈색소 (헤모글로빈)은 서열 중 아미노산 하나가 변하면 적혈구 모양이 변형되어 제 기능을 못 하는 ‘겸상적혈구병’ 같은 질환이 발생된다. 한번 만들어진 서열은 오류 없이 정확히 만들어져야 한다. 또한, 단백질은 구조 형태 접힘 오류로 인해 유전적 돌연변이가 발생할 수 있다. 이로 인해 비정상 구조가 생겨 질병이 발생하거나, 열, pH 변화와 같은 체내 환경적 스트레스 요인들이 단백질 접힘을 방해하고, 나중에는 독성 덩어리로 변해 세포를 죽이고 조직을 손상시킨다. 단백질 손상은 질병을 유발하지만 반대로 생각해 보면 단백질의 오작동을 막고 기능을 조절해 새롭게 설계한다면 치료제로 활용될 수 있다는 의미이기도 하다. 단백질 공학 역시 이러한 발상에서 시작된 연구 분야이다.
단백질 공학이란?
단백질 공학은 단백질의 구조를 변화시키거나 아예 새로운 단백질을 설계하여 원하는 생물학적 기능을 만들어내는 기술이다. 이를 활용하면 기존 신약 개발에 10~15년, 1조 원 이상이 들던 과정을 더 빠르고 경제적으로 수행할 수 있다.
단백질의 기능에 큰 영향을 주는 요인은 ‘구조’와 ‘서열’이 있다. 이 중 시퀀싱이라는 기술은 여러 가지 단백질의 서열을 알 수 있다. 반면 구조 정보는 알기가 어려운데, 실험적으로 가능한 기법들은 있으나 시간이 오래 걸리고 돈이 든다는 문제점들을 안고 있다. 현재 구조를 밝히는 실험 기법 개발된 기술로는 3가지 방법이 있다. 이는 각각 X-선 결정학, 핵 자기 공명 분광학, 그리고 저온전자 현미경 등의 방법이 있다. 지금까지 이 방법들에게서 무려 10개가 넘은 노벨상이 나왔다. 이렇게나 많은 노벨상을 받은 단백질 공학은 그만큼 어려운 분야라는 것을 방증해 주는 예라고 생각할 수 있다.
그러나 2025년, 여전히 단백질 구조를 밝히는 것은 쉽지 않은 일이다. 이에 생명공학계는 인공지능이라는 새로운 접근으로 단백질 구조를 응용하여 단백질 구조 분석 연구를 시작했다. 인공지능을 도입하면 단백질 서열의 어느 특정 구슬이 또 다른 구슬과의 관계를 분석할 수 있다는 것이 가장 큰 장점이다. 인공지능을 활용한 데이터 분석은 단백질 접힘 힘의 강도를 알 수 있고, 또 컴퓨터의 계산을 통해서 결과적으로 단백질이 어떤 안정한 구조를 만들어 낼 것인가 역시 예측할 수 있다. 인공지능 기반의 예측으로 시간과 비용을 줄일 수 있기 때문에 장기간 연구 및 개발에도 큰 도움이 된다.
CASP 대회와 단백질 구조 예측의 발전
1994년 시작된 CASP(Critical Assessment of protein Structure) 대회는 단백질 구조 예측 방법의 정확성을 평가하는 국제 대회다. 상금이나 상장이 없지만, 전 세계 연구자들이 서로의 접근법을 검증하고 학습하는 장으로 기능한다. 그러나 지난 30년 동안 CASP의 예측 정확도는 약 40% 수준에 머물렀다는 평가도 있었다. 실험 기반 구조 없이 순수 예측만으로 단백질 구조를 정확히 파악하기는 어려웠기 때문이다. 이로 인해 단백질 공학이 실제 의학적·산업적으로 활용되는 데에는 한계가 존재했다. 즉, 단백질 공학 연구는 막상 생물학 연구나 의학 연구에 적용 되기 위해서는 아직 역부족인 것이 현실이다.
알파폴드(AlphaFold)의 등장과 패러다임 전환
이런 상황을 근본적으로 흔든 것이 2020년 구글 딥마인드의 ‘알파폴드(AlphaFold)’다.대표적으로 구글 딥마인드가 발표한 ‘알파폴드(AlphaFold)’는 아미노산 서열만으로 단백질의 3차원 구조를 몇 분 만에 예측하는 기술을 선보이며 생명과학계의 구도가 바뀌었다. 기존 실험 방식으로는 수개월에서 수년이 걸리던 과정을 인공지능이 대체한 것이다. 더 중요한 변화는 인공지능이 구조 예측을 넘어 돌연변이 도입 시 기능 변화를 계산할 수 있게 됐다는 점이다. 이는 단백질 공학에서 가장 어려웠던 ‘기능 설계’를 인공지능이 수행할 수 있게 된 것이다.
단백질 설계의 선구자: 데이비드 베이커
2024년 노벨 화학상 공동 수상자인 미국의 데이비드 베이커는 단백질 구조 예측을 넘어 단백질 설계 모델링을 발전시킨 인물이다. 기존 단백질 서열 연구는 단백질의 특정 서열을 바탕으로 그 서열이 어떤 구조가 될 수 인지를 분석하는 구조 예측이었다면, 그가 연구가 단백질 설계는 목표하는 기능을 수행할 구조를 만드는 새로운 설계 방법이다. 베이커는 정확한 예측은 아니지만 통계적 의미가 있다며 특정 단백질 구조의 서열들을 컴퓨터로 설계했다. 그리고 2003 그는 인류가 컴퓨터로 설계한 첫 인공 단백질 ‘Top7’을 탄생시켰다. 처음에는 기능보다 설계가 가능하다는 것에 집중했지만 최근에는 기능 수행 목적을 지닌 단백질 구조들을 설계하기 시작했다. 예를 들면 바이러스의 복잡한 구조를 모방한 단백질을 개발했다. 실제 바이러스의 기능과 동일하진 않으나 앞으로 이 단계에서 더 발전된다면 백신 개발이나 신약 개발 등 제약 산업에 혁신적인 역할을 할 수 있을 것이다.
제약사가 AI 플랫폼 전략으로 이동하는 이유
인공지능 기반 단백질 설계 기술이 빠르게 발전되면서 글로벌 제약 기업들은 단순히 하나의 신약을 개발하는 데 그치지 않고 이제 자체적인 ‘AI 플랫폼’ 구축에 나서는 추세다. 여기서 플랫폼 전략이란 특정 한 질병에만 적용되는 기술이 아니라, 다양한 치료제 개발 과정에 반복적으로 활용 가능한 인공지능 설계 시스템을 말한다. 예를 들어 한 플랫폼에서 항체 치료제의 구조 예측, 단백질 안정성 개선과 같은 기능을 통합적으로 제공하면, 제약사는 수십 개의 신약 후보를 동시에 설계하고 우선 순위를 정하는 방식이다.
화이자, 일라이릴리 등, 일명 ‘빅파마’라 불리는(연 매출 150억 달러 이상을 기록하는 초대형 제약 기업) 기업들도 자체 AI 신약개발 플랫폼을 강화하는 방향으로 전략을 전환하는 추세다. 국내에서는 유한양행, 한미약품, 대웅제약, 종근당 등이 자체 인공지능 플랫폼과 데이터를 갖춰 개발 기간 및 비용 단축을 목표로 하고 있다.
설계 중심 시대와 윤리적 과제
결국 단백질 공학에 인공지능이 활용되면서 신약 개발 기간이 대폭 단축되고, 초기 실패 확률이 줄어들며, 더 나아가 맞춤형 치료제나 희귀 질환 치료제처럼 소규모 시장에서도 상용화되는 시대가 열리고 있다. 이는 과거 구조 분석에 머물렀던 단백질 연구가 이제 ‘설계 중심’의 공학 분야로 확장되었기 때문이며, 인공지능이 수천 가지 아미노산 서열과 단백질 조합을 단 몇 분만에 계산할 수 있는 기술 덕분이다. 이는 앞으로 제약사가 연구실에서 새로운 단백질을 발견하기보다 오히려 플랫폼에서 원하는 기능을 입력하고 이에 가장 적합한 단백질을 제시받는 방식이 표준화될 가능성이 크다고 생각한다. 그러나 이러한 기술 발전은 윤리, 안전, 데이터 편향 문제 등을 동반한다. 따라서 생명공학계는 AI 기반 단백질 설계 기술이 인류 건강 증진이라는 본래 목적에 부합하도록 명확한 규범과 가이드라인을 마련해야 한다. 특히 AI가 생성한 설계 단백질의 특성 검증, 오남용 방지, 생물안보 기준 설정 등은 앞으로 반드시 해결해야 할 핵심 과제이다.
[위즈덤 네이처] ‘바이오테크놀로지’로도 잘 알려진 생명공학기술은, 다양한 생물체의 구조와 유전 정보를 활용해 새로운 생체기능이나 시스템을 개발하는 첨단 학문입니다. 생명공학은 자연적인 유전자의 작동 원리와 성장, 생물학적 기능을 인위적으로 조작하여 우리 삶에 직접적인 영향을 미치는 해법을 찾고 있습니다. 또한, 생명공학기술은 난치병의 원인을 밝혀내고 효과적인 치료법을 찾는 데에도 큰 역할을 할 것입니다. 위즈덤 아고라 김정윤 기자의 ‘위즈덤 네이처’와 함께, 바이오테크놀로지의 최신 동향을 살펴보고, 질병 연구와 신약 개발, 그리고 생명공학을 둘러싼 윤리적 문제에 대한 고민도 함께 나누어보세요.
