SCIENCE

AI 기반 인공 단백질이란 무엇일까?

세상에 없는 단백질을 만드는 인공지능

<사진 출처: 사이언스 모니터>

[객원에디터 5기 / 유시아 기자] 글로벌 IT(정보기술) 기업들이 인터넷 콘텐츠를 처리하기 위해 개발한 자연어처리 AI가 신약 개발의 패러다임을 바꾸고 있다. 또, 인공지능(AI)이 유용한 기능의 단백질 구조를 새로 설계하는 기술은 한국생명공학연구원과 한국과학기술정보연구원(KISTI)이 발표한 ‘2023년 10대 바이오 미래 유망 기술’에 소개된 주요 기술이다. 

유전정보는 DNA를 이루는 염기들이 나열된 순서이다. 생명체는 이 순서대로 아미노산을 배열하고 입체로 접어 모든 생명현상을 좌우하는 단백질을 합성한다. 같은 염기서열이라도 생명체 종류에 따라 단백질 구조가 달라진다. 이런 특징은 생명체가 진화를 거치며 바뀐 정보를 담고 있다는 의미에서 ‘진화 정보’라고 부른다. 

또한, 단백질은 아미노산 서열뿐만 아니라 2차 구조가 어떻게 결합하고 얽혀 3차 구조, 4차 구조가 되느냐에 따라 모양과 성질이 달라진다. 그동안 단백질 입체 구조를 알아내려면 X선 결정학이나 극저온 전자현미경 등을 이용해야 했는데 수개월에서 수년이 걸렸다. 그래서 지금까지 알려진 단백질 가운데 사람이 구조까지 밝혀낸 것은 약 1% 정도뿐이다.

단백질의 구조를 알면 체내에서 이 단백질이 어떤 기능을 하는지 알 수 있고, 단백질 이상으로 생기는 알츠하이머 치매나 파킨슨 병 같은 난치성 질환의 원인을 찾거나 치료방법을 개발할 수 있다.

그 중 항체치료제는 항체 단백질을 이용해 질병의 원인이 되는 인체 단백질의 기능을 막거나, 외부에서 들어온 병원체의 감염을 차단하는 의약품이다. 치료 효과가 좋고, 부작용이 적어 차세대 치료제로 주목받고 있다. 다만 치료제로 쓸 항체 단백질을 찾기 어렵거나, 아예 없는 경우도 있다. 개발에 시간과 비용이 많이 들어 항체치료제를 한 번 접종하는 가격이 수천만 원, 수억 원대에 이르는 상황이다.

하지만 인공지능을 활용하며 새로운 세상이 열렸다. 데이비드 베이커 미국 워싱턴대 교수 연구진은 지난해 11월 논문 사전출판 사이트 ‘바이오 아카이브(bioRxiv)’에 단백질 구조 생성 모델 ‘로제타폴드 디퓨전’을 공개했다. 베이커 교수는 앞서 단백질 구조 예측 AI인 로제타폴드를 만들었다. 로제타폴드는 단백질을 보면 먼저 단백질 데이터베이스를 이용해 이와 비슷한 아미노산 서열을 찾는다. 이번에는 자연어처리 AI인 ‘GPT’와 이미지 생성 AI로 유명한 ‘달리’ 모델을 이용해 아미노산 염기서열만으로 단백질 구조를 만드는 데 성공했다.

자연어처리 단백질 구조 생성 AI로 여러 단백질 구조를 만들어 가상으로 실험하고, 치료제 후보 물질을 추리면 개발 실패율을 낮추고, 시간도 절약할 수 있다. 이창훈 대구경북과학기술원(DGIST) 뉴바이올로지학과 교수는 “단백질 구조 생성 AI가 항체치료제 같은 단백질 기반 신약 개발의 패러다임을 바꿀 것”이라고 말했다.

이제 실험실에서 단백질 구조 자료를 뒤지지 않아도 신약 연구를 할 수 있는 시대가 열렸다. 세상에 없는 단백질도 문자로 문장을 만들듯 AI가 만들어낼 수 있다.

Leave a Reply

error: Content is protected !!