논문인가, 매뉴얼인가: 복제된 과학의 홍수

< 일러스트 OpenAI의 DALL·E 제공 >

AI와 논문공장, 공공데이터가 만들어내는 복제 논문의 시대

[객원 에디터 9기 / 신하은 기자] “65세 이상 남성의 비타민 D 수치와 우울증”, “18~45세 여성의 치아 건강과 당뇨병”… 제목만 다를 뿐, 논문의 구조와 내용은 놀라울 만큼 흡사하다. 최근 과학계에서는 이처럼 형식과 분석 방식이 유사한 논문들이 급증하고 있다. 그 이면에는 누구나 접근할 수 있는 공공 데이터와 글쓰기를 자동화하는 생성형 인공지능(AI), 그리고 이들을 활용해 논문을 대량 생산하는 ‘논문 공장’이 있다. 과학적 탐구의 다양성과 창의성이 사라진 자리에, 복제된 과학이 차곡차곡 쌓여가고 있다.

미국 질병통제예방센터(CDC)가 운영하는 국민건강영양조사(NHANES)는 건강검진, 혈액검사, 식습관 등 방대한 정보를 담은 공공 데이터 세트다. 이 데이터는 누구나 자유롭게 활용해 논문을 작성할 수 있다는 점에서 교육과 연구의 접근성을 크게 높였다. 그러나 최근 발표된 한 연구에 따르면, 이 데이터를 바탕으로 작성된 논문들이 마치 템플릿처럼 유사한 형식과 분석 구조를 따르고 있는 것이 문제로 지적되고 있다. 특히 2022년부터 최근까지 학술지에 게재된 유사 논문은 190편이 넘으며, 이는 이전 7년간 평균보다 수십 배 많은 수치다.

챗GPT를 비롯한 생성형 AI는 논문 작성의 진입 장벽을 획기적으로 낮췄다. 논문 형식을 모르는 초보자도 손쉽게 틀을 갖출 수 있고, 복잡한 통계 코드나 학술적 문장 표현 역시 AI의 도움을 받아 작성할 수 있다. 그러나 이러한 기술 발전이 연구자의 ‘사고하는 힘’을 약화시키고, 비판적 성찰 없는 ‘복붙 과학’을 양산하는 도구로 전락할 수 있다는 우려도 적지 않다. 생성형 AI는 방대한 양의 기존 데이터를 학습하고, 이를 조합해 그럴듯한 문장을 만들어내는 데에는 탁월하지만, 진정한 과학적 사고의 핵심이라 할 수 있는 독창적인 연구 질문의 도출이나 이론 간의 충돌을 해석하는 비판적 사고력에는 분명한 한계가 존재한다. 

논문이 학술지에 실리는 것은 단순한 성취의 차원을 넘어, 연구자로서의 ‘스펙’으로 작용한다. 일부 개인이나 집단은 이를 악용해, 돈을 받고 논문을 대행해 주는 이른바 ‘논문 공장’에 의존한다. 이들은 공공 데이터나 이전 연구를 반복적으로 활용하여, 거의 유사한 구조의 논문을 대량으로 생산하며 학술지 게재 실적을 양산한다. 그 결과, 학술지에는 제목과 세부 내용만 약간 다를 뿐, 유사한 분석 구조와 결론을 반복하는 ‘복제 논문’이 넘쳐나고 있으며, 이는 학문 생태계의 신뢰성과 다양성을 위협하는 중대한 문제로 떠오르고 있다. 

AI는 어디까지나 도구일 뿐이다. 중요한 것은 그 도구를 어떻게 활용하느냐에 달려 있다. 논문을 ‘빠르게 완성하는 법’을 익히는 것이 아니라, 깊이 있는 사고와 문제의식을 담아내는 연습이 더욱 중요하다. 

AI의 도움을 받더라도, 비판적 검토 과정과 명확한 출처 표기, 그리고 창의적 질문을 통한 탐구는 연구의 본질을 놓치지 않게 한다. 공공데이터와 AI는 연구 혁신의 동력이지만, 그것이 진정한 혁신으로 이어지기 위해서는 이를 책임 있게 활용하려는 연구자의 윤리의식과 깊이 있는 문제의식이 반드시 동반되어야 한다.

Leave a Reply

Back To Top
error: Content is protected !!