본문 바로가기 주메뉴 바로가기 푸터 바로가기

관련 기사

AI가 대필 논문 양산?… 논문 오류도 잡는다
  • 윤리정책법무팀
  • 2025-03-17
  • 42
  • 기사제목
    AI가 대필 논문 양산?… 논문 오류도 잡는다
  • 언론사
    국민일보
  • 기자성명
    윤준식
  • 분야,키워드
  • 링크주소

지난해 10월 검은색 플라스틱 주방용품의 발암물질 함유량이 위험 수준을 넘는다는 잘못된 뉴스가 한국을 포함해 전 세계에 확산됐다. 연산 실수로 발생한 잘못된 연구 결과에 전 세계 소비자들 사이에서는 검은색 뒤집개(블랙 스패츌라)와 같은 주방용품을 사용하면 안 되는 것 아니냐는 불안감이 퍼졌다.

10일 과학 학술지 네이처에 따르면 이 같은 연구 오류와 추가 피해를 막기 위해 인공지능(AI) 도구를 1차 필터링에 활용하는 시도들이 성과를 내고 있다. 단순 계산 오류부터 악의적인 왜곡까지 다양한 이유로 발생하는 오류를 사람이 일일이 적발하기 어렵기 때문에 AI의 대량 연산력을 활용하는 것이다. 개발자들의 자발적인 참여로 시작된 블랙스패츌라 프로젝트는 지난 12월 이후 3개월 동안 약 500편의 논문에서 오류를 찾아냈다. AI 스타트업 창업자인 맷 슐리히트가 주도하는 예스노에러 프로젝트 역시 비슷한 기간 동안 3만7000건 이상의 논문을 분석하는 데 성공했다.

프로젝트 참여자들은 출판된 논문에 대해 연구자들이 올린 평가부터 철회된 논문의 목록과 철회 이유까지 다양한 데이터를 AI에게 학습시켜 검증 도구를 만들어냈다. AI 도구가 논문을 수차례 반복 확인하는 절차를 거치기 때문에 정확성은 상당한 수준이다. 블랙스패츌라 프로젝트가 판별한 오류 중 10% 정도만이 잘못된 판단으로 드러났고, 예스노에러 팀이 오류를 발견하고 연락한 연구자 중 90%가 오류 사실에 동의했다.

다만 연구자에게 부당한 누명이 씌워지는 것을 막기 위해 실제 논문에는 오류가 없는데 AI 도구가 오류가 있다고 보는 거짓 양성 사례를 걸러내는 것은 여전한 과제다. 때문에 AI가 1차로 발견해 낸 오류를 해당 분야의 전문가가 재검토해야 하는 과정이 필요하다.

연구자들 사이에서는 AI를 학계의 기존 검증 시스템과 결합할 경우 부실 논문 검증을 강화하고 연구 질을 높일 수 있다는 기대가 나온다. 현재 학계에서는 연구 과정에서 연구의 창의성을 확인하기 위한 진보성·표절 검사 등을 거치도록 하고 있다. 검증 과정에 AI 도구를 사용하면 논문에 언급된 키워드 몇 개를 바꾸는 방식으로 검증을 피하는 꼼수를 적발할 수 있다. AI의 참고문헌 검토 기능을 강화할 경우 학계에서 처음 나온 연구 성과임에도 불구하고 다른 학자들에게 인용되지 않아 잊혀진 연구를 발굴할 수도 있다. 유용균 한국원자력연구원 인공지능응용연구실장은 “연구 게재 전 작성자가 AI 검사를 받고 그 결과를 자율적으로 반영하는 절차가 있으면 보다 충실한 연구가 가능해질 것”이라고 말했다.