문장 고쳐쓰기1
0.오늘은 글쓰기 플로우가 아닌, 글쓰기 자체에 대해 이야기를 해보려 한다.
1.글쓰기가 누군가에게는 인문학적 소양을 요구하는 일이라면, 내 일에서는 인공지능에 관한 지식의 요구가 더 크다. 이를테면, “작은 고추가 맵다”처럼 어떤 상황을 비유적으로 표현하는 방법론에 대한 탐색보다는, 어떤 기술과 현상을 최대한 정확하면서도 간결하게 표현하기 위한 ‘앎’의 깊이를 따지는 일이라 볼 수 있다.
2.공동 작업자로 나서는 엔지니어와 리서처 또한 대단히 논리적 흐름과 사실관계를 명확하게 쓰는 걸 굉장히 중시한다. 연구 논문 쓰기가 그들의 일이라 더 그런 듯하다. 특히 카카오브레인 재직 시절 함께 일하던 수학자 한 분이 유독 기억에 남아있다. 이분은 글을 쓸 때 단어나 표현의 사전적 정의와 의미의 항상 살펴보는 일의 중요성을 역설했다. 또한, 사건의 인과관계 혹은 단순 연관 관계를 따지는 일 또한 논리적 글쓰기에서 필요한 자질이라는 점을 상기해줬다.
3.어쨌든 오늘은 일주일 만에 회신을 받은 원고를 또 수정하고 수정했다. 아무리 반복해서 읽어도 두 절을 어설프게 엮어서 만든 문장 하나가 눈에 들어왔다.
“여러 방향의 번역에 매개변수를 공유하는 구조다 보니, 다국어 학습으로 인한 시너지 효과가 일어난 것으로 분석된다.”
(1)이 문장은 1)여러 방향의 번역에 매개변수를 공유한다, 2)이런 구조는 다국어 학습 시너지 효과를 일으킨다, 이렇게 이 두 개로 나눠볼 수 있다.
(2)뼈대가 되는 표현만 남기고 다 지워봤다. : “이 구조 특성상 이런 효과가 일어난다”.
(3)뼈대에 다시 살을 붙여봤다. “한 매개변수가 여러 방향의 번역에 공유되는 구조 특성상 다국어 학습 시너지 효과가 난 거로 분석된다”
4.이런 사례를 보면 문장을 구성하는 요소를 다 해체하고 재조립해야 의미가 명확해지는 일이 많은 듯하다. 물론 이런 과정은 역시 키보드 타이핑보다는 (남이 보면 낙서로 보이는) 손 필기가 제맛이다. 반복해서 문장을 적고 고치다 보면 조금이라도 나은 문장이 나올 확률을 높일 수 있다.
5.뒤에서는 3문장의 인과관계를 다시 따져봐야 하는 문단이 있었다. 문장마다 1번, 2번, 3번의 번호를 붙이고 (1, 2, 3), (1, 3, 2), (2, 3, 1), (2, 1, 3), (3, 1, 2), (3, 2, 1) 중 더 자연스러운 흐름을 골라 이를 토대로 문단을 다듬었다. 수능 언어 영역에서도 이렇게 문단 순서를 나열하는 문제가 있었던 듯한데, 상당히 실용적인 문제다 싶었다.
6.그렇게 말이 안 되는 문장과 문단을 하나씩 고쳐나가다 보면, ‘코멘트가 0’인 상황에 수렴한다. 나는 이를 ‘오류가 0인 상황’에 근접했다고 인식하고 작업을 종료한다. 마치 학습 모델이 손실을 최소화할 때까지 학습하는 이치와 같다. 완벽한 글쓰기란 없다. 하지만 ‘작업이 완료됐음을 스스로 가늠할 수 있는 바로미터’를 세우는 글쓰기는 있을 수 있다고 생각한다.
작업한 글 : EMNLP 2020 - 다국어 번역 논문 2편을 소개합니다