스마트 스피커와 번역 어플리케이션의 관계

     

 

 회사에서 올해부터 글로벌 역량 강화를 목적으로 임직원들에게 영어회화수업을 지원해주고 있어요. 저 또한 영어를 잘하고 싶은 욕심이 많기 때문에 지원을 받아 매주 2회 점심시간을 활용해 영어회화 수업을 듣고 있습니다. (공짜는 아니고 10만원 지원 +_+)


 수업은 매시간마다 주제를 정하고, 그 주제에 대해 토론하는 방식으로 진행하고 있어요. 주제가 사전에 주어지기 때문에 그 주제에 대해 무슨 말을 할지 준비해가야 수업시간으르 좀 더 효율적으로 사용할 수 있더라구요. 하지만 영어를 그렇게 잘하지는 못하기 때문에 일단 한국어로 내 의견을 정리하고, 정리한 한글을 영어로 바꾸는 작업을 합니다. 물론 전부 바꾸지는 못해요.. ㅠㅠ 


 그래서 저는 네이버의 '파파고'앱을 자주 사용합니다. 제 생각을 한글로 적으면 바로 영어로 나오기 때문이죠. 또한 제가 작문한 영어 문장을 한국어로 번역했을때 어떻게 나오는지도 확인하는 용도로 사용합니다. 


 하지만, 파파고를 사용해 만든 문장을 수업시간에 말하면 쌤이 항상 지적합니다. 


"보통은 그렇게 표현 안 하고요, 이런 식으로 표현해요.. 블라블라"


 처음에는 아 그렇구나~ 하고 그냥 넘어갔는데, 지적이 반복되다 보니 무엇이 잘못인지 곰곰이 생각해봤어요. 나는 분명히 주제에 대한 내 생각을 한글로 적었고, 번역 앱을 이용해 영어문장으로 만들고, 그것을 그대로 말한 건데!


 그렇게 생각에 잠기다가 문득 '구글은 초반에 보유한 수많은 데이터를 기반으로 번역서비스를 제공했다' 라는 내용이 생각났습니다. '수많은 데이터'는 물론 웹페이지에 있는 텍스트 데이터일 겁니다. 그렇다는 것은, 번역서비스에 기반은 바로 텍스트로 작성된 언어라는 점이죠. 번역 시스템을 학습시키는 데이터는 아무래도 누군가가 글로 작성한 데이터가 많을 겁니다. 물론 텍스트 중에는 대화를 그대로 적은 스크립트형식의 텍스트도 존재하겠지만, 아무래도 글로 만들어진 텍스트가 더 많겠죠. 따라서 번역앱을 사용해서 번역하면 실제로 회화에서 많이 쓰이는 표현보다는 글을 쓸 때 많이 사용하는 표현으로 번역됩니다. 그렇기 때문에 번역한 문장들은 '뜻은 맞는 것 같지만 잘 안 쓰는 표현'이 되는 거죠. 그래서 원어민 쌤이 듣기에는 이상할 수밖에요...


 이제 원인을 알았으니 '어떻게 하면 이 문제가 해결될까?' 에 대해 고민해봤습니다. 음.. 일단 시스템이 학습하는 데이터가 대화형이면 좋겠지요. 하지만 대화형 텍스트는 그렇게 많지 않을 것 같고, 또 글로 옮기는 과정에서 약간의 변형이 일어날 것같다는 생각이 들었습니다. 그렇게 고민하는 중, 최근에 이슈가 되고있는 스마트 스피커가 딱 떠올랐죠.



 스마트 스피커는 아무래도 사람과 대화를 주고받기 때문에 '대화' 그 자체를 데이터로 받아들입니다. 따라서 온전한 대화형 데이터가 쌓일것 같아요. 스마트 스피커외에도 개인비서시스템(시리, 빅스비 등)들이 수집하는 대화형 데이터들을 번역 시스템에 적용하면, 좀 더 회화적인 번역이 되지 않을까? 라는 생각이 듭니다. 물론 아직은 스마트 스피커나 개인비서 서비스가 대중화되지 않아 데이터가 많지않겠지만, 서비스를 제공하는 기기들이나 서비스가 다양화되어 많은 사람들이 사용하게 된다면, 사용자들과 시스템이 주고받은 대화 역시 귀중한 데이터가 되지 않을까 생각되네요. 아마 번역외에도 여러곳에서 사용할 수 있는 데이터가 되지 않을까? 생각됩니다.


 번역 시스템이 발전해서 외국어 1도 몰라도 외국인과 대화할 수 있는 그날이 오기를... (영어공부가 더 빠를듯..)

반응형

댓글

Designed by JB FACTORY