Skip to content
Home » 인공 지능 번역 | Ai 번역으로 언어장벽 넘는다…“메타버스 활용” 17915 명이 이 답변을 좋아했습니다

인공 지능 번역 | Ai 번역으로 언어장벽 넘는다…“메타버스 활용” 17915 명이 이 답변을 좋아했습니다

당신은 주제를 찾고 있습니까 “인공 지능 번역 – AI 번역으로 언어장벽 넘는다…“메타버스 활용”“? 다음 카테고리의 웹사이트 https://hu.taphoamini.com 에서 귀하의 모든 질문에 답변해 드립니다: https://hu.taphoamini.com/photos/. 바로 아래에서 답을 찾을 수 있습니다. 작성자 서울경제TV 더하기 이(가) 작성한 기사에는 조회수 586회 및 좋아요 4개 개의 좋아요가 있습니다.

인공 지능 번역 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 AI 번역으로 언어장벽 넘는다…“메타버스 활용” – 인공 지능 번역 주제에 대한 세부정보를 참조하세요

[앵커]인공지능(AI)을 활용한 최첨단 번역 기술이 이미 우리 일상에 많이 녹아들었죠. 앞으로는 외신 기사 번역부터 메타버스에서 까지 활용 될 것이란 전망이 나왔습니다. 김수빈 기자입니다.
[기자]더이상 언어의 규칙 파악 없이도 AI 번역이 가능해졌습니다.
[싱크] 노재훈 와이즈에스티글로벌 대표
“딥러닝 방식은 인풋, 입력한 값과 아웃풋, 결과물에 대한 데이터만 지정해주면 그 안에서 신경망이 자율적으로 학습을 해서 결과만 도출을…”
과거 언어의 구조적 분석을 통해 규칙을 파악한 뒤, 알고리즘을 만들거나 통계적 방식으로 번역에 접근하던 때와는 다른 방식입니다.
현재 AI번역은 대용량 문서, 법규, 뉴스 콘텐츠 등의 영역과 소셜 네트워크, 메신저 등 일상적 대화까지 널리 사용되고 있습니다. 여기에 영상 번역과 동시 통역에서도 활용되고 있는 상황.
AI 번역이 접목될 수 있는 분야도 계속 확장되는 추셉니다.
200만 건의 해외 경제 뉴스에 대한 데이터를 구축해 기사체와 경제 뉴스에 최적화된 AI 한글 번역도 가능해졌습니다.
특히, 다양한 인종이 모일 수 있는 가상공간인 ‘메타버스’에서도 대중화 될 거란 전망도 나옵니다.
활동 범위가 글로벌로 확장되는 만큼 언어의 장벽은 더 이상 문제가 되지 않을 거란 얘깁니다.
메타버스 공간에서 오디오와 영상 콘텐츠가 다국화 되기 위해 음성인식, 자동번역, 음성 합성 등의 AI 기술이 필요합니다.
전문가들은 사람이 하는 번역과는 아직 질적으로 한계가 존재하지만, 적은 비용으로 다양한 언어를 번역해 효과를 극대화할 수 있을 것으로 내다보고 있습니다. 서울경제TV 김수빈입니다. /[email protected]
[영상편집 이한얼]

홈페이지 : http://www.sentv.co.kr/
네이버TV : https://tv.naver.com/sen
★SEN서울경제TV 유튜브 채널
핫클립 : https://bit.ly/2FsQnHw
VOD : https://bit.ly/2RPZiZ9
쎈 이코노미 : https://bit.ly/2EmOAC3

인공 지능 번역 주제에 대한 자세한 내용은 여기를 참조하세요.

“언어의 장벽 허물까”… AI번역 발전, 어디까지 – 시사위크

글로벌 시장조사업체 글로벌마켓인사이츠(Global Market Insights)가 지난해 7월 발표한 보고서에 따르면 AI 번역 기술 시장은 2020년 기준 6억5,000만달 …

+ 여기에 표시

Source: www.sisaweek.com

Date Published: 6/26/2022

View: 8168

인공지능 번역, 여기까지 오다 – SK DT Hub

문장을 통째로 번역한다는 건 이런 원리에서 나온 말입니다. 신경망 기계 번역을 기반으로 하는 에이브릴 언어 번역 API. 이 인공지능 모델은 어순, 문장 …

+ 여기에 더 보기

Source: skdt.co.kr

Date Published: 11/30/2022

View: 7776

[칼럼이 있는 AI톡]④AI 번역, 따라올테면 따라와 봐 – AI타임스

구글 번역기부터 네이버 파파고까지. 인공지능(AI) 번역 서비스는 이제 우리 일상 속 한 부분이 되었다. ‘구글 번역체’라는 표현이 무슨 의미인지 모르는 …

+ 더 읽기

Source: www.aitimes.com

Date Published: 1/20/2022

View: 9329

기계 번역 – 나무위키:대문

번역은 인공지능의 목표 중 하나였으며 지금까지 연구되는 주제이기도 하다. 팀킬? 2016년부터는 AI를 이용한 신경망 번역을 구글이 도입했고, 네이버도 …

+ 더 읽기

Source: namu.wiki

Date Published: 11/4/2021

View: 5039

인공지능이 인간 번역을 대체할 수 없는 이유 – 브런치

인공지능 기반의 자동번역 발전 속도가 눈부시다. 1~2년 전과 비교해서는 말할 것도 없고, 불과 서너 달 만에도 향상된 성능을 보여주고는 한다.

+ 자세한 내용은 여기를 클릭하십시오

Source: brunch.co.kr

Date Published: 12/5/2022

View: 4113

‘딥러닝 AI’가 신조어까지 척척 번역… 북한도 뛰어들어 – 조선일보

이달 초 북한 선전 매체 ‘조선의 오늘’은 김일성종합대학 정보과학부 인공지능기술연구소가 기계 번역 시스템인 ‘룡마’를 완성했다고 보도했다.

+ 자세한 내용은 여기를 클릭하십시오

Source: www.chosun.com

Date Published: 8/3/2022

View: 6408

MZ세대 ‘아아’도 알아듣는 기계번역, 번역가는 저무는가?

AI시대는 눈 앞에 펼쳐진 현실입니다. 그럼에도 제도나 법적 기반은 광속으로 발전하는 인공지능 기술에 발맞추지 못하고 있습니다. 똑닮은 AI후보, …

+ 여기를 클릭

Source: www.newsverse.kr

Date Published: 6/5/2021

View: 3488

인공지능 번역, 언어통일 시대가 오고 있다 – 한겨레

지난해 등장한 인공신경망 기반의 기계 번역이 그 주인공이다. □ 통계 번역 무너뜨린 머신러닝. 지난해 말, 국내 최대 포털 네이버와 인공지능 분야 …

+ 여기에 더 보기

Source: www.hani.co.kr

Date Published: 10/8/2021

View: 5600

주제와 관련된 이미지 인공 지능 번역

주제와 관련된 더 많은 사진을 참조하십시오 AI 번역으로 언어장벽 넘는다…“메타버스 활용”. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

AI 번역으로 언어장벽 넘는다…“메타버스 활용”
AI 번역으로 언어장벽 넘는다…“메타버스 활용”

주제에 대한 기사 평가 인공 지능 번역

  • Author: 서울경제TV 더하기
  • Views: 조회수 586회
  • Likes: 좋아요 4개
  • Date Published: 2022. 2. 24.
  • Video Url link: https://www.youtube.com/watch?v=Ra-sPpFTTOs

“언어의 장벽 허물까”… AI번역 발전, 어디까지

인공지능(AI) 기반의 번역 기술은 단순한 자동 번역기술을 넘어 스스로 학습하고 오답을 수정하는 기술로 진화하고 있어 다양한 분야에서 응용이 가능할 것으로 기대가 커지고 있다./ 그래픽=박설민 기자

시사위크=박설민 기자 하늘에 닿을 만큼 높은 ‘바벨탑’을 짓던 인간들의 오만함에 분노한 신이 벌을 내렸다는 이야기는 기독교 신자가 아니라도 들어본 사람들이 많을 것이다. 인간의 언어를 여러 개로 흩어놔 의사소통이 어렵게 만들었다는 성경의 이야기 말이다.

그런데 최근 언어번역기술의 성능 역시 급속도로 발전하면서 이런 신의 벌이 ‘기한’이 다한 것 아니냐는 우스갯소리가 나오고 있다. 특히 인공지능(AI) 기반의 번역 기술은 단순한 자동 번역기술을 넘어 스스로 학습하고 오답을 수정하는 기술로 진화하고 있어 다양한 분야에서 응용이 가능할 것으로 기대가 커지고 있다.

◇ AI, ‘인공 신경망 번역 기술’로 인간의 뇌처럼 번역한다

사실 인간의 능력이 아닌 ‘기계’를 활용한 자동 번역 기술의 역사는 제법 오래됐다. 지난 1940년대 시작된 냉전 시대에 미국과 소련이 상대국의 기밀 문서를 빠르게 해독하고자 기계 번역 기술 개발을 시작한 것이 시초라고 볼 수 있다.

이후 1951년 미국립과학재단(NSF)의 이사에 기계 번역 기술을 연구하던 워런 웨이버 (Warren Weaver)가 이사장이 된 후 워싱턴 대학, 미시건 대학, UC 버클리 등 주요 대학이 기계를 이용한 번역 기술 개발을 진행했다. 하지만 당시 기계 번역 기술은 일일이 사람이 모든 규칙을 만들어 입력해야 했기 때문에 수많은 언어를 번역하는 것을 구현하는 것은 매우 힘든 일이었다.

이때 기계를 활용한 언어 번역 기술에 새로운 장을 연 것이 바로 ‘인공지능(AI)’였다. 기존의 일반 컴퓨터나 번역기로는 불가능했던 수많은 언어 빅데이터를 AI는 매우 빠르게 학습하는 것이 가능했다. 이를 기반으로 만들어진 번역 기술이 바로 AI기반의 ‘인공 신경망 기계 번역’이다.

AI기반의 ‘인공 신경망 기계 번역’ 기술은 ‘사람의 뇌’처럼 AI가 번역을 하는 기술이다. 러닝을 통해 빅데이터를 AI가 스스로 학습해 번역을 수행해 데이터가 점점 늘어나 정확도는 시간이 지날수록 더욱 높아진다./ 그래픽=박설민 기자

‘인공 신경망 기계 번역(NMT·Neural Machine Translation)’의 원리는 간단히 말해 ‘사람의 뇌’처럼 AI가 번역을 하는 기술이라고 말할 수 있다. 사람은 눈이나 촉각 등 감각 기관을 통해 글자에 대한 정보를 받아들인다. 이 정보를 뇌에서 문맥, 단어의 뜻 등을 처리해 문장의 뜻을 이해하고 번역한다.

이때 NMT가 적용된 AI는 마치 사람의 뇌처럼 사용자가 번역기에 어떤 문장을 입력하면 맥락을 파악한 후, 이를 단어, 구문, 어순 등의 정보가 담겨 있는 벡터(좌표 값)로 전환하여 번역을 한다. 때문에 기존의 통계 기반 번역기와 달리 문맥을 파악할 수 있어 보다 자연스럽고 정확한 번역이 가능하다. 또한 딥러닝을 통해 빅데이터를 AI가 스스로 학습해 번역을 수행해 데이터가 점점 늘어나 정확도는 시간이 지날수록 더욱 높아진다.

이 같은 AI기반 인공 신경망 번역기술의 대표적 예는 바로 우리가 일상생활에서 아주 쉽게 이용하고 있는 ‘구글 번역기’다. 지난 2016년 11월 처음으로 글로벌 IT플랫폼 구글은 인공 신경망 번역 기술이 도입된 구글 번역기를 도입했다. 기존의 단순 통계 기반 구글 번역기보다 훨씬 높은 품질 향상을 보여줬다고 평가된다.

또한 구글 번역기나 아마존 등 글로벌 IT플랫폼 들뿐만 아니라 우리나라 대표 IT플랫폼인 네이버 역시 ‘파파고(Papago)’ 역시 구글 번역기와 마찬가지로 AI기반의 인공 신경망 번역기를 서비스 중이다. 현재 파파고는 매우 우수한 수준의 번역 기술을 보유했다고 평가받는데, 한국어, 영어, 일본어, 중국어 등 13개의 언어를 번역할 수 있다. 또한 텍스트나 음성, 사진 속 문자도 번역할 수 있다.

AI기반 구글 번역기가 적용된 삼성전자 빅스비 비전을 사용해 해외 제품을 번역해본 모습. 아주 정확하진 않지만 영어가 아닌 오스트리아어도 어느 정도 해석할 수 있는 능력을 보여주고 있다./ 박설민 기자

◇ 고유명사·전문용어 오역은 해결 과제

IT분야 전문가들은 높은 정확도와 AI 기반 인공 신경망 번역 기술이 매우 높은 활용 가치가 있다고 평가한다. 글로벌 시대로 불리는 현재, 전 세계인의 왕래가 많아진 만큼, 일상생활에서 사용할 수 있는 AI 기반 번역 기술 시장 성장에 대한 기대감이 매우 크며, 관광산업 등에서도 이용될 가능성이 매우 높다는 것이다.

글로벌 시장조사업체 글로벌마켓인사이츠(Global Market Insights)가 지난해 7월 발표한 보고서에 따르면 AI 번역 기술 시장은 2020년 기준 6억5,000만달러에서 연평균 25%의 성장률을 보이며 오는 2027년 30억달러 규모에 이를 것으로 전망됐다.

김상훈 한국전자통신연구원 책임연구원도 ‘Conversational AI 기반 다국어 자동통역 기술 동향(2021)’ 보고서에서 “국가 간 인적, 물적 교류가 활발해지면서 언어 간 장벽을 허무는 자동통역 기술의 확보는 국가 글로벌 경쟁력과 직결된다”며 “글로벌화의 가속으로 언어장벽 해소가 각 산업 분야에서 혁신적인 변화를 가져올 정도로 파급효과가 기대돼 대화형 AI 기반 다국어 자동통역 기술 확보가 무엇보다도 시급하다”고 전망했다.

IT분야 전문가들은 AI 번역 기술의 발전은 곧, AI음성비서 기술의 발전으로 이어질 것이라고 내다본다. 실제로 글로벌 IT플랫폼 아마존(Amazon)의 경우, AI비서인 아마존 알렉사에 영어를 비롯한 총 48개 언어를 통역해주는 기능을 제공하고 있다./ 아마존 홈페이지 캡쳐

또한 IT분야 전문가들은 AI 번역 기술의 발전은 곧, AI음성비서 기술의 발전으로 이어질 것이라고 예상하고 있다. 스마트폰의 보급과 AI스피커의 대중화로 AI음성비서 시장이 빠르게 성장함에 따라 전 세계에 분포한 이용자들이 사용하는 각각의 언어에 맞춘 대화형 AI서비스가 필요하기 때문이다.

글로벌마켓인사이츠는 “AI의 출현은 여러 산업 부문에 혁명을 일으키며 디지털 혁신과 자연 환경에 보다 통합된 새로운 비즈니스 모델을 가져왔다”며 “아마존의 알렉사, 구글 홈, 코타나, 애플 시리(Siri) 등 AI비서들은 기계 번역 소프트웨어를 사용하여 언어를 이해하고 사용자에게 의미 있는 피드백을 제공한다”고 전했다.

실제로 전 세계 AI음성 스피커 시장을 선도하고 있는 글로벌 IT플랫폼 아마존(Amazon)의 경우, AI비서인 아마존 알렉사에 영어를 비롯한 총 48개 언어를 통역해주는 기능을 제공하고 있다.

특히 아마존의 AI번역기인 ‘Amazon Translate’의 경우엔 55개 언어 및 변형 언어 간의 통번역 기능도 제공되는데, 글로벌 번역전문업체 인텐토(Intento)는 14개 언어 쌍, 16개 산업 부문 및 8개 콘텐츠 유형에서 Amazon Translate를 2020년 최고의 기계번역 공급자로 선정한 바 있다,

다만 아직까지 AI번역기술이 완벽한 수준은 아니며, 이에 대한 개선사항도 많다는 것이 전문가들의 의견이다. 특히 해외 고유명사나 논문 등에서 사용하는 전문 용어들에 대한 오역은 아직까지 자주 발생하는 상황이다.

김상훈 한국전자통신연구원 책임연구원은 “끊김 없는 대화형 AI 통역이 되기 위해서는 스마트폰 화면을 터치 후 말해야 하는 인터페이스를 개선해 사용성을 대폭 높여야 한다”며 “해외지명, 이름 등 외래어로 된 고유명사 인식이 잘 안되는 문제 등 실용적인 측면에서도 개선해야 할 부분이 많다”고 지적했다.

이어 “자동통역 기술을 둘러싸고 구글, MS, IBM 등 세계 IT 대표기업들의 기술개발 경쟁이 치열하게 전개되고 있는 가운데, 이를 통한 원천기술 확보와 기술선점을 토대로 세계 시장을 주도할 수 있기를 기대해 본다”고 전했다.

저작권자 © 시사위크 무단전재 및 재배포 금지

[칼럼이 있는 AI톡]④AI 번역, 따라올테면 따라와 봐

“칼럼이 있는 AI톡” 중앙대 인문콘텐츠연구소&AI타임스 공동기획

[편집자주] 인공지능(AI)이 우리 일상 생활 속으로 점점 더 가깝게 다가오고 있습니다. 인공지능의 좋은 점과 나쁜 점에 대해서 설왕설래합니다. 많은 논의들이 진행되고 있습니다. 무릇 결론은 ‘사람이 중요하다’는 점입니다.

때문에 AI기술 중심으로 움직이는 현실에서 그 속에 있는 인간과 문화, 철학과 예술에 대한 논의를 일상의 눈높이에서 해보고자 합니다. 때로는 AI에 대한 사색을, 때로는 AI 도입으로 바뀌는 삶에 대해 생각하는 재료를 만들어 선보이겠습니다. 이번 특별기획은 중앙대 인문콘텐츠 연구소와 AI타임스가 공동으로 기획하고 진행합니다.

[글 싣는 순서]

① “메타버스, 새로운 기술 아냐” 최적 타이밍 맞았을 뿐 / 박상용 교수 ② 메타버스, 한류 앞에 놓인 새로운 길 / 황서이 교수 ③ “화자(話者)가 누구인가?”가 중요해진 세상 / 조희련 교수 ④ AI 번역, 따라올 테면 따라와 봐 / 남영자 교수 ⑤ 구직자 관점에서 바라본 AI 면접 / 문혜진 교수 ⑥ AI는 소설 작가가 될 수 있을까? / 강우규 교수 ⑦ 인간과 기계의 결합: 하이브리드(hybrid) 존재, 사이보그/ 양재혁 교수 ⑧ 셰익스피어의 소네트와 AI-셰익스피어의 소네트 / 박소영 교수 ⑨ 마술은 과학을 낳고, 과학은 마술을 낳고 / 박평종 교수 ⑩ 우리들의 기술응전기(技術應戰記) / 김형주 교수 ⑪ 인공지능윤리, 그 잠재성의 중심 / 문규민 교수 ⑫ “우리는 목적 함수가 같아”: AI 리터러시 교육의 이유 / 이유미 교수

토크 포인트(Talk Points) 구글 번역기부터 네이버 파파고까지. 인공지능(AI) 번역 서비스는 이제 우리 일상 속 한 부분이 되었다. ‘구글 번역체’라는 표현이 무슨 의미인지 모르는 사람을 찾아보기 힘들 정도다. 미숙한 번역의 대명사로 ‘구글 번역체’를 사용하면서도 이미 많은 사람들이 AI 번역을 쓰고 있다. 파파고는 출시 직후부터 해외여행 필수 준비물로 자리잡았다. 아마존이나 알리 익스프레스에서 ‘직구’하는 건 구글 페이지 번역 클릭 한 번이면 된다. 반면 사용자들에게 그저 편리하게 느껴지는 AI 서비스가 관련 직종 종사자들에게는 위협이 되곤 한다. 인간 번역가라는 직업은 곧 역사 속으로 사라질 운명일까? 전문가가 말하는 정답은 ‘아니오’다. AI 번역기가 사회 속에 자리잡으면서 인간 번역가들은 오히려 일자리를 잃을 걱정을 덜게 됐다. 번역이야말로 AI가 아닌 인간이 잘 할 수 있는 일일지도 모른다.

[칼럼] 인공지능 번역, 따라올테면 따라와 봐

남영자 중앙대 인문콘텐츠연구소 HK연구교수

남영자 중앙대 인문콘텐츠연구소 HK연구교수

그야말로 AI가 연중무휴 종횡무진 전방위적 활약을 펼친다. AI에 평이 박한 사람일지언정 AI에 의존하는 대표적인 분야 가운데 하나는 기계 번역이 아닌가 싶다. 특히 대학생들의 경우 리포터나 영문 원서 번역을 위해 네이버의 ‘파파고’와 ‘구글 번역’을 이용한 경험이 있을 것이다. 기계 통번역 기술은 규칙기반 방식에서 통계기반 방식으로 발전했고, 2010년대 후반 기계 학습을 활용한 인간의 뇌 신경망을 모방한 신경망 기계번역으로 진화했다.

인공지능에 기반한 신경망 기계번역은 스스로 학습하는 방식으로 품사, 격식체 및 비격식체와 같은 언어의 사용역(register) 등을 반영해 인간과 상당히 근접한 수준으로 번역한다. 이제 인간 번역가의 위상이 흔들리지 않을지 염려된다. 일각에서는 멀지 않은 장래에 기계번역이 인간 번역가를 완전히 대체할 것으로 전망한다.

과연 AI까지 탑재해 거침없이 진격하는 기계번역은 어디까지 왔을까? 이에 필자는 구글 번역과 파파고의 한영 및 영한 번역 능력을 비교해 보았다. 먼저 필자가 좋아하는 ‘어전’을 사용한 문장을 만들어 보았다.

동생이 신의 직장이라 불리는 공사에 합격했다. 동생을 축하하기 위해 우리 집 식구는 어제 저녁 외식을 했다. 동생이 시킨 어전(漁煎)이 나왔을 때 갑자기 파리 한 마리가 날아다녔다. 나는 “감히 어전(御前)에서 파리가 날아다니다니?”라 말했다. 동생은 “짐(朕)이 오늘은 기분이 매우 좋으니, 어전(御前)에서 어전(漁煎) 위를 비행하는 파리를 용서하노라”했다.

My brother passed the construction called God’s workplace. To celebrate my brother, my family ate out last night. Suddenly, a fly flew around when the fish tank my brother ordered came out. I said, “How dare a fly fly from the fishing grounds?” My brother said, “Jim is in a great mood today, so I forgive Paris for flying over the fishing grounds at the palace.” (파파고 번역)

My younger brother passed the construction called God’s workplace. To celebrate my brother , my family ate out last night. When my brother’s order came out, a fly suddenly took flight. I said, “How dare flies fly around the palace?” My younger brother said, “Jim is in a very good mood today, so I forgive the fly that flies over it.” (구글 번역)

파파고와 구글 번역 모두 ‘동생’을 ‘brother’로 번역해 기계 번역의 고질적 문제인 성별 바이어스(gender bias)를 반영한다. 구체적으로 이름이 언급되지 않은 공공 기업체인 ‘공사’는 건설, 공사를 뜻하는 ‘construction’으로 번역됐다. 파파고는 ‘어전(漁煎)’을 어류 탱크인 ‘fish tank’, ‘어장’을 ‘fishing grounds’로 번역했고, 임금의 앞인 ‘어전(御前)’을 임금이 거처하는 궁전인 ‘palace’로 번역했다. 구글 번역은 동생이 시킨 ‘어전(漁煎)’을 동생이 주문한 것으로 영리하게 회피해 번역했고, ‘어전(御前)’을 ‘palace’로 번역했다.

‘파리’는 번역기에서 이렇게 다르게 번역될 수도 있다. (사진 편집=임채린 기자)

한편 파파고는 날아다니는 ‘파리’는 ‘fly’로, 용서의 대상이 되는 ‘파리’는 프랑스 수도 ‘Paris’로 번역했다. 구글 번역은 ‘파리’를 일관되게 ‘fly’로 번역했다. 두 번역기 모두 임금이 자기를 가리키는 일인칭 대명사인 ‘짐’을 사람 이름 ‘Jim’으로 번역했다.

다음으로 10대와 20대가 즐겨 쓰는 줄임말을 사용해 보았다. ‘아아(아이스 아메리카노) 1잔, 따아(따뜻한 아메리카노) 1잔’을 파파고는 ‘One iced americano, one hot americano’로 정확하게 인식했고, 구글 번역은 ‘Aah 1 cup, daa 1 cup’으로 ‘아아’와 ‘따아’를 소리나는 대로 번역했다. ‘친구 생파(생일파티)로 생선(생일선물)을 준비했어’를 파파고는 ‘I got you fish for your friend’s birthday’로 번역해 생파에 대한 업데이트는 되어 있지 않은 것을 보여줬다.

반면 구글 번역은 ‘I prepared fish with my friend’s fresh green onion’로 번역해 입력 단어인 생파의 표층 의미를 최대한 반영하고자 애쓴 듯하다. ‘안 물어 본 것’과 ‘안 궁금한 것’의 합성어인 ‘안물안궁’을 파파고는 ‘I didn’t ask’로 그리고 구글 번역은 ‘안물안 궁’으로 인식해 ‘Anmulan Palace’로 번역했다.

필자가 나열한 기계번역의 오역은 ‘귀여운 애교’라 할 수 있으나 경우에 따라 오역은 중차대한 결과를 초래할 수 있다. 인류 역사상 살상을 목적으로 핵무기가 사용된 유일한 사례인 일본 원자폭탄 투하는 오역이 부른 참사로 알려져 있다. 1945년 7월 26일 독일 포츠담에서 미·영·중 수뇌부는 일본의 항복 조건을 규정한 포츠담 선언문을 발표했다. 포츠담 선언은 “무조건 항복 외 다른 대안은 즉각적이고 완전한 파멸”이라는 일본을 향한 최후통첩이었다.

7월 28일 일본 스즈키 칸타로 총리는 포츠담 선언에 대해 ‘논평을 유보한다’는 의도로 여러 가지로 해석될 소지가 있는 ‘모쿠사츠(黙殺)’라는 표현을 사용했는데, 이를 일본 언론에서 ‘무시하다’로 번역했다. 이러한 일본의 오만함(?)은 미국 국민과 트루만 대통령의 분노를 샀고, 8월 6일과 9일 각각 히로시마와 나가사키에 원폭이 투하됐다.

위 예시는 상황과 맥락에 대한 오판이 초래한 가장 극단적인 결과라 할 수 있다. 분명한 것은 번역은 좁게는 화자의 몸짓, 눈빛, 어조, 뉘앙스에서 넓게는 국제정세와 외교의 흐름에의 이해를 요한다. 또한 번역은 사회·문화적 문맥, 지정학적 문맥 등의 지배를 받는다. 경우에 따라서는 화자의 이야기를 목표 언어의 사회·문화·역사·정치적 문맥에 맞추어 재해석해야 한다. 이렇듯 총체적 상황에 대한 이해가 가능해야 소기의 번역이 가능한 것이다.

필자가 제시한 ‘어전’ 예문에서 보았듯이 기계번역은 상황 전체를 파악하기에는 아직은 역부족인 듯하다. 더 나아가 언어가 화자의 감정을 반영한다는 점은 인간 번역가의 특화 영역을 확장시킨다. 기계번역에서 오류가 잦은 부문도 인간 번역가를 대상으로 하는 틈새시장을 만들 것이다. 결국 기계번역이 인간 번역가를 완전히 대체하는 날은 아직은 요원한 듯하다.

비하인드 인터뷰 칼럼을 읽은 후 칼럼니스트에게 질문 혹은 반문하는 것은 다소 귀찮거나 힘든 일이다. 독자를 대신해 AI타임스가 여전히 남은 궁금증을 풀어봤다. 조금은 매울지도. 남영자 중앙대 인문콘텐츠연구소 HK연구교수(사진=남영자 교수·네이버·구글·셔터스톡, 편집=박성은 기자) Q. AI 번역은 이미 우리 일상의 일부가 됐다고 해도 과언이 아니다. 인간 번역가들이 여기에 위기감을 느끼진 않는지? 영국과 같은 유럽 지역에서 관련 설문조사를 진행한 바 있다. AI 번역기가 처음 등장했을 때는 “우리는 이제 끝났다”라는 마음이었다면 이제는 걱정이 줄어든 것 같다. Q. AI 번역기가 인간 전문가를 완전히 대체 가능할까? 가능하다면 시기는 언제라고 보나? 번역 일은 많은 시간이 흘러도 AI가 완전히 대체하기는 힘들 거라 본다. 오히려 사람이 돋보일 수 있는 영역이 아닐까 생각한다. 번역은 단순히 해석하는 작업이 아니다. 인간 번역가들도 비슷한 의미를 각기 다르게 표현한다. 여기에는 개인 삶의 경험이 관여하기에 아무리 많은 데이터를 넣어도 AI가 하기 힘들 것 같다. Q. 번역가 이외 사용자들은 의견은 다를 수도 있을 것 같은데? IT 기업 고위직 종사자를 대상으로 의견을 물었더니 60~70% 정도가 계약 성사 건은 반드시 인간에게만 맡긴다고 답했다. 기술 분야 종사자들이 이러한 답을 했다는 것이 인상적이다. Q. 번역일을 완전히 AI에게 맡기기 어려운 이유는 무엇일까? 번역 오류가 나는 이유는? 언어에서는 수학과 달리 1대1 매칭이 안 되는 경우가 많다. ‘사과’를 반드시 ‘Apple’로 해석할 수 없는 것이다. ‘감칠맛’과 같은 단어는 특히 영어에는 아예 없는 것이다. 이외 언어 자체 특성, 각 국가·지역 간 문화 차이, 말을 하는 화자와 분위기, 감정 등 수많은 요소가 개입한다. Q. 칼럼 본문에 나오는 ‘사용역’이 표현에 개입하는 요소들인 것 같다. 범위는 어디까지인지? 표현 하나가 등장한 T.O.P(Time.Place.Occasion)가 모두 사용역에 해당한다. 사투리부터 발음, 억양, 화자의 표정까지 모두 해당한다. Q. 성별 편향성 문제는 AI 번역의 대표적인 한계점이다. 발생 원인이 궁금하다. AI 번역에 사용한 데이터 자체에 편향이 있기 때문이다. 영어가 AI 번역 데이터 대부분을 차지하는 것도 성별 바이어스에 영향을 미친다. 영어에서는 우리말과 달리 꼭 ‘He’와 ‘She’를 구분한다. 언어 자체에 성별 구분 성격이 있다는 의미다. Q. AI 번역기가 ‘아아(아이스 아메리카노)’, ‘뜨아(뜨거운 아메리카노)’와 같은 유행어를 번역해내 이슈화되고 있다. 어떻게 가능한 일인지? 사용자 수정 기능을 통해 주 사용자인 젊은 층이 업데이트를 한 것으로 보인다. 유행어 번역은 사실 다른 것보다 오히려 간단하다. ‘아아’가 반드시 아이스 아메리카노를 의미하는 것처럼 고유명사와 같은 성격을 지니기 때문인 것 같다. Q. 기업 간 계약이나 국가 외교에는 어렵겠지만 AI 번역기가 힘을 발휘할 수 있는 분야도 있을 것 같은데? 논문과 같이 비교적 정형화된 글과 문장 형식을 사용하는 분야에서는 비교적 수월할 거라 생각한다. 소설, 시와 같은 예술 영역에서는 정서라는 것이 중요하기 때문에 AI가 잘 할 수 있는 영역은 아닌 것 같다. Q. AI 번역은 데이터가 많이 필요한 분야로 보인다. 대기업 밖 연구자들이 할 수 있는 일이 있을까? AI 번역기 개발 이외에도 할 일들이 많다. 구체적으로 어떤 연구를 하느냐에 따라 필요한 인력과 비용에 차이가 있다. 예를 들어 나는 지금 감정언어 데이터셋 구축 연구를 진행 중인데 파파고 개발에 들어가는 만큼의 데이터와 인력이 필요하진 않다. Q. 구글 번역기, 파파고 이후 차세대 AI 번역 기술은 어떤 모습일까? AI 실시간 통역이라 할 수 있겠다. AI 통역도 적용 분야마다 난이도나 실현 가능성에 차이가 있다. 호텔이나 음식점에 적용하는 것은 수월하겠지만 사업이나 외교에서는 어려울 것이다. 질문 자체를 해석하는 것 이외 행간이나 분위기를 읽는 것이 중요한데 이 플러스 알파가 가능해지려면 시간이 상당히 걸릴 것 같다.

남영자 중앙대 인문콘텐츠연구소 HK연구교수는 현재 감정언어 데이터셋 구축에 주력 중이다. 남 교수의 주요 연구 분야는 음성 감정 인식(Speech emotion recognition), AI 음성 페르소나(AI-voice persona), 음성 인식(Speech perception), 음성학(Phonetics), 음향심리학(Psychoacoustics) 등이다.

AI타임스 박성은 기자 [email protected]

인공지능이 인간 번역을 대체할 수 없는 이유

인공지능 기반의 자동번역 발전 속도가 눈부시다. 1~2년 전과 비교해서는 말할 것도 없고, 불과 서너 달 만에도 향상된 성능을 보여주고는 한다. 구글은 물론 국내 기업 네이버도 방대한 양의 언어 데이터와 전문 용어를 수집하면서 자동번역 성능을 가속화하고 있다. 이런 상황에서 인공지능 번역이 인간의 번역을 대체할 수 있는 이유 네 가지와 절대로 대체할 수 없는 이유 한 가지를 짚어 본다.

자동번역이 인간의 번역을 대체할 수 있는 이유 네 가지

하나, 자동번역은 기술의 축적이 가능하다.

모든 인간은 태어나서 ‘엄마’라는 단어부터 똑같이 언어를 배워야 하며 그가 죽는 순간 그가 습득한 모든 언어 지식도 생명이 끝난다. 그의 다음 세대는 또다시 ‘엄마’부터 언어를 배우기 시작한다. 이에 반해서 자동번역은 수집된 언어 데이터뿐만 아니라 그것을 처리하는 기술 또한 100% 이전이 가능하고, 후대는 이 기술을 기반으로 더 나은 기술을 발전시켜 나갈 수 있다. 뿐만 아니라 자동번역은 수많은 사람들이 공동으로 개발, 발전시킬 수 있고 서로의 장점을 쉽게 이식하거나 학습시킬 수 있다. 이와 같은 과정이 반복되면 인간보다 자동번역의 수준이 높아질 것이다.

둘, 컴퓨팅 성능이 발전하고 있다.

현재 자동번역을 학습시키는 방법은 수십만에서 수백만 개에 달하는 언어 데이터를 인공지능 알고리듬(NMT)를 사용하여 원문과 번역문 간의 상호 연관성(패턴)을 찾도록 하는 것인데, 이것을 수행하기 위해서는 고성능 그래픽 카드를 장착한 컴퓨터가 필요하다. 또한 컴퓨터만 있다고 한 번에 뚝딱 되는 것이 아니라, 연산을 완성하는 데에는 데이터의 양에 따라 며칠 또는 몇 주라는 시간이 걸린다. 즉, 한번 테스트해서 결괏값을 보는데 수일에서 수 주가 걸린다는 말이다. 이런 상황에서 최근 구글은 기존의 슈퍼컴퓨터로는 1만 년이 걸리는 수학 연산을 시카모어라는 양자 컴퓨터를 통해 200초 만에 풀었다는 뉴스를 발표했다. 만약 이것을 이용해서 자동번역 연산을 수행한다면 데이터를 입력하는 즉시 학습된 엔진을 얻을 수 있을 것이다.

이처럼 비약적인 컴퓨팅 성능의 발전은 궁극적으로 거의 무제한의 데이터를 단시간에 학습할 수 있는 인공지능의 출현을 기대하게 하는 대목이다.

셋, 방대한 데이터를 수집하고 활용할 수 있다.

내가 하나의 문장을 쓰는 1분 동안 550명의 새로운 사용자가 SNS에 유입되고, 약 50만 건의 트윗이 생성되며, 400시간 분량의 비디오가 유튜브에 업로드되고 있다. 앞 문장을 쓴 1분 동안 페이스북에서는 50만 건 이상의 글이 새롭게 포스팅되었고, 13만 6천 장 정도의 사진이 업로드되었다. 구글에서는 매분 35억 건의 검색이 발생하고 있다. 이러한 활동을 통해서 우리는 매일 2,500,000,000,000,000,000바이트의 정보를 생성하고 있다.

인간은 하루에 책 한 권도 읽기 힘들다. 현대사회에서 쏟아지는 정보를 습득하기에는 택도 없는 분량인 것이다. 이에 비해 컴퓨터는 이 모든 정보를 크롤링(Crawling)해서 학습할 수 있다. 번역 능력이라는 것은 결국 자신이 학습한 정보에 비례한다고 전제할 때, 인간은 절대 컴퓨터를 능가할 수 없다.

넷, 휴먼번역으로 감당하기 불가능한 양의 정보가 생성된다.

당사의 최고로 숙달된 번역사는 하루에 20~30페이지 정도의 번역 분량을 소화할 수 있다. 일반적으로는 하루 10페이지를 적정 한계로 본다. 회사 단위에서 보자면 우리 회사는 매일 약 1천여 장의 번역을 처리해야 매월 약 5억 원의 매출을 유지할 수 있다.

하지만 만약 이것을 컴퓨터가 한다고 하면 현재 컴퓨팅 성능으로도 하루나 이틀이면 충분하리라 생각한다. 이처럼 사람에 의존하는 번역은 현대 사회에서 생성되는 정보의 속도를 처리하기에 본질적으로 불가능하다. 그리고 인간이 번역하고 부족한 부분을 기계가 채워줄 것이라는 말도 간혹 있는데, 이것은 맞지 않다. 엄밀하게 말해서 기계가 번역하고 부족한 부분을 인간이 채워준다고 말하는 것이 맞을 것이다.

하지만 이러한 네 가지 이유에도 불구하고, 자동번역이 인간의 번역을 대체할 수 없는 이유 단 한 가지.

기계는 인간처럼 번역할 수 없다.

요즘 화제인 영화 「기생충」의 한 대사다. 화면에서 보이는 대사 중 ‘서울대학교’를 ‘Seoul National University’로 번역했다면, 그리고 ‘짜파구리’를 ‘Jjapaguri’와 같이 음역하는 정도로 그쳤다면 해당 영화가 해외의 유수 영화제에서 외국어 영화상 등을 휩쓸 수 있었을지 의문이다. 사람은 서울대를 옥스퍼드로 번역할 수 있고 ‘옥스퍼드’ 대신 ‘하버드’를 넣어도 된다는 것을 판단할 수 있다. 그렇다고 프린스턴이나 동경대와 같은 이름을 사용하진 않는다. 말의 맥락이 달라진다는 것을 ‘판단’할 수 있기 때문이다. 이러한 판단은 기계가 수집하여 학습하기 불가능한 정도의 광범위한 비정형적 데이터 즉, 개인의 경험, 지식, 문화적 배경, 역사, 국가 간 상관관계 등을 기초로 형성될 뿐만 아니라, 이 대사를 통해서 달성하고자 하는 의도까지 파악할 수 있어야 가능한 것 때문에, 단순히 언어 간 상관관계를 맵핑하여 룰을 찾아내는 현재의 인공지능 방식으로는 영원히 노력해도 도달할 수 없는 영역이라고 확신할 수 있다. 컴퓨터에게는 수십만 개의 기보를 학습하여 룰을 익히는 것보다, 반지하에 사는 배우가 던진 대사 한마디의 맥락을 파악하는 것이 훨씬 더 어려운 일이다.

이와 같은 경우는 매우 특수한 사례가 아니냐고 반문할 수도 있을 것 같은데, 실은 이 사례는 일반 대중의 이해를 돕기 위하여 요즘 유행하는 영화의 예를 든 것일 뿐, 전문 번역의 영역에서는 이와 같은 판단을 기초로 하지 않고는 단 한 장의 번역도 제대로 완성할 수 없는 경우가 대다수라고 말할 수 있다. 예를 들어 당사가 한국관광공사와 함께 진행하고 있는 프로젝트의 경우, 연간 수천 개에 달하는 국내 음식명, 문화재, 관광지명과 같은 용어가 이와 같은 과정을 통해서 번역되고 있다.

결론은?

휴먼번역과 자동번역, 그래서 누가 더 낫냐고 물어본다면 질문의 관점부터 잘못된 것이라고 답할 것이다. 태극기에 있는 빨간색과 파란색 중 어떤 색이 더 낫냐고 물어본다면 여러분은 과연 뭐라고 답할 것인가? 언어는 인간의 지식과 경험, 감정을 총체적으로 표현하는 수단이다. 그중 기계가 잘 할 수 있는 영역은 분명히 있으며, 우리는 그것을 기계에게 맡기면 되고, 또 마찬가지로 기계는 할 수 없는, 사람만이 할 수 있는 영역은 우리 사람이 하면서 함께 협업하는 것이 답이다.

MZ세대 ‘아아’도 알아듣는 기계번역, 번역가는 저무는가?

AI시대는 눈 앞에 펼쳐진 현실입니다. 그럼에도 제도나 법적 기반은 광속으로 발전하는 인공지능 기술에 발맞추지 못하고 있습니다. 똑닮은 AI후보, AI앵커도 나왔지만 AI후보의 선거운동이나 AI앵커가 범한 명예훼손은 어떻게 봐야 하는지, AI가 발생시킨 손해는 어찌 구제받아야 하는지 아직은 어떤 것 하나 명쾌하게 설명할 수 없습니다.

김윤명의 ‘법과 인공지능 이야기’는 AI시대에 맞닥뜨리게 될 이런 문제와 딜레마적 상황을 여러 묶음으로 말랑말랑하게 풀어나갈 예정입니다. 과연 기계는 인간을 대신할 수 있을까요? / 편집인 주

스마트폰으로 외국어 자료를 스캐닝하면 바로 번역됩니다. 메뉴나 안내판은 물론 복잡한 문서도 포맷을 유지한 채로 가능합니다. 해외 관련 여행이나 출장을 위한 필수 아이템이 구글번역이나 네이버 파파고라고도 합니다. 음성인식과 결합되면서 자동통역도 가능합니다. 더욱이 화자의 성문(聲紋)을 자동통역이 인식하여 그대로 통역해주는 기술도 개발되고 있습니다.

한글과컴퓨터그룹은 2019년 3월 13일 중국 기업 아이플라이텍과 개발한 자동 회의록 작성과 통번역이 가능한 지니비즈(AI 회의 솔루션)와 인터넷 환경에 관계없이 외국인과 자유롭게 대화를 나눌 수 있는 지니톡고(AI 통번역기)를 공개했다. 사진은 모델들이 지니비즈와 지니톡고를 소개하는 모습. (사진=뉴스1)

앞으로는 외국어에 대한 부담 없는 시대가 도래할 것입니다. 기계번역은 외국어에 대한 접근성을 높여줍니다. 표현의 자유를 보장하고 서로 차별하지 않음으로써 사회의 민주화가 진행돼 왔듯이, 누구라도 자유롭게 원하는 언어를 쉽게 접할 수 있는‘번역의 민주화’도 머지 않았습니다.

기계번역은 일상의 대화를 넘어 높은 수준의 전문적인 내용도 가리지 않습니다. 기계는 오히려 편안한 대화처럼 문법체계를 온전하게 갖추지 못할 때 힘들어 합니다. 좋은 품질의 번역이 나오려면 원문(source language)이 비교적 완벽해야 합니다. 우리는 일상에서 나를 포함한 주어를 생략하곤 합니다. 화자를 굳이 표현하지 않아도 되기 때문입니다. 물론, 기계번역은 문맥을 파악하여 화자를 설정함으로써 번역문을 완성합니다.

기계번역은 어떤 사연으로 시작되었을까요.

당초 기계번역의 주된 목적은 상대국 정보를 얻기 위한 것이었습니다. 냉전시대, 미국은 소련의 정보를 얻기를 원했습니다. 소련도 마찬가지였습니다. 상대국의 언어를 습득하는 것은 쉬운 일이 아니었기에, 기계번역을 통하여 원하는 정보를 쉽게 얻을 수 있을 것이라는 기대를 한 것이지요. 나름대로 효과가 있었습니다. 언어규칙(문법)에 맞도록 번역시스템을 개발했기 때문에 규칙에 맞는 구문의 번역은 정확하게 할 수 있었으니까요.

그렇지만, 사람의 언어는 항상 규칙적이지는 않습니다. 다양한 의미를 가진 단어, 상황에 따라 다르게 이해되는 표현은 인간도 난감한 일일 때가 많습니다. 말의 해석과 이해는 인간에게도 쉬운 일이 아닙니다. 이러한 이유로 기계번역은 인공지능 암흑기(AI winter)와 함께 합니다. 정부의 투자가 삭감됩니다. 대신, 암흑기에 인공지능은 범용 인공지능(Genreal AI)이 아닌 자연어 처리(natural language processing), 이미지 인식을 위한 컴퓨터 비젼(computer vision) 등 세부적인 영역으로 분화됩니다. 기계번역은 자연어 처리의 한 유형입니다.

딥러닝을 이용한 기계번역 이전까지 빈도가 높은 단어를 중심으로 통계 기반의 기계번역을 해왔습니다. 그렇지만, 구글이나 네이버가 신경망 번역(NMT, Neural Machine Translation)을 도입한 전후로 번역의 품질은 하늘과 땅만큼의 차이가 납니다. 보다 자연스러운 결과를 확인할 수 있습니다.

현대자동차그룹이 2020년 12월 18일 공개한 인공신경망(두뇌의 정보처리 역할을 하는 신경망 형태를 모방한 인공지능 알고리즘의 일종) 기반의 기계번역 앱인 ‘H-트랜스레이터(H-Translator)’. 모바일 기기로 한국어와 영어로 빠르고 자유롭게 커뮤니케이션 할 수 있다. (사진=뉴스1)

데이터는 번역품질을 높일까요?

기계번역이 품질을 높이게 된 것은 데이터를 가지고 학습하기 때문입니다. 기계가 데이터 기반의 학습을 통하여 고도화하는 과정을 기계학습(machine learning)이라고 합니다. 인간이 학습하는 매커니즘과 크게 다르지 않습니다. 다른 점이 있다면 학습 자료가 데이터라는 것입니다. 이를 빅데이터라고 하는데, 많을수록 학습효과는 높아집니다.

참고로, 네이버 파파고나 구글 번역을 위해서 수백억 개의 말뭉치가 사용되었습니다. 데이터 기반의 기계학습으로 번역의 품질은 생각보다 높습니다. 대략적인 내용을 확인하기 위한 목적이라면 충분한 수준이 될 것입니다. 요즘엔 MZ세대의 줄임말인 ‘아아(아이스 아메리카노)’나 ‘뜨아(뜨거운 아메리카노)’까지도 번역됩니다. 다만, 인간의 번역이 아니기 때문에 인간의 감정이나 의도와 맥락을 이해하지 못한 경우엔 전혀 다른 결과가 나오기도 합니다.

번역 품질이 떨어지거나 번역오류 등에 따라 기계번역 과정에서 필수적으로 요구되는 과정이 있습니다. 원문을 작가가 의도한 바와 같이 번역했는지, 기술적인 표현이 맞는지, 인간의 감정과 맥락 등 뉘앙스에 가깝게 되었는지를 확인합니다.

이 과정이 있은 후에야 비로소 번역이 완성됩니다. 상업적인 목적이나 대중에게 전달을 목적으로 하는 경우라면 검수는 거쳐야할 과정입니다. 물론, 개인적인 목적일 경우엔 감수과정은 필요없겠지만.

기계번역은 공공선인가?

번역이 자유로운 시대에도 우려할 점은 있습니다. 기계번역이 누구나 가져야 할 공동의 가치인 공공선에 부합하는지 한번 따져볼 일입니다.

침략의 역사에서 통번역은 반드시 필요했습니다. 통역이 중간에서 자신을 위한 정치를 하기도 했습니다. 언어의 전달이 수용국의 언어생활에 기여한다는 점을 무시할 순 없겠지만, 수용국 입장에선 문화 종속 등 또다른 국제적‧정치적 이해관계가 걸린 문제이기도 합니다.

이러한 이유 때문에 기계번역도 공공선에 부합할 수 있도록 해야합니다. 인공지능 윤리가 논의되고 있는 이유라고 보시면 되겠습니다. 번역어의 문화와 언어생활에 부합하는 용어를 선택해야할 것입니다.

기계번역 기술이 발전해가는 과정이고, 다양한 언어를 습득하기 위한 말뭉치(corpus)가 만들어지고 있습니다. 일본을 선두로 EU나 영국 등 여러 나라에서 학습데이터의 확보를 뒷받침하기 위한 저작권법을 개정하고 있습니다. 우리나라도 데이터 마이닝을 위한 저작권법 개정안이 국회에 발의되어 있습니다.

이러한 법개정은 자국 인공지능 기술의 발전을 위한 것이기는 하겠지만, 글로벌 시장에서의 인공지능 기술 선점이 문화 전파를 용이하게 할 수 있다는 점도 고려된 것입니다. 기술 발전은 문화현상까지도 이끌어낼 수 있다는 점을 잊어선 안됩니다. 공공선에 대한 고민은 단지 기계번역만의 문제는 아닙니다. 늘 고민이 필요한 건 모든 기술발전이 같은 딜레마를 안고 있기 때문입니다.

2017년 2월 21일 서울 광진구 세종대학교 광개토관에서 열린 ‘인간번역사와 인공지능(AI)의 번역대결’. 참가 교수들이 네이버 파파고, 구글 번역기, 시스트란 번역기에 지문을 입력하고 있다. (사진=뉴스1)

그럼, 번역가의 일자리는 안녕할 수 있을까요?

번역은 단순한 언어의 변환이 아닌 언어 속에 담긴 인간의 문화와 의식을 변환하는 것입니다. 기계번역은 인간의 감정적인 영역까지는 훌륭하게 번역하지는 못합니다. 인간답게 하는 표현을 감수하는 것은 인간의 몫이기 때문이지요.

무엇보다, 기계번역은 인간을 위한 도구일 뿐이라는 점입니다. 아직은 인공지능이 사람처럼 반응하더라도 사람이 될 수는 없습니다. 영화 에서 나오는 인공지능인 샤만다처럼 스스로 사고하거나 인간을 이해할 수 있는 존재가 되긴 힘들 것입니다.

기계번역에 인간만의 가치를 더할 수 있다는 점은 번역가가 존재하는 이유가 될 것입니다. 아직은 인간의 감수가 필요하기에 기계번역이 인간 번역가를 대체하기는 쉽지 않을 것입니다. 그런 면에서 번역가의 일자리는 당분간은 안녕할 것입니다.

다음 편은 로봇과 기자에 대한 얘기입니다. 번역가와는 또다른 차이가 있지만, 이미 기자로서 기사를 쓰고 있는 경우도 꽤 있습니다. 과연, 로봇은 기자의 영역까지 다가설 수 있을까요?

인공지능 번역, 언어통일 시대가 오고 있다

[미래] ‘디지털 바벨탑’의 도래

전시 암호해독으로 시작한 기계번역

자가학습 하는 ‘3세대 번역’으로

인간에 견주거나 능가할 수준 올라

번역하는 인공지능 시각화했더니

언어 달라도 같은 뜻 비슷하게 인식

국가간 언어 장벽이 사라진다면…

교류와 소통 활발해지겠지만

사이버공간 민족 갈등 격화될수도

technology_우리는 가끔 다른 사람의 마음속을 들여다볼 수 있는 능력이 있다면 얼마나 좋을지 상상하지만, 실제 그런 능력을 얻게 된다면 모르는 게 차라리 나았겠다며 고통에 빠진다. 언어의 장벽은 국가 간에 그런 마음의 안전장치 구실을 해왔다. 일베의 일본 혐오 게시물을 일본의 친구가 직접 읽을 수 있게 된다면 어떻겠는가? 인공지능 번역의 발전은 그런 시대의 도래를 당기고 있다.

(※ 이미지를 클릭하면 확대됩니다)

주님께서 내려오시어 사람이 세운 도시와 탑을 보고 말씀하셨다. “보라, 저들은 한 겨레이고 언어도 하나이다. 이것은 이들이 하려는 일의 시작일 뿐 이후 이들이 하고자 하는 일을 막을 수 없으리로다. 자, 우리가 내려가 그들의 언어를 혼잡하게 하여 서로 알아듣지 못하게 하자.” 그리하여 주님께서 그들을 온 지면에 흩으셨으니 그들이 도시를 건설하기 그쳤더라. 그러므로 그 이름을 바벨이라 하니, 주님께서 거기서 온 땅의 언어를 혼잡하게 하셨음이니라.(창세기 11장 5~9절)

성경에 등장하는 바벨탑의 이야기는 인간이 다양한 언어를 갖게 된 이유에 관한 신화이다. 인간의 오만은 신이 있는 하늘에 도달할 정도의 거대한 탑을 건설하게 하였고, 이를 용납할 수 없었던 신은 언어로써 인간을 벌하였다. 언어학자들은 실제 전세계 언어가 5000에서 7000개 사이 정도 되는 것으로 추정한다. 그러나 기술의 발전은 드디어 이런 신의 형벌마저 깨뜨릴 수준을 바라보게 되었다. 지난해 등장한 인공신경망 기반의 기계 번역이 그 주인공이다.

지난해 말, 국내 최대 포털 네이버와 인공지능 분야 세계적 선두주자 구글은 나란히 인공지능 기반 번역 서비스를 내놓았다. 네이버는 인공신경망 기술을 적용한 새로운 번역 서비스 ‘파파고’를 10월에, 구글은 기존 ‘구글 번역’에 인공신경망 기술을 적용한 완전히 새로운 수준의 번역 서비스를 11월에 출시한 것이다.

우리는 이미 알파고와 이세돌 9단의 바둑 경기를 통해서 인공지능의 불가사의한 힘에 대한 예방접종을 맞은 바 있지만, 구글의 새 번역 서비스는 전세계 트위터 타임라인에서 큰 화제를 몰고 왔다. 구글은 최초의 별도 알림 없이 인공지능 번역을 ‘조용히’ 적용했는데, 어떻게 하룻밤 사이에 번역이 이렇게 좋아질 수 있는지 모두들 놀랐던 것이다. 는 12월 ‘위대한 인공지능의 각성’이라는 제목의 기사로 이를 집중적으로 다루었다. 일본 도쿄대 정보학과 레키모토 준 교수는 이 신문과 한 인터뷰에서 영어 소설 를 놓고 소설가 무라카미 하루키 번역본과 구글 번역을 직접 비교한 예를 들며 “작은 부자연스러움”을 빼면 “(구글 번역이) 더 명확했다”고 놀라워했다. 김정균 번역가도 새 구글 번역을 두고 “판도라의 상자가 열렸다”며 두려움에 떨었다.

하지만 인간이 이 수준에 도달하기까지 ‘기계 번역’ 기술의 역사는 60년을 거슬러 올라간다. 1950년대 냉전 초기, 미국의 과학자들은 당시 소련의 말을 컴퓨터로 번역하기 위해 박차를 가하고 있었다. 이들은 번역을 2차 세계대전의 독일군 암호 해독과 비슷하게 여겼다. 러시아어와 영어의 법칙을 풀어 코드를 입력하면 컴퓨터가 러시아어를 영어로 술술 풀어내리라고 생각한 것이다. 이런 믿음은 미 정부의 예산지원과 함께 10년 동안 이어졌지만 결실을 맺지 못했고, 1966년 위원회까지 꾸려 검토에 나선 미국은 이 계획이 성공할 수 없다고 결론 내렸다. 기계 번역은 이후 20년가량 동면을 맞게 된다.

사실 언어의 법칙을 풀겠다는 방식 자체가 이런 실패를 예정하고 있었다. 언어란 복잡 미묘해서 해독 규칙을 많이 입력하면 할수록 결과는 이상해지기 마련이기 때문이다. 인터넷에 나도는 ‘번역기 개그’가 좋은 예다. 동요 ‘짤랑짤랑’을 과거 번역기에 넣고 영어로 번역했다 다시 한글로 번역하면 “으쓱 으쓱~”이 “공포의 떨림과 공포의 떨림과~”로 나오는 식이다. 이런 접근법을 ‘규칙 기반’의 1세대 기계 번역이라 할 수 있다.

기계 번역의 동면을 깨운 것은 아이비엠(IBM)이었다. 1980년대 이 회사 연구진은 통계를 이용하면 번역 품질을 획기적으로 높일 수 있다는 점을 깨달았다. 인간이 번역한 많은 결과를 데이터화하면 통계적으로 어떤 단어 다음에 어떤 단어가 나오는 게 자연스러운지 산출할 수 있다는 것이다. 이것이 ‘통계 기반’의 2세대 기계 번역이다. 2세대의 강자는 프랑스의 시스트란과 미국의 구글이었다(시스트란은 2014년 우리나라 번역업체 씨에스엘아이(CSLi)가 인수했다). 통계가 적중할 확률을 높이려면 많은 데이터 확보가 관건이다. 인터넷 전체를 데이터베이스화해온 구글은 이런 면에서 강했다. 번역 엔진을 만들던 2005년에만 구글이 국제연합(UN)의 문서 등을 통해 확보한 데이터가 2000억 단어를 넘었다. 예전 네이버 번역을 비롯한 다른 대표적인 번역 서비스도 이런 통계 방식을 기반으로 하고 있다.

그리고 3세대 ‘인공신경망 기반 번역’ 시대가 지금 우리 눈앞에 펼쳐지고 있다. 인공신경망 방식도 데이터를 이용한다는 점에서는 통계 방식과 같지만, 방법이 전혀 다르다. 인공신경망은 아기가 시행착오를 겪으면서 무언가를 배우듯이, 우리 뇌의 뉴런을 흉내낸 인공지능 프로그램을 만들고 이 인공지능에게 수많은 한글-영어 번역 데이터를 줘서 스스로 학습하도록 하는 것이다. 이렇게 학습한 인공지능은 이후 새 번역거리를 받으면 가장 자연스럽다고 예측하는 결과를 내놓는다. 이는 알파고 원리와도 같다. 알파고 역시 수많은 바둑 기보로 학습한 뒤 가장 이길 것 같은 자리에 돌을 둔다. 네이버의 파파고도 구글 번역과 원리는 같다.

(※ 이미지를 클릭하면 확대됩니다)

바둑처럼 번역에서도 인공지능은 다시 한번 놀라운 능력을 보여줬다. 기계 번역의 품질은 인간 전문가와 비교했을 때 얼마나 비슷한지에 대한 ‘블레우(BLEU) 점수’라는 척도로 평가하는데, 에 따르면 구글이 자체평가한 인공지능의 점수는 이전 통계 방식 번역기가 보여준 최고 점수 20점대 후반보다 7점이나 앞서는 것이었다. 이 수치는 세계 최고 수준의 구글 개발팀이 지난 10년 동안 올린 점수차를 단숨에 뛰어넘은 것이기도 했다.

구글은 나아가 한 인공지능에게 여러 언어를 학습시키면서 한 번역에서 배운 노하우를 다른 번역에서도 활용할 수 있는지 실험했다. 예를 들어, 인공지능이 한국어↔영어, 일본어↔영어 번역 데이터를 학습하면 한국어↔일본어도 잘 번역하는지 살펴본 것이다. 결과는 ‘그렇다’였다.

더 놀라운 발견은 구글이 인공지능의 머릿속을 단순화하여 이 과정을 그림으로 나타내 봤는데, 한국어, 영어, 일본어 할 것 없이 같은 뜻의 문장은 하나로 묶어 대체로 비슷한 형태로 인식하고 있었다는 점이다. 즉, 각각 다른 언어로 표현되는 말의 개별 형태를 떠나 의미에 기반한 별도의 체계를 인공지능이 형성하고 있다는 것이다. 구글 연구진은 이에 대해 “일종의 ‘보편어’(인터링구아)의 단초를 보여준 중요한 발견”이라고 설명했다.

원래 인터링구아는 국제보조어협회(IALA)라는 과학자 단체가 1937~51년 사이 제2의 만국 공용어로 쓰려고 라틴어를 기반으로 만든 언어를 말한다. 보통 제2외국어는 현재 우리나라의 영어같이 그 시대 지배적인 문화권의 언어가 차지하게 되는데, 해당 문화권의 이익에 따르는 사고방식까지 사용자에게 함께 전파된다. 이런 문제를 보완하고자 인공적으로 만든 언어가 인터링구아다. 구글 연구진이 말하는 인터링구아는 이와 상관없이 인간이 이해할 수 없는 인공지능만의 언어를 말하지만, 인공지능이 여러 언어들에서 의미를 기준으로 공통된 패턴을 추출해 냈다는 것은 이후 보편어 연구에 귀중한 자료가 될 수 있다. 알파고의 바둑 기풍이 인간에게 새로운 영감을 불어넣었듯이 말이다. 구글 연구진은 앞으로 100개 넘는 언어를 이 인공지능에게 가르칠 계획이다.

더글러스 애덤스의 책 를 보면 ‘바벨 피시’라는 외계생물이 나온다. 신호를 먹고 신호를 배설하는 이 물고기를 귀에 넣으면 통역사 필요 없이 다른 외계인의 말을 바로 알아들을 수 있다. 번역 인공지능은 향후 이런 ‘인터넷의 바벨 피시’가 될 가능성이 높다.

네이버의 파파고 개발을 총괄한 김준석 리더는 와 한 인터뷰에서 “인공신경망의 빠른 발전 속도를 고려하면 3년 뒤에는 매우 매끄러운 번역이 가능하게 될 것”이라며 “일상생활에서 (외국인과의) 의사소통은 번역기를 통해서 충분히 가능한 시대가 올 것”이라고 말했다. 나는 한국어로 말을 하지만 상대방에게는 중국어로 들리고, 상대방의 아랍어가 나에게는 자연스럽게 한국어로 들리는 시대가 머지않아 도래하리라는 말이다.

이런 서비스는 이미 일부 제공되고 있다. 마이크로소프트의 화상 채팅 서비스 ‘스카이프’의 경우 영어-스페인어 등 일부 언어에 한해 이런 자동 통역 기능을 제공한다. 소셜네트워크 페이스북의 경우 영어 등 일부 외국어의 경우 담벼락 글에 ‘번역 보기’ 단추가 달려 있다. 클릭하면 사용자 언어로 번역된다. 파파고나 구글 앱의 경우 간판 등을 스마트폰의 카메라로 찍으면 글자 이미지를 인식해 번역한다. 이런 기술이 안경 형태의 웨어러블 기기나 콘택트렌즈 형태의 기기에 적용된다면 영문 잡지의 글이 우리 눈에는 한글로 보이는 시대가 올 것이다.

이렇게 언어의 장벽이 걷히면 우리는 어떤 시대를 맞이하게 될까? 다시 한 가족이 된 인류는 바벨탑의 전설을 이어갈까? 황용석 건국대 미디어커뮤니케이션학과 교수는 반대로 “더 심한 민족 간 갈등을 겪을 수 있다”고 말한다. “지금까지 민족주의적 정치 행동은 한 나라 안에 머물고 있었다. 예를 들어, 일간베스트(일베) 회원이나 일본 넷우익(인터넷의 극우주의자)들은 각각 한국과 일본의 국내 정치 구도 안에서 활동해왔다. 자국의 외국인이나 진보주의자를 공격했을 뿐이지, 둘이 서로 싸우지는 않았다. 국경 없는 인터넷 시대가 도래한 지 오래인데도 그랬던 이유는 언어라는 장벽 때문이었다. 이 장벽이 사라지면 이들이 직접 맞부딪혀 싸우는 시대가 오게 될 가능성이 크다.”

인터넷 공간에서 민족 간 감정이 격화되는 일은 지금까지 비일비재했다. 2005년 일본 누리꾼들은 독도사랑 캠페인 경력의 한국 연예인 김태희를 공격해 자국 광고모델에서 몰아냈고, 2009년엔 피겨선수 김연아를 상대로 반한 감정이 분출했다. 같은 해 간도협약 100주년으로 한국 누리꾼들의 ‘영토수복’ 게시물이 퍼지자, 중국 누리꾼들의 반한 게시물이 급증했다. 2012년엔 한·일 누리꾼들이 일본군 위안부 문제를 두고 미국 청와대 청원 사이트로 몰려가 ‘청원 전쟁’을 벌이기도 했다. 중국의 사이버 민족주의 연구자 우쉬 박사는 이와 관련해 “과거 소수 엘리트(외교 전문가)에서 일반 대중으로 (민족 간) 문제제기의 주체가 넘어갔다. 또 이를 통해 현실에 영향을 미치려는 인구가 점차 증가하고 있다”고 지적했다. 언어 장벽까지 사라지면 이는 더욱 증폭될 것이다.

네이버 ’인조이재팬’ 서비스는 한글은 일본어로, 일본어는 한글로 자동번역을 해줬다. 한국 음식을 두고 양쪽 나라 누리꾼들의 댓글 싸움을 갈무리한 사진. 인조이재팬은 2009년 서비스가 중단됐다. 출처 나무위키 인조이재팬

실제 사례가 있다. 네이버가 2001년 개시했던 ‘인조이재팬’이다. 이 누리집 일부 게시판에선 한국인이 올린 게시물이 일본인에게는 일본어로, 반대로 일본어 게시물은 한국어로 자동 번역되는 실험적인 서비스가 제공됐다. 그 결과는 대체로 아름답지 못했다. 2003년 ‘청산리 전투’에 관한 한국 누리꾼과 일본 누리꾼 사이 역사 논쟁을 계기로 양쪽 누리꾼들이 본격적인 격돌 양상이 심화되면서 일본 넷우익들이 대거 몰려와 혐한 게시물들이 도배를 이루는 일들이 발생하곤 했다. 험악한 격돌이 뒤따랐다. 네이버는 결국 2009년 “서비스 이용률이 줄었다”는 이유로 이 서비스를 접었다.

물론 안 좋은 일만 있는 것은 아니다. 의사소통이 쉬워지면 상대방에 대한 이해도 높아지기 마련이다. 다양한 문화적 교류와 언어 부담 없는 여행이 늘면 다른 나라에 대한 이해도 넓어질 수 있다. 지배적 언어뿐 아니라 소수 언어의 관점과 정보도 인터넷에 퍼질 기회도 넓어질 것이다. 황 교수는 “원하는 정보를 선별해서 받아들이고 동질적인 이들과만 네트워크를 형성하는 인터넷의 특성상, 언어의 장벽이 사라진다 해서 곧 건강한 교류가 증진되긴 어려울 것이다. 시민 간 충돌 증가를 대비한 국제 중재기구 구성, 다른 문화를 이해하는 세계 시민교육 강화 등의 노력이 앞으로 필요하다”고 말했다.

일부 신학자는 바벨탑 전설을 ‘신의 형벌’이 아니라 ‘문명의 발전’에 대한 이야기로 해석하기도 한다. 바벨은 문명을 상징하고 다양한 언어의 탄생은 그 발전의 결과라는 것이다. 다가올 ‘디지털 바벨탑’의 이야기가 벌로 끝날지, 발전으로 끝날지는 다른 민족과 문화에 대한 이해와 관용의 자세에 달려 있을지 모른다.

권오성 기자 [email protected] , 인포그래픽 김은정 기자 [email protected]

키워드에 대한 정보 인공 지능 번역

다음은 Bing에서 인공 지능 번역 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 AI 번역으로 언어장벽 넘는다…“메타버스 활용”

  • 서울경제TV
  • SEN 경제라이브
  • 인공지능
  • AI번역
  • 메타버스
  • 딥러닝

AI #번역으로 #언어장벽 #넘는다…“메타버스 #활용”


YouTube에서 인공 지능 번역 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 AI 번역으로 언어장벽 넘는다…“메타버스 활용” | 인공 지능 번역, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

See also  다 초점 렌즈 가격 | 누진다초점렌즈(안경 렌즈) 가격표는 왜 이리 복잡할까? 간단히 보는 방법 -아이구루 166 최근 답변 43개

Leave a Reply

Your email address will not be published. Required fields are marked *