Prosto

사람 음성 같은 딥마인드의 웨이브넷 본문

News/IT/과학

사람 음성 같은 딥마인드의 웨이브넷

Prosto 2016. 9. 11. 01:49

구글의 자회사인 딥마인드가 기존에 존재하는 컴퓨터로 만든 사람 음성보다 더욱 실제 소리와 가까운 사람 음성을 만들었다고 합니다.

(알파고로 유명한 딥마인드입니다.)

 

이 '웨이브넷'을 사람들에게 들려준 결과

기존에 많이 사용되고 있는 '문자음성변환(text to speech)'과 사람의 실제 음성 사이의 격차를 절반 가량 줄였다고 합니다.

 

웨이브넷은 신경망(neural network)을 이용해 생성된 음파들의 파형을 분석하고 패턴들을 찾아 모델화한다고 합니다.

이 모델화를 거쳐 만들어지는 음성들이 실제 사람들이 사용하는 소리의 파형과 유사하기에 진짜 사람 소리 같다는 것 같네요.

 

 

대부분의 문자음성변환(text-to-speech)은 녹음된 사람 음성들을 사용하지만

웨이브넷은 사용자가 표현할 문자와 일치하는 소리들을 재조합하는 방식이라고 합니다.

(녹음된 사람 음성과 소리의 재조합의 차이로 더욱 실제와 가까워졌습니다.)

(사람이 말하는 억양이나 특유의 감정이 담긴 부분이 될 수도 있겠군요.)

문자음성변환의 경우 끊기는 느낌이나 딱딱한 면이 없지 않지만 웨이브넷은 이러한 점이 많이 완화되었습니다.

 

 

머지않아 진짜 사람과 똑같이 얘기하는 컴퓨터 음성도 등장하게 될 것 같네요..

그때는 컴퓨터인지 사람인지 음성으로 구분이 힘들 것 같네요. (이걸로 ARS/보이스피싱 등 사용되는 곳들이 많겠네요..)

 

날로 발전해가는 인공지능과 관련 산업들을 보고있자면 놀랍네요.

여기에 딥마인드는 현재 큰 기여를 하고있는 것 같습니다. 이미 알파고에서 큰 이슈를 가지고 왔지만요..

 

 

딥마인드 웨이브넷 샘플 사운드 : https://deepmind.com/blog/wavenet-generative-model-raw-audio

관련 기사 링크

http://www.yonhapnews.co.kr/bulletin/2016/09/10/0200000000AKR20160910057500085.HTML?input=1195m

http://news.mk.co.kr/newsRead.php?no=643837&year=2016

 

Comments