생성형 AI가 다 좋은건 아니구나 (feat. AI 음악프로젝트)
요즘 생성형 AI가 대세다. 내가 근무하는 직장에서도 릴스 (쇼츠, 틱톡 등)의 중요성과 함께 AI를 이용해서 컨텐츠를 제작하는 분야에 대해서 중요성이 대두되는 상황이다. 그래서 나도 관심을 갖고 이 부분에 대해서 긍정적으로 바라보는 중인데 오늘 그 기대감이 완전히 깨졌다.
▲ 지금은 들을 수 없는 가수들의 목소리로 부른 노래를 들을 수 있다는 기대감은 포스터에서 멈출 수 밖에 없었다.
퇴근 후, 운동하고 가볍게 유튜브를 보는데 아이유가 다른 가수의 곡을 커버한 영상이 눈에 보이더라. 이게 무슨 일인가? 내가 좋아하는 아이유의 음색으로 다른 가수의 노래를 들을 수 있다니 꿈만 같았다. 솔직히 환호했다. 그런데 막상 동영상을 들어보니 예상 밖으로 너무 퀄리티가 낮았다. 그저 음에 맞춰서 목소리를 입혔을 뿐 감정은 하나도 들어있지 않은 기계음만 들리더라.
솔직히 난 개인적으로 챗GPT 같은 프로그램을 선호하지 않는다. 객관적 사실 외에 논조는 표현할 수 없기 때문이다. 인공지능이 적어도 10억개의 인격(수 십년 동안 쌓인 경험이 만든 개개의 뇌) 정도는 갖춰야 믿어볼만 하겠지.
사실, 처음 챗GPT가 나왔을때 정치에 대해서 질문하고 난 저 의구심에 확신을 가졌다. 그냥 백과사전을 짜집기하는 수준에 불과하다고 생각했다.
그래도 텍스트에 대한 객관적 사실을 텍스트로 나열해주고, 그 텍스트를 바탕으로 이미지도 만들어주고, 그것을 소스로 동영상까지 만들어준다니 무자격자 혹은 비전문가가 고난이도 컨텐츠에 접근하기는 좋다고 생각된다. 하지만, 내가 할 수 있는 일을 더 나은 퀄리티로 대신 해주는 일은 아직 무리다.
그 사실을 이번에 AI 음악프로젝트로 확실하게 알았다.
특정 가수의 음색, 목소리를 입힐수는 있어도 가사가 가수에게 주는 감정은 담을 수 없는것이다. 그리고, 그 감정은 그 가수의 인격(시간, 경험, 고통과 번뇌, 외로움과 고독 등의 복합적인 결과물)에 따라 다 다른 목소리를 갖는다. 그것을 AI는 아직 다룰 수 없다.
그리고 그것이 가능하게 된다면 단일한 명령 체계로 움직이는 최소 10억개의 AI 모듈이 존재한다는 뜻이다. 이 말은 10억 명의 군대가 만들어진다는 뜻이지. 그럼 인류가 그들에게 대항할 수 있을까? 이길 수 있을까? 인간의 존엄성을 AI의 머리 위에 둘 수 있을까?
영화같은 일이 벌어지려나?
어쨌든 한 10분 정도 환희와 설렘이 있었는데 곧 무너져서 아깝다. 아이유는 커버 안 하나? 애피톤프로젝트 노래는 아주 잘 듣고 있는데 다른 곡들도 그의 목소리로 듣고 싶네.