코로나19 팬데믹은 급격한 변화를 요구했고, 우리는 그 요구를 (울며 겨자 먹기로) 수용해 눈부신 진보를 이루어냈다. 비트코인과 랜섬웨어, 디지털 트랜스포메이션과 디지털 문맹 같은 이야기가 일상이 되었고 이제는 의식주마저 배달 앱과 온라인 거래 플랫폼으로 해결한다. 없던 기술이 갑작스레 생겨난 게 아니라 신기술의 생소함에 더 이상 낯가릴 수 없게 됐다. 예를 들자면 <포트나이트>라는 게임이 서비스한 지 2년이 지나고 나서야 트래비스 스캇의 콘서트가 게임 속에서 열린 것처럼. ‘피할 수 없으면 즐겨라.’라는 말이 어울릴지는 모르겠지만, 표현 그대로 피할 수 없어서 즐기게 됐다.
자연스레 문화의 축도 인터넷을 향해 보다 가까워졌다. 유튜브, 넷플릭스, 인스타그램은 이젠 카카오톡마저도 위협하고 있다. 그리고 이 틈을 타 일본 서브컬쳐가 국내에 침투하는 데 성공했다. 넷플릭스를 통해 <귀멸의 칼날>과 <최애의 아이> 같은 애니메이션이 인기를 끌었고, 주제가를 부른 YOASOBI 또한 유튜브와 릴스를 통해 흘러 들어왔다. 홍대를 거닐면 보이는 ‘서브컬쳐 계’ 패션, 어디선가 들려오는 J팝 스타일 곡들, 일본 가수들의 내한 공연 릴레이… 그 끝에는 <블루 아카이브> 같은 게임이나 버츄얼 스트리머, 버츄얼 아이돌이 있다고 나는 생각한다. 그러나 이 ‘끝’ 또한 그리 멀지 않다. ‘오타쿠’들이 실제 향유하는 문화가 뉴스와 인기 차트에서 종종 언급되는 일은 우리가 얼마나 이 문화에 익숙해졌는지를 방증한다.
K팝의 서브컬쳐 화와 서브컬쳐의 대중화가 동시에 일어나면서 놀라운 일들이 많이 일어났다. 버츄얼 아이돌 플레이브, 인터넷 방송 출신 아이돌 QWER은 음원 차트 1위를 섭렵했으며 작년 12월에는 J팝 아티스트 후지이 카제가 고척 스카이돔을 매진시키는 일도 있었다. 이들 중 가장 신기한 쪽은 역시 버츄얼 아이돌일 것이다. 아무리 실제 사람이 있다고 한들, 앞에 서 있는 건 3D 폴리곤에 텍스쳐를 입힌 인형이니 말이다. 그러나 이런 현상을 말세라며 매도하고 넘어가는 것은 세상살이에 별 도움이 되지 않는다. 왜 어떤 사람들은 가상 캐릭터에 열광하는 걸까? 어떻게 K팝은 이들과 융화할 수 있었을까? 앞으로는 어떤 방향으로 흘러가게 될까? 로봇, 음악, 그리고 캐릭터를 통해 버츄얼 아이돌의 탄생을 좇는 과정에서 미래를 향한 실마리를, 알지 못했던 재미를 발견할지도 모른다.
로봇이라는 단어와 형태는 1920년 희곡 <로섬의 만능 로봇>을 통해 처음 등장했다. 산업 혁명과 1차 세계대전을 경험한 체코의 극작가 카렐 차페크가 인류의 노동과 전쟁을 대신하고자 하는 욕망을 기계와 인간의 결합적인 모습으로 투영한 것이다. 이 작품은 큰 인기를 끌어 1938년 영국의 BBC를 통해 영상화까지 이루어졌다. 시간이 흘러 2차 세계대전이 끝난 1952년 일본, 데즈카 오사무의 만화·애니메이션 <철완 아톰>이 등장하며 인간형 로봇의 꿈은 실사 영화가 가진 표현력의 한계를 뛰어넘었고, 우리가 가진 꿈의 선명도 또한 크게 상승했다. 점차 노예로서의 로봇이 아닌 동반자이자 영웅으로서의 로봇을 상상하기 시작했다.
비슷한 시기에 아톰과는 또 다른 로봇물 <철인 28호>가 등장했다. 거대로봇물의 효시 중 하나로 볼 수 있는 <철인 28호>는 인간이 조종하는 거대로봇 병기가 작품의 중심이 되는데, 이는 이후 건담 시리즈로 이어지면서 점차 상상의 영역을 우주(탈지구)로 넓혀 나가는 초석이 된다. 여기서 더 나아가면 드디어 아이돌이 등장한다. <초시공요새 마크로스>(1982)는 변신 메카물에 아이돌을 결합한 애니메이션으로, 이는 당대 일본에서 유행하던 솔로 아이돌 나카모리 아키나, 마츠다 세이코의 영향이었다. 마크로스 시리즈는 타임라인 상 거리가 멀어 보일 수 있는 로봇과 아이돌이 한 시각에 공존할 수 있음을 보여준 점에서 선구자 적이었다.
사람 같은 로봇, 휴머노이드의 꿈은 1973년 와봇1호에서 현실 세계에 발을 들여 2000년이 되면 달리기와 ILY 사인을 할 수 있을 정도로 정교해진다(아시모). 인간과 다른 동물을 구별하는 직립보행과 손의 움직임을 인공적으로 만들어낼 수 있게 된 것이다. 그러나 동일본 대지진과 후쿠시마 원자력 발전소 사고 현장에서 휴머노이드가 무용지물이라는 평가를 받으며 이 기술은 2016년 보스턴 다이내믹스 사의 아틀러스가 모습을 드러내기 전까지 장기간 정체 상태에 빠졌다.
음성 합성 기술 또한 컴퓨터의 발전과 함께 급성장했다. 크라프트베르크의 ‘Autobahn’처럼 보코더를 이용한 피치 변조, 음정 보정과 소리 왜곡에 사용하고 있는 오토튠, 텍스트를 음성으로 변환하는 TTS(Text to speech) 기술이 모두 20세기에 등장하고 사용되었다. 그러나 이 기술들은 인간다운 목소리를 만들어내기보다는 마치 <로섬의 만능 로봇>처럼 독특함과 기계스러움을 부각했다. 버츄얼 아이돌이 현실 세계에 발을 들이지 못한 또 다른 이유가 여기에 있었다.
그렇다고 꿈 - 아이돌 - 을 향한 노력이 사그라든 것은 아니었다. 1996년 일본의 대형 연예 기획사 호리프로가 다테 쿄코(伊達杏子)라는 사이버 아이돌을 데뷔시키면서 지금과 같은 버츄얼 아이돌의 형태가 처음 등장한다. 다테 쿄코는 3D CG와 모션 캡쳐 기술을 이용해 가상에서 현실이 아닌 현실에서 가상으로 역행했다. 휴머노이드 기술의 더딘 발전 속도와 음성 합성 기술의 불쾌한 골짜기를 극복할 수 없다면 만화나 애니메이션처럼 컴퓨터 그래픽스로 그리면 될 일이었다. 중요한 건 다테 쿄코의 인간성이다. 사람들은 다테 쿄코에게 노동도 전쟁도 그 무엇도 대신하길 바라지 않았다. 과학 기술이 인간성을 갖춘 아이돌을 창조해 냈다.
다테 쿄코 이전에 연애 시뮬레이션 게임 <두근두근 메모리얼>의 후지사키 시오리가 있었다. 코나미에서 1994년 발매한 이 게임은 새로운 시스템과 전체이용가라는 점에 힘입어 큰 인기를 끌었고 급기야 ‘교내 아이돌’ 후지사키 시오리를 버츄얼 아이돌화하기에 이르렀다. 린 민메이가 어디까지나 애니메이션 캐릭터였고 다테 쿄코를 비롯한 사이버 가수들이 기술적인 면으로 사람들을 설득하려 했다면, 후지사키 시오리는 그 태생과 캐릭터성 때문에 아이돌처럼 소비되었다. 팬클럽이 생겼고 오리콘 앨범 차트에 이름을 올렸으며 뉴스에서는 하나의 사회 현상으로 보도됐다.
가장 큰 변화는 ‘너’라는 존재가 생겨났다는 점이다. 이전까지 로봇을 이용한 작품과 가상 캐릭터는 제4의 벽을 넘지 못했다. 캐릭터들은 작품 속에 한해서 유효한 것으로 그려졌고 작품의 시대와 시간 안에서만 살아 있었다. 다테 쿄코, 사이버 가수 아담, 류시아 등도 인간성을 갖추고 뮤직비디오와 광고 등의 활동을 펼쳤지만, 기술과 금전의 한계로 인해 실시간 의사소통에는 어려움이 있었으며 ‘유의미한 대화’가 불가능했다. 후지카시 시오리는 달랐다. 게임의 특성상 ‘너’와 대화하는 것을 기본 전제로 두고 있으며 이야기의 호흡이 길고 파라미터에 따라 답변과 결과가 달라진다. 아즈마 히로키는 <동물화하는 포스트모던>에서 포스트모던의 노벨 게임에 등장하는 각각의 이야기는 ‘데이터베이스에서 추출된 유한한 요소가 우연의 선택에 의해 조합된 시뮬라크르에 지나지 않는다’고 하면서도 ‘시각을 바꾸면 한번 던진 주사위의 결과는 우연인 동시에 필연이라는 의미에서 역시 필연이며 재현 불가능하다고 말할 수도 있다’고 보충했다. 그의 말을 따르면 비록 후지사키 시오리와 ‘너’의 이야기가 제한적이고 고유하지 않더라도 개인에게 있어서는 ‘유의미한 대화’일 수 있는 것이다.
21세기가 되면 버츄얼 아이돌에서 캐릭터성을 극대화하는 시도들이 등장하는데, 바로 2005년 게임 <아이돌마스터>와 2007년 보컬로이드 하츠네 미쿠(初音ミク)가 주인공이다. <아이돌마스터>는 리듬 게임에 연애 시뮬레이션 요소를 더한 아케이드 게임으로 이전까지의 가상 아이돌 컨텐츠와 달리 음악을 중심으로 삼았으며 ‘너’에게 ‘프로듀서’라는 이름을 부여할 정도로 플레이어와의 대화를 중요시했다. 여러 명의 아이돌이 등장한다는 점도 핵심이다. 담당 아이돌을 정하고 육성시켜 나간다는 시뮬라크르적 서사 요소의 생성, 더불어 성우의 역할이 아이돌을 침범하며 라이브 공연까지 가능해졌고 오프라인에서 팬덤 내 명함 교환 문화를 만들어내며 독자적인 커뮤니티를 형성하는 데 성공했다.
이렇게 개개인에 의한 재구축은 하츠네 미쿠 사례에서도 중요하다. 보컬로이드 소프트웨어의 일종이자 가상 캐릭터인 하츠네 미쿠는 동영상 커뮤니티 니코니코 동화를 통해 생명력을 얻었다. 인디 작곡가들의 커뮤니티 역할을 함과 동시에 보컬로이드 악곡 커버(우타이테 등) 문화를 정착시켰고, 이를 통해 세를 점차 확장하는 동안 미쿠라는 상징성도 커져갔다. 노래마다 저마다의 하츠네 미쿠가 있다고 해도 과언이 아닐 정도다. 동시에 ‘みくみくにしてあげる♪(미쿠미쿠하게 해줄게♪)’ 같은 대표곡은 청자를 향해 끊임없이 말을 건네며 ‘너’라는 존재와의 대화 또한 유지되고 있었다.
이전까지의 가상 아이돌들이 기술적인 벽에 가로막혀 한계를 띄었다면, 하츠네 미쿠는 관련 분야와 기술을 발전시키기도 했다. 애니메이션을 만드는 데 사용하는 MikuMikuDance(MMD), 페퍼스 고스트 방식을 사용한 홀로그램 콘서트가 그 예다. 일본 대중음악 시장에 미친 영향도 상당하다. Mitchie M은 프레이징과 벤딩 그리고 호흡 같은 보컬 개념을 적극 도입하면서 TTS 수준이었던 보컬로이드 작곡 기술을 한 단계 끌어올렸고, 음악의 질적 향상과 함께 요네즈 켄시(米津玄師)나 요아소비(YOASOBI) 같은 아티스트들이 대히트하며 컨셉트와 마이너한 감성 중심의 악곡을 J팝 시장에 퍼뜨렸다.
다테 쿄코가 사이버 가수의 가능성을, 아이돌마스터가 아이돌 캐릭터의 가능성을, 그리고 하츠네 미쿠가 새로운 음악 시장의 가능성을 열었다면 실시간 커뮤니케이션 시장을 연 건 키즈나 아이다. MMD 제작자였던 Tda가 만든 깔끔한 모델을 바탕으로 시대에 맞게 모션 및 페이셜 캡쳐를 추가했으며, 무엇보다 예능 방송에 뒤지지 않을 정도로 재치 있는 성우가 존재했다. 라이브 방송을 통한 실시간 소통보다 녹화 편집한 영상 콘텐츠가 핵심이었지만, 실시간 모션 캡쳐로 영상을 촬영한 뒤에 편집한 영상을 올린다는 점에서 여타 유튜버들과 다를 바 없었다. 한국과 미국 등 해외에서 얻은 인기를 바탕으로 1년 만에 100만 구독자를 달성했고, 최초이자 최고라는 측면에서 ‘버츄얼 유튜버’ 또는 ‘버튜버’라는 표현이 키즈나 아이와 후발주자들을 지칭하는 표현으로 자리 잡았다.
니지산지와 홀로라이브 같은 버츄얼 유튜버 MCN을 중심으로 시장이 개편되면서 주 무대도 편집 영상 대신 라이브 스트리밍으로 변화했다. 이는 기존 인터넷 방송인들의 문법을 사용하겠다는 의미였으며 방송 주제 역시 실시간 소통, 게임 플레이, 노래 등 스트리밍 시장에 맞춰졌다. ‘버츄얼 아이돌’이라는 타이틀을 걸고 등장한 토키노 소라(ときのそら)를 필두로 홀로라이브 아이돌 프로젝트가 만들어지기도 했다. 이 중에서 주목할 만한 건 호시마치 스이세이(星街すいせい)다. 브레이크비트 위에 J팝 멜로디와 파워풀한 보컬을 얹은 ‘Stellar Stellar’나 화려한 금관 악기에 랩을 더한 ‘ビビデバ(비비디바)’를 앞세워 가수로서 인기를 구축하는 데 성공했기 때문이다.
음악적 성공의 이면에 프로듀서 이노우에 타쿠(TAKU INOUE)가 있다. 원래 반다이남코 소속 프로듀서로서 아이돌마스터 시리즈에 곡을 썼던 그는 2018년 토이즈 팩토리로 소속을 옮겼고 이때부터 아노(あの)나 호시마치 스이세이 등과 활동을 이어 오고 있다. 특히 호시마치 스이세이와는 Midnight Grand Orchestra라는 듀엣을 결성해 두 장의 EP를 발매하기도 했다. 이노우에 타쿠의 활동 변화는 애니메이션 중심의 오타쿠 시장이 스트리밍 중심으로 개편했음을 보여주는 한 사례이자 현재와 같은 버츄얼 아이돌이 등장하게 된 시발점이다.
버츄얼 아이돌이 K팝의 형태로 등장하기 시작한 건 게임 <리그 오브 레전드>가 처음이었다. 이전에도 <메이플스토리>의 엔젤릭버스터 같은 K팝 캐릭터는 존재했지만, K/DA는 실제 K팝 아이돌인 (여자)아이들과의 협업, 가상과 현실의 타협점을 만든 인간형 모델과 카툰 렌더링의 결합, 팝 스타일의 음악과 화려한 안무 중심의 뮤직비디오, 가사 속 영어와 한국어 비율, 당시 시대상인 걸크러쉬 컨셉, 한국적 캐릭터 아리를 중심으로 갖춘 지역 정체성 등 프로젝트 전반에 걸쳐 K팝에 대한 깊은 이해도가 돋보였다. 이 문화적 존중을 바탕으로 한 높은 완성도가 우리로 하여금 K/DA를 ‘버츄얼 걸그룹’으로 보게 만들었고 일회성 프로젝트에 그치는 게 아닌 ‘컴백’까지 하며 EP를 발매하기도 하였다. 에스파의 데뷔곡 ‘Black Mamba’의 뮤직비디오가 받았던 ‘POP/STARS’와의 유사성 지적은 K/DA가 얼마나 K팝다웠는지를 보여주는 에피소드기도 하다.
K/DA가 라이엇 게임즈에서 만들어낸 독창적인 시도였지만, 이들의 노력을 아무나 따라 할 수 있는 건 아니었기 때문에 한동안 국내에서 버츄얼 아이돌이 새로 등장하는 일은 없었다. 이후 등장한 이세계아이돌 역시 K/DA보다 (그 시작이 비록 다른 목적이었더라도) 프로듀스48이나 호시마치 스이세이 쪽을 선배로 삼고 있다. 공개 오디션 형식으로 시작한 점, 인터넷 생방송을 주 활동으로 여긴다는 점이나 IZ*ONE의 ‘Highlight’을 작·편곡했던 이태훈을 앞세워 홍보한다는 점 등이 그렇다. 강한 보컬과 고음 중심으로 포인트를 만들어 가는 데뷔곡 ‘RE:WIND’나 보컬로이드 스타일 뮤직비디오를 가진 ‘겨울봄’, K팝 스타일 빌드업과 훅 구조는 물론이고 뽕끼 있는 비트까지 보유하고 있으면서도 보컬 톤 지향점이 주류 흐름과 괴리되어 있는 ‘KIDDING’ 모두 기존 K팝 팬층을 타겟하지 않는다. 그러니까 이세계아이돌의 활동 - 특히 커버곡들에서 잘 드러나는 - 은 일본 서브컬쳐를 번역해서 K팝을 수용하고 있는 형태에 가깝다고 말할 수 있다.
이러한 서브컬쳐 소비 형태는 국내 시장의 특징이긴 했어도, 그들은 K팝을 절대 즐기지 않았고 그건 지금도 크게 다르지 않을 것이다. 그럼에도 서브컬쳐 팬층이 K팝을 이해할 수 있게 된 데에는 일본 내 젊은 여성층에서 트와이스, 아이브 등의 K팝이 상위문화가 되었다는 기반이 있었다. 또한, 버츄얼 유튜버 이후 실시간 커뮤니케이션이 중요해진 상황에서 리얼 타임 모션 캡쳐를 잘 살릴 수 있는 건 보컬로이드 스타일의 정적인 컷과 글자 중심 뮤직비디오가 아니라 K팝 식 화려한 안무 영상이다.
그 형태가 어떻든 K팝의 성질을 가지고 있기에 팬들 역시 K팝 팬덤의 성격을 띠게 됐다. 여전히 트위터보다는 커뮤니티 사이트를 구심점으로 하고 있더라도 차트 인을 위해 총공, 스트리밍 같은 문법을 사용한다. 이는 동일하게 스트리머이자 아이돌로 활동하는 QWER의 팬덤에서도 찾아볼 수 있다. 그런 면에서 플레이브(PLAVE)의 사례와는 또 다르다. 이쪽은 태생이 K팝 팬들이었기 때문에 트위터가 중심이 되고 그룹 역시 자체 콘텐츠나 라디오, 팬카페, 위버스 등의 기성 문법을 사용하고 있다.
이들의 데뷔 직전 시기 방영했던 버츄얼 아이돌 오디션 프로그램 <소녀 리버스>(2023)는 플레이브와 비슷한 관점에서 접근하고 있어 이들을 이해하기에 참고할 만하다. <소녀 리버스>는 전현직 걸그룹 멤버들이 등장해 버츄얼 아이돌로 데뷔하는 서바이벌 방송으로 K팝 아이돌이 버츄얼로 활동할 때 가질 수 있는 장점이 무엇인지를 보여준다. 기존에 아이돌로서 가지고 있던 인기는 특별히 중요하지 않은 것으로 간주하고 새로운 얼터 에고를 부여받아 본연의 매력으로 평가받는다. <아이돌마스터>에서 나타났던 성우와 캐릭터의 분리가 가능해지면서 두 가지의 독립적인 자아로 존재할 수 있는 것이다. 그리고 이렇게 생겨난 얼터 에고는 ‘본캐’와는 또 다른 과장된 캐릭터를 가지면서 ‘솔직’한 것으로 받아들여진다.
플레이브는 본캐와 멤버들이 분리되는 버츄얼 아이돌의 특징을 십분 활용한다. 버츄얼 영역에서 본캐는 없는 것으로 암묵적으로 동의하는 빨간약-파란약 문화와 가상 공간의 기술적 문제로 발생하는 글리치는 또 하나의 놀이가 되며 유머를 통해 얼터 에고의 독립성을 인정하게 만든다. 동시에 여타 버츄얼 아이돌과 달리 데포르메가 적으면서도 선 굵은 모델을 사용하여 서브컬쳐 팬덤이 아닌 K팝 층을 공략한다. 플레이브는 캐릭터에서 아이돌로 이동하는 기존 버츄얼 아이돌의 방식 대신 현실에서 가상으로 들어가는 초기 다테 쿄코의 방식을 채용해 K팝 아이돌의 성공적 재데뷔 방식을 선보이며 상위문화와 하위문화의 경계를 허물었다.
다테 쿄코를 시작으로 모든 버츄얼 아이돌은 그 뒤에 항상 사람이 존재했다. 그 이유는 휴머노이드와 음성 합성 기술의 더딘 발전이 주된 이유였다. 그래서 모션 캡쳐를 통해 애니메이션을 만들고 노래는 직접 부르는 형식이었다. 사람이 있다는 사실에 오히려 안정감을 얻기도 하고 가상계와의 차이에서 발생하는 오류가 새로운 재미를 주기도 했다. 하지만 상황이 점차 변하고 있다. 인공지능의 발달이 가져온 로봇공학의 발달, 생성형 인공지능을 통한 음성 합성과 음악 생성 기술은 100년 정도 지속해 온 대중음악 시장을 뿌리째 흔들고 있다.
DEAN의 음색을 ‘New Jeans’에 입히는 일이, 칸예 웨스트에게 한국말로 ‘보고 싶다’를 부르게 하는 일이 가능해졌다. AI 커버를 넘어 자체적으로 곡을 생성하기도 한다. 대표적으로 메이플스토리 디렉터를 캐릭터화한 신창섭이 있다. ‘다 해줬잖아 (feat. 전재학)’는 펑키한 기타 및 베이스라인, ‘바로 리부트 정상화’는 뽕끼 강한 비트와 발음 센 단어를 활용해 - 마치 선거송처럼 - 리듬감을 부여하고 주제를 강조하여 중독성을 만든다. AI 영상 합성을 통해 뮤직비디오를 만든 점도 중요하다. 신창섭의 주된 내용인 확률 조작 문제(과징금) 및 리부트 월드 운영(리부트 정상화) 관련 비판을 합성과 풍자로 풀어내는 방식은 과거 디시인사이드 합성-필수요소 갤러리를 기원으로 하는 한국 인터넷 서브컬쳐의 연장선이기도 하다. 단순히 노래가 좋다는 이유로 ‘리슨족’이라 일컫는 집단까지 생겼고 앞서 언급한 두 영상 모두 1,000만 조회수를 넘겼다. 이 웬만한 가수들도 이루어내기 어려운 숫자는 AI 생성 음악이 대중들에게 향후 진지하게 받아들여질 수 있음을, 작·편곡의 담벼락이 확 낮아진 만큼 작사의 영역이 보다 중요해질 수 있음을 시사한다.
이제까지 AI 음악 기술이 저작권 등을 이유로 대중의 영역에서 이루어졌다면 최근에는 SM엔터테인먼트의 나이비스(nævis)처럼 본격적인 진출도 등장했다. 플렉서블 캐릭터를 핵심으로 내세운 나이비스는 2D 데포르메 캐릭터에서 3D 인간형 모습을 자유자재로 넘나든다. 희곡에서 영화를 거쳐 만화와 애니메이션, 그리고 게임으로 플랫폼을 옮겨 가며 상상력의 한계를 넘어온 것을 상기하면 이번에는 또 어떤 가능성이 있을지 궁금해진다. 3D 애니메이션에서 가장 문제가 되는 부분은 광원이다. 현실과 가상 공간의 라이팅이 다르기 때문에 수십만 개의 폴리곤을 사용해 모델을 만들고 자연스러운 움직임을 구현해도 빛의 위치나 세기, 처리하는 방식이 다르면 금세 티가 난다. 그런 면에서 첫 솔로곡 ‘Done’의 뮤직비디오는 광원 처리와 배경이 굉장히 사실적이다. 생성형 AI를 이용한 보컬 역시 사람 같다. 물론 아직은 TTS에 음색을 곱연산한 것처럼 들리기도 하고, 영어로만 노래한다는 점에서 의심을 거두기엔 부족해 보인다. 그럼에도 자본을 이용해 저작권을 해결할 수 있다는 점이 생성형 음원 기술을 그저 신기한 것으로 치부하진 않을 듯싶다.
나이비스는 K팝의 오랜 문제를 해결할 수 있을까? 예를 들면 해외에서는 종종 학대 취급까지 받는 혹독한 육성 시스템, 논란이나 계약 문제로 인한 멤버 탈퇴, 인구 감소와 남자 아이돌 시장의 전략 변화로 연습생이 줄어드는 현상 같은 것들 말이다. 적어도 당분간은 요원해 보인다. 생성형 AI 역시 단순 ‘딸깍’이라고 치부하기 미안할 정도로 손이 많이 가기 때문이다. 아이돌과 버츄얼 아이돌 시장에서 가장 중요하게 여겨지는 실시간 커뮤니케이션이 어렵다는 점은 큰 단점이다. 현재 캐릭터 챗 서비스가 이루어지고 있고 대화형 AI 서비스에 음성과 영상 인식 기술을 적용하기 시작했지만, 당장 K팝 생태계에 그대로 적용한다면 라이브 스트리밍이나 팬 미팅 장소에서 엉뚱하거나 잘못된 이야기를 할 수도 있지 않을까? 맨 처음에 이야기했던 것처럼 기술과 문화 사이에는 언제나 큰 간격이 존재했고, 그 간격을 좁히는 일은 상당한 충격을 동반한다. 그럴 수도 있다는 공감대가 생기고 그 팬덤이 점차 확장해 가는 과정은 아마 단기간에 이루어지지는 않을 것이다.
기존 아이돌 시장이 동경을 바탕으로 재생산되는 구조라면, 버츄얼 아이돌은 아예 새로운 캐릭터를 생산하는 구조다. 버츄얼 아이돌의 발전 흐름은 필연적으로 기술적 구현에 초점을 맞추게 되며 팬층 역시 단순한 소비자일 뿐이다. 가상 인간이라는 존재가 기술 부족으로 열등하게 나타나거나 기술 특이점으로 우등하게 등장할 수밖에 없고 팬이 아이돌이 되는 기존 생태계의 순환 논리는 기대하기 어렵다. 새로운 캐릭터를 만든다거나 팬 커뮤니티 내부에서 소통을 위해 창작자가 될 수는 있다. 그러나 이 창작은 팬을 소비자에 머물게 하며 그 결과로 버츄얼 아이돌은 소비재로 전락한다. 서브컬쳐와 K팝 양쪽에서 끊임없이 지적받아 온 인간성을 착취하는 구조(소비 주체인 팬덤의 원하는 바를 아이돌이 들어줘야 한다는 힘의 논리)가 버츄얼 아이돌 시장에서 더 심화될 수밖에 없다. 인간성이 있는데 인권은 없는, 사이버 동물원의 탄생이다. 이를 견제하기 위해서는 (버츄얼) 아이돌과 팬 사이에 상호 존중이 있어야 한다. 필요에 의해 사용하는 게 아니라 여가를 함께 즐기는 모양새가 되어야 한다. 이 이야기가 마냥 허무맹랑하게 들리지 않을 때쯤이 바로 AI 버츄얼 아이돌 씬에 공감대가 형성되는 시점일 것이다.
앞서 언급한 것과 유사한 AI 스트리머는 이미 존재한다. 바로 뉴로사마(Neuro-sama)다. 뉴로사마는 챗봇과 음성 합성 기술, Live2D, AI를 결합해 시청자와 실시간으로 소통하고 노래한다. 비록 AI로 생성한 텍스트를 그대로 읽어 이모티콘 같은 것들을 곧이곧대로 소리낸다던가 대화할 때 절대로 말을 끊고 들어오는 일이 없는 등 인간적이지 않은 부분이 존재함에도 시청자들에게 그럴 수 있다는 공감대가 형성되어 있고, 때때로 사람답지 않은 모습이 드러나면 그것이 유머이자 매력으로 다가온다. 그렇다면 현재 단계에서 로봇에 AI와 센서를 탑재하는 것으로 그동안 꿈꿔 왔던 휴머노이드를 만들 수도 있을 것이다. 대신 돈이 많이 필요할 테고 그렇게 돈이 많은 사람에게 현재 수준의 휴머노이드는 필요 없지 않을까.
가상 현실 속에서는 어떨까. VFX 측면에서 게임 <Cyberpunk 2077>을 주목할 만하다. 엔비디아의 RTX50 시리즈가 지원하는 AI 기반 화질 개선 기술인 DLSS 4가 얼마 전에 등장했고, 2035년까지 리얼 타임 패스 트레이싱 기술을 적용해 현실과 사실상 동일한 빛 효과를 선보이기 위해 준비하고 있다.
AI 업계에서는 OpenAI o1과 o3가 추론 기능을 탑재해 AGI를 암시하는 중이고 AI 시스템이 사용하는 전력 문제를 해결하기 위해 상업용 핵융합 발전 기술이 준비되고 있으며 미국의 도널드 트럼프 대통령도 AI 규제 축소 및 인프라 확장을 위해 움직일 예정이다. 당장 얼마 전 등장한 대화형 AI deepseek가 보여준 파급력과 Ye의 AI 사용 발언은 우리의 예상을 훨씬 앞당길 것을 촉구하고 있다. AI를 활용해 3D 애니메이션을 만들거나 실시간 모션 캡쳐 움직임을 보정하는 것을 넘어 가정용 휴머노이드가 등장하는 것도 시간문제일 것이다. 생성형 음악 역시 보다 다양한 장르가 등장할 수 있고 학습 데이터 부족으로 음 이탈이 나던 부분들 또한 금방 해결할 것으로 생각한다. 실시간 통역 기술, 자막 생성의 발전으로 언어의 경계를 깰 날도 머지않았다.
그러나 버츄얼 아이돌에서 중요한 건 캐릭터, 음악, 로봇 순이다. 기술의 발전은 어디까지나 더 좋은 도화지를 가져다줄 뿐이다. 가수를 내건 이상 음악도 중요하다. 노래를 부르고 노래로 이야기하는 사람은 정체성이 노래에 있다. 그리고 그보다 더 중요한 것이 사람의 마음을 사는 일이다. 형태가 아니라 매력이 중요하다. 사람이니 말이다.