AI 음악을 진짜로 만드는 사람은 누구인가 — 기계가 아니라 작곡가

AI 음악 시장 전반에서 2025년 말부터 2026년에 걸친 AI 음악 생성 약 650,000건을 분석했습니다. "AI 쓰레기"라는 헤드라인이 건너뛰는 질문 하나에 답하기 위해서입니다. 사람이 AI 음악 도구 앞에 앉았을 때, 창작 측면에서 실제로 음악을 만들어내는 건 누구일까요. 데이터는 일관됩니다. 사람들은 자기 가사를 가져오고, 곡 구조를 손으로 표시하고, 특정 보컬을 캐스팅하며, 다시 돌아와 또 만듭니다. 원클릭으로 던져놓고 떠나는 생성은 전체 활동에서 작은 비중에 그칩니다. 이 표본에서 도구는 사람이 이미 써낸 곡을 연주하는 스튜디오 역할을 합니다.
데이터셋에서 뽑은 세 가지 수치가 규모를 보여줍니다.
데이터가 검증하는 통설
AI 음악에 관한 공개 수치는 업계의 다른 측면을 묘사합니다. 2026년 4월, Deezer는 자사 플랫폼에 매일 업로드되는 트랙의 약 44%가 이제 AI로 생성된 것 — 하루 거의 75,000건 이라고 밝혔으며, 그 트랙들이 끌어모으는 스트림 중 추정 85%가 부정한 것이라고 했습니다. 이 수치들이 쓰레기의 범람과 로열티 풀을 노리는 봇에 관한 헤드라인을 만들어냈습니다.
Deezer 수치가 측정하는 변수는 하나입니다. 스트리밍 카탈로그에 무엇이 업로드되는가. 이건 소비 측면의 측정입니다 — 라이브러리에 안착하는 산출물, 그 상당수가 로열티를 거둬들이려고 대규모로 흘려보내진 것입니다. 사람이 도구를 열어 무언가를 만들어내는 그 상류 단계에서 무슨 일이 일어나는지는 측정하지 않습니다. 우리 데이터셋이 측정하는 건 바로 그 두 번째 단계입니다. 둘은 자주 혼동되는데, 그 구분이 곧 이 질문의 전부입니다.
발견 1 — 가사는 사람이 넣는다
도구가 곡을 쓰고 있다면 프롬프트는 짧을 겁니다. 장르 하나, 무드 하나, "슬픈 거 하나 만들어줘" 정도로요. 이 표본에서 그건 소수에 해당합니다. 전체 프롬프트의 약 41%가 1,000자를 넘어가는데 — 단일 구간으로는 가장 큰 비중 — 50자 미만의 한 줄짜리 프롬프트는 약 9%에 그칩니다.
천 자를 넘는 프롬프트는 곡에 대한 묘사가 아닙니다. 곡 그 자체의 텍스트입니다 — 사람이 직접 써서 붙여넣은 절, 후렴, 브리지. 데이터가 보여주는 이 도구의 가장 흔한 사용법은, 완성된 가사를 건네주고 편곡을 연주해 달라고 하는 것입니다. 가사의 저작권은 사용자에게 있습니다.
발견 2 — 구조는 사람이 직접 짠다
가사가 있으면 다음 결정은 구조적인 것들입니다. 후렴을 어디에 둘지, 브리지를 언제 터뜨릴지, 곡을 어떻게 열고 닫을지. 데이터는 사용자가 이런 결정을 명시적으로 내리는 모습을 보여줍니다.
650,000건 프롬프트에서 가장 자주 나오는 단어는 무드나 장르가 아니라 구조 태그입니다. chorus는 452,000번 넘게, verse는 410,000번 넘게 등장하며, outro, bridge, pre-chorus, intro도 모두 상위권에 듭니다. 이건 녹음에 들어가기 전에 곡을 섹션별로 도면화하는 마크업입니다. 인터페이스 모드를 알 수 있는 경우, 사용자는 편곡을 더 세밀하게 통제하는 고급 모드를 원탭 간단 모드(약 38%)보다 더 자주(약 46%) 선택합니다. 방치형 생성과 통제형 생성 중에서 고를 수 있을 때, 표본은 통제 쪽으로 기웁니다.
발견 3 — 사운드와 보컬은 사람이 지정한다
사용자는 사운드도 묘사하는데, 꽤 구체적입니다. 가장 흔한 묘사 단어들은 보컬과 악기 편성에 관한 것입니다. vocal이 130,000번 넘게 등장하고, 그 곁에 male, female, emotional, warm, soft, piano, guitar, bass가 함께 나옵니다. 보컬 관련 단어는 순수 연주 트랙 요청보다 대략 17.6 대 1로 많습니다.
데이터가 가리키는 건 사용자가 내린 캐스팅과 악기 편성 결정입니다 — 따뜻한 남성 보컬, 감성적인 피아노 라인, 정해진 느낌 — 그리고 도구는 그 사양을 고르는 게 아니라 실행합니다.
발견 4 — 롱테일은 배치 산출이 아니라 상황 중심이다
쓰레기 통설은 익명의 대량 산출물을 암시합니다. 곡 유형의 분포는 정반대를 가리킵니다. 일반 곡이 활동의 대부분이지만, 개인적인 디테일이 모이는 곳은 롱테일입니다. 커버, 랩, 생일 노래, 징글, 자장가, 게임 캐릭터를 위한 곡, 8비트 트랙, 비트. 각각은 특정한 사람과 특정한 상황에 대응합니다.
이 분포는 콘텐츠 농장의 배치 산출보다, 특정 순간을 위해 곡을 만드는 개인들과 더 잘 맞습니다.
발견 5 — 활동은 전 세계적이고 모국어로 쓰인다
프롬프트의 약 93%는 라틴 문자 언어로 쓰여 있지만, 이건 표기 체계를 반영할 뿐 음악을 반영하진 않습니다. 그 아래에서 세션들은 대략 열 개의 뚜렷한 음악 세계로 군집을 이룹니다. 영어권 팝, 연주곡과 영화적 스코어, 스페인어권 발라드와 신앙곡, 브라질 sertanejo 와 funk, 동남아시아 dangdut 과 koplo, 동유럽과 발칸의 노래들. 표본에는 자바어 결혼식 노래, 스페인어 기도곡, 그리고 절 중간에 러시아어·아르메니아어·영어를 넘나드는 생일 헌정곡이 들어 있습니다.
이 분포는 자동화된 카탈로그 채우기보다, 오래된 행동 — 누군가를 위해 노래를 만드는 일 — 이 새로운 도구 위에서 돌아가는 모습과 더 잘 맞습니다.
도입세: 활동은 성장 중이다
활동은 확대되고 있습니다. 조사한 기간 동안 주간 생성량은 20배 넘게 늘었고, 일간 생성량은 한 분기 만에 대략 세 배가 됐습니다.
그 속도로 지속되는 성장은 일회성 호기심보다 반복 사용과 더 잘 맞습니다. 데이터가 가리키는 건, 예전에는 스튜디오와 밴드와 예산이 필요했던 제작 작업을 도구가 처리해 주기 때문에 사용자가 다시 돌아온다는 것입니다. 한편 사람만이 댈 수 있는 입력 — 가사, 의도, 상황 — 은 사용자에게 남습니다.
맥락: 60년 동안 똑같은 반론
"AI 음악은 영혼이 없다"는, 새 음악 도구가 60년 동안 받아온 거의 모든 평입니다. 그리고 앞선 사례들은 그 반론의 어느 부분이 들어맞는지 보여줍니다.
1968년, Wendy Carlos의 Switched-On Bach 는 히트작이자 스캔들이었습니다. 비평가들은 Moog 신디사이저가 차갑고 진짜 악기가 아니라고 했고, 음악가 노조는 그것이 오케스트라를 일자리에서 밀어낼 거라고 경고했습니다. 그것은 현대 팝과 일렉트로닉 음악의 토대가 됐습니다. Roland TR-808 드럼 머신은 1980년 거의 똑같은 비난을 받았고 — 영혼이 없다, 드러머를 대체할 것이다 — 이후 힙합, 하우스, 팝의 리듬적 토대가 됐습니다. Kanye West가 그것을 따 808s & Heartbreak 라는 앨범 제목을 붙일 만큼요.
그 기록은 비평가들이 부분적으로 옳았던 지점도 보여줍니다. 1980년대에 힙합 프로듀서들이 남의 음반을 샘플링하기 시작했을 때 "누구나 브레이크를 루프로 돌릴 수 있다"는 값싼 무시였지만, 그 밑에 깔린 저작권 분쟁은 진짜였고 소송들은 그 작법을 다시 빚어냈습니다. 새 도구는 때때로 실제로 측정 가능한 해를 끼치며, AI 음악의 스트리밍 부정 문제가 현재의 사례입니다. 핵심은 더 좁습니다. 그 해악들은 특정 트랙을 누가 저작했는가 하는 질문과는 별개라는 것입니다.
Auto-Tune 사례가 가장 분명합니다. Cher의 "Believe"가 1998년 그것을 유명하게 만들었고 T-Pain이 그것을 어디서나 들리게 했습니다. 반발이 뒤따랐고 — 속임수다, 로봇 목소리다, 감정이 없다 — 2009년 Jay-Z가 "D.O.A. (Death of Auto-Tune)" 를 내며 그것의 끝을 선언했습니다. 끝나지 않았습니다. 그것은 동시에 두 가지 용도로 갈라졌습니다. 교정 도구로, 그리고 T-Pain에서 Bon Iver를 거쳐 Kanye로 이어지는 의도된 미학으로. 두 경우 모두 사람이 저작자로 남았고 도구는 의도를 실행했습니다. 이 사례들 전반에서, 기계의 영혼에 관한 반론은 저작권 질문과 별개였습니다. 저작권은 사람이 무언가를 말하려고 도구를 쓰고 있었는가에 달려 있었습니다.
결론: 데이터가 저작권에 대해 말하는 것
창작 측면에서 증거는 명확합니다. 수십만 건의 세션에 걸쳐 사람이 가사를 쓰고, 구조를 짜고, 보컬을 캐스팅하고, 곡이 향할 상황을 고릅니다. 도구는 편곡을 연주합니다. 이 표본에서 저작자는 사람이고, AI는 브리프를 실행합니다.
"AI 쓰레기" 서사는 실재하지만, 그것이 묘사하는 건 스트리밍 플랫폼을 노리는 비교적 작은 집단 — 소비 측면의 문제 — 이지, 이 도구들로 음악을 만드는 집단이 아닙니다. 그 집단에게 데이터가 묘사하는 도구의 역할은 스튜디오 형태입니다. 한때 스튜디오와 밴드와 예산이 필요했던 제작을 대주고, 저작권은 사람에게 남깁니다. 그 구분이 Lacuna 의 전제입니다.