🎙️ TTS 보이스 모델을 위한 성우 홈 레코딩 가이드

본 가이드는 고품질의 AI TTS(Text-to-Speech) 모델을 구축하기 위해 전문 성우분들께서 홈 레코딩 시 반드시 지켜주셔야 할 핵심 수칙을 담고 있습니다. AI 학습 데이터는 작은 소음이나 공간감의 변화에도 민감하게 반응하므로, 아래 가이드라인을 철저히 준수하여 녹음을 진행해 주시기 바랍니다.

1. 홈 레코딩 환경 및 장비 요건 (매우 중요)

전문 녹음실이 아닌 홈 레코딩 환경에서는 '울림(Reverb)'과 '배경 소음'을 완벽히 제어하는 것이 음질의 90%를 좌우합니다.

  • 마이크 장비: 노트북 내장 마이크, 블루투스 이어폰, 게이밍 헤드셋은 절대 사용 불가합니다. 별도의 콘덴서 마이크 또는 오디오 인터페이스가 연결된 마이크를 사용해 주세요.
  • 공간 울림 통제 (가장 중요): 텅 빈 방이나 화장실처럼 목소리가 벽에 부딪혀 울리는 곳은 피해야 합니다. 주변에 이불, 커튼, 흡음재를 두거나 옷장 안쪽을 향해 발성하여 메아리(공간감)를 최대한 없애주세요. 건조하고 먹먹하게 녹음된 소리가 AI 학습에 가장 이상적입니다.
  • 환경의 일관성: 녹음 중간에 쉬었다가 다시 녹음하거나, 추후 추가 녹음(AS)을 진행할 때 반드시 '동일한 방', '동일한 장비', '마이크와의 동일한 거리'를 유지해야 합니다. 데이터마다 톤이나 공간감이 다르면 모델이 혼란을 겪습니다.

2. 녹음 규격 및 파일 규칙

2.1. 웹 플랫폼 이용 및 오디오 포맷

2.2. 오디오 길이 및 자르기(절단) 규칙

2.3. 클리핑(Clipping) 찌그러짐 방지

3. 녹음 스타일 (Tone & Manner)

📌 이러닝 콘텐츠에서 사용되는 2가지 유형에 대하여 해당 샘플을 참조하여 음성을 녹음해 주시기 바랍니다.(해당 음성 길이는 참조를 위한 것이니 제공 되는 각 대본 길이에 맞춰주세요.)

이번 프로젝트는 용도에 따라 [내레이션 모드][진행 모드] 두 가지 대본으로 나뉘어 녹음됩니다. 대본 성격에 맞게 톤을 분리하여 일관성 있게 연기해 주시기 바랍니다.

3.1. 내레이션(Narration) 모드

🎧 내레이션 샘플 듣기:
📝 대본 자막
"우리가 일반적으로 '악취'라고 하면 하나의 특정한 냄새를 떠올릴 수 있는데요, 예를 들어 암모니아는 특유의 자극적인 냄새가 있고, 황화수소는 썩은 달걀 냄새로 잘 알려져 있죠. 이와 같이 하나의 화학물질이 특정 냄새를 유발하는 경우를 '단일악취' 라고 합니다."

3.2. 진행자(Host/Instructor) 모드

🎧 진행자 샘플 듣기:
📝 대본 자막
"여러분, 안녕하세요. 오늘은 조금 특별한 주제를 준비했습니다. 어쩌면 'SF 영화 같은 이야기'처럼 들릴지도 모르지만, 우리가 충분히 고민해 볼 현실적인 미래전략에 대해 이야기해보려 합니다. 바로 북한의 무기 공장을 로봇 공장으로 전환하는 이른바 '평화 로봇 로드맵'입니다. 과연 이게 현실적인 이야기일지, 저와 함께 꼼꼼히 짚어보시죠!"

🚨 (매우 중요) 딕션과 대본의 100% 일치

AI는 들리는 소리 그대로 문자를 1:1로 매칭하여 학습합니다. 대본의 단어를 임의로 추가/삭제하거나 "있습니다"를 "있고요"로 바꾸어 읽으시면 절대 안 됩니다. 혀가 꼬이거나 발음이 뭉개진 경우, 해당 문장은 반드시 다시 녹음해 주세요.

💡 요약 체크리스트