1 year ago · 02682d4767
--- a/app/run.sh
+++ b/app/run.sh
@@ -12,7 +12,7 @@ for f in /data/ingest/*; do
 
				     # Split voice and music from audio file
			
 
				     python3 /vocal-remover/inference.py -i /data/temp/"$filename".wav -o /data/temp/ --tta --pretrained_model /vocal-remover/models/baseline.pth
			
 
				     # Clone the voice
			
 
				-    svc infer -o /data/temp/"$filename"_"$SPEAKER".wav -m "$MODEL_PATH" -c "$MODEL_CONFIG_PATH" -s "$SPEAKER" /data/temp/"$filename"_Vocals.wav
			
 
				+    svc infer -o /data/temp/"$filename"_"$SPEAKER".wav -m "$MODEL_PATH" -c "$MODEL_CONFIG_PATH" -s "$SPEAKER" -na -t "$TRANSPOSE" /data/temp/"$filename"_Vocals.wav
			
 
				     # Combine voice and music into one mp3 file
			
 
				     ffmpeg -loglevel warning -y -i /data/temp/"$filename"_"$SPEAKER".wav -i /data/temp/"$filename"_Instruments.wav \
			
 
				         -filter_complex "[0:a]volume=$VOCALS_VOLUME[a0];[a0][1:a]amix=inputs=2:duration=longest" /data/temp/"$filename"_"$SPEAKER"_combined.wav
			
--- a/docker-compose.yml
+++ b/docker-compose.yml
@@ -11,4 +11,5 @@ services:
 
				       - "MODEL_PATH=/data/models/hanzo_ana/G_460.pth"
			
 
				       - "MODEL_CONFIG_PATH=/data/models/hanzo_ana/config.json"
			
 
				       - "SPEAKER=hanzo"
			
 
				-      - "VOCALS_VOLUME=1.5"
			
 
				+      - "VOCALS_VOLUME=1.5"
			
 
				+      - "TRANSPOSE=0"