atlithor
/

RepeaTTS-level-3

text-generation

Model card Files Files and versions

atlithor commited on Apr 28

Commit

c750973

·

verified ·

1 Parent(s): cfe24c3

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -27,14 +27,18 @@ import torch
 from parler_tts import ParlerTTSForConditionalGeneration
 from transformers import AutoTokenizer
 import soundfile as sf
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
 model = ParlerTTSForConditionalGeneration.from_pretrained("atlithor/RepeaTTS-level-3").to(device)
 tokenizer = AutoTokenizer.from_pretrained("atlithor/EmotiveIcelandic")
 description_tokenizer = AutoTokenizer.from_pretrained(model.config.text_encoder._name_or_path)
 prompt = "Þetta er frábær hugmynd!" # E: this is a great idea!
 description = "The recording is of very high quality, with Ingrid's voice sounding clear and very close up. Ingrid speaks at very high intensity."
 input_ids = description_tokenizer(description, return_tensors="pt").input_ids.to(device)
 prompt_input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(device)
 generation = model.generate(input_ids=input_ids, prompt_input_ids=prompt_input_ids)
 audio_arr = generation.cpu().numpy().squeeze()
 sf.write("ingrid_intense.wav", audio_arr, model.config.sampling_rate)

 from parler_tts import ParlerTTSForConditionalGeneration
 from transformers import AutoTokenizer
 import soundfile as sf
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
 model = ParlerTTSForConditionalGeneration.from_pretrained("atlithor/RepeaTTS-level-3").to(device)
 tokenizer = AutoTokenizer.from_pretrained("atlithor/EmotiveIcelandic")
 description_tokenizer = AutoTokenizer.from_pretrained(model.config.text_encoder._name_or_path)
 prompt = "Þetta er frábær hugmynd!" # E: this is a great idea!
 description = "The recording is of very high quality, with Ingrid's voice sounding clear and very close up. Ingrid speaks at very high intensity."
 input_ids = description_tokenizer(description, return_tensors="pt").input_ids.to(device)
 prompt_input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(device)
 generation = model.generate(input_ids=input_ids, prompt_input_ids=prompt_input_ids)
 audio_arr = generation.cpu().numpy().squeeze()
 sf.write("ingrid_intense.wav", audio_arr, model.config.sampling_rate)