F5-TTS
Collection
2 items
•
Updated
โมเดล Text To Speech ภาษาไทย
โมเดลหลัก : SWivid/F5-TTS
Github : https://github.com/SWivid/F5-TTS
| ชุดข้อมูล | ระยะเวลา(ชั่วโมง) |
|---|---|
| Common Voice (Porameht/processed-voice-th-169k) | ~160 |
| Porjai Dataset | ~300 |
| Common Voice-EN(อังกฤษ) | ~40 |
ขนาดโมเดลล่าสุด
ภาษาที่รองรับ: ไทย และ อังกฤษ.
การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
ติดตั้ง
pip install f5-tts-th
#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
ใช้งาน
from f5_tts_th.tts import TTS
import soundfile as sf
tts = TTS(model="v1")
wav = tts.infer(
ref_audio="YOUR_AUDIO_PATH",
ref_text="ได้รับข่าวคราวของเราที่จะหาที่มันเป็นไปที่จะจัดขึ้น.",
gen_text="สวัสดีครับ นี่คือเสียงพูดภาษาไทย.",
step=32,
cfg=2.0,
speed=1.0
)
sf.write("test.wav", wav, 24000)