BTS: 双语文本分割数据集,包含14250张图像,覆盖了室内和室外、不同字体、不同方向和曲线形状等各种情况,采用人工标注的方式,并通过两轮质量检查确保高质量标注
在数据集目录中的文章:
RenderMe-360 Dataset:大型数字资产库和高保真头部头像基准
GitHub: RenderMe-360/RenderMe-360 这是论文“ RenderMe-3 […]
声音活动检测(VAD)相关论文和代码资源
Voice activity detection (VAD) paper and code Github: l […]
LibriTTS-R: A Restored Multi-Speaker Text-to-Speech Corpus
主旨 介绍了一种名为LibriTTS-R的语音数据集,通过语音修复技术提高了语音样本的质量,为TTS研究提供了 […]