-
Notifications
You must be signed in to change notification settings - Fork 96
Open
Description
作者您好,我的代码基础比较一般,在运行demo.ipynb的时候,我对以下代码感到疑惑:
sbmt_i = metadata[0]
emb_org = torch.from_numpy(sbmt_i[1]).to(device)
x_org, f0_org, len_org, uid_org = sbmt_i[2]
我大概理解了一下,sbmt_i代表的是原说话人的语音信息,sbmt_i[0]指的是说话人身份,sbmt_i[1]指的是一个one-hot编码(我不太理解这个编码的用处),sbmt_i[2]是一个四维的元组,分别代表mel信息,f0信息,mel曲线和f0曲线的长度,uid
我想知道这个uid是怎么获得的,它是什么含义?
以及我想知道x_org, f0_org的获得方式。
希望得到您宝贵的回复!
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels