[模型结构参数]
分辨率(Resolution): 人脸的大小,越高越清晰、需要的显存和运算量越大
模型架构(Archi): 模型的结构类型 vdf/viae
编码器维度(EncoderDims): 编码器的模型参数维度大小
解码器维度(DecoderDims): 解码器的模型参数维度大小
中间特征维度(InterDims): 中间层潜变量的参数维度大小(特征码的维度)
-----------------------------------------------------------------------------
[Train程序界面板块分布】
XFaceKit-train界面
Train程序界面如上图,对不清楚的参数代表什么,可以把鼠标停在按钮或标签上,会显示中文提示。 左上方板块是模型信息,右上方板块是素材设置,下方板块是训练参数的设置 -------------------------------------------------- [素材设置]
SrcFace: Src人脸存放的目录,该目录必须要包含切脸文件。可以点击open按钮,在文件浏览器查看该文件夹中的文件。
(本选项为必选项,必须设置) DstFace: Dst人脸存放的目录,该目录必须要包含切脸文件。可以点击open按钮,在文件浏览器查看该文件夹中的文件。
(本选项为必选项,必须设置) ShareDir: src和dst共享的人脸素材文件夹。该文件夹中的素材会同时被添加到src和dst。(本选项可以不设置)
需要选中use按钮才会启用。对于中高级用户,src素材不足需要训练口腔的时候可以采用 Occlude: 用于遮挡增强的素材文件夹。该文件夹中的遮挡素材会随机缩放旋转添加到人脸素材上。 选中src复选框会添加到src素材,选中dst复选框会添加到src素材。
[Schedule]训练规划参数
TargetIter:目标迭代数,训练到这个迭代数之后训练自动停止 PreviewRow:预览行数,但最终显示行数同时受到模型分辨率影响 AutoSaveIter:每隔多少个训练迭代自动保存模型 BackupIter : 每隔多少个训练迭代自动备份模型,备份保存在模型目录的backup文件夹下面 PreviewIter :训练多少个迭代更新一下训练预览图 PreviewSave: 训练多少个迭代之后保存一次预览图。(在开启保存预览选项开启后才会起效)
[备注:模型备份文件保存在模型的同目录的backup文件夹中,备份文件的文件名中会带有备份时的迭代数]
-----------------------------------------------------------------------------------------------------
【训练素材增强参数】
Src FlipHori: 对Src素材进行左右随机翻转。适合Src的素材脸部对称,一侧角度较少的情况。Src脸部不对称,比如 一侧脸部有明显的痣,则不要开启。
Dst FlipHori:对Dst素材进行左右随机翻转,可以增加dst的素材多样性。建模默认开启。 Src ScaleRot: 对Src素材进行小幅度的随机缩放和旋转。 Shift HSV : 对图片随机进行色调和明度的改变。 Random Warp :对素材进行随机的扭曲。增加表情的泛化程度。在预训练的早期都需要开启。 Warp Power: 扭曲的强度,一般用默认值即可。 EyeMouth Prio: 增加眼睛和嘴部区域的权重。此选项开启,Loss值会变大。因为额外将嘴部和眼睛区域的像素差异loss新加入了总loss值
Train InMask: 训练遮罩内像素。勾选此选项之后,将忽略人脸遮罩外的像素差异,只学习 人脸遮罩区域内的像素特征.
NeuroDropout: 随机置零部分神经元的比例。用于增加模型的的健壮性.
Learning Rate: 学习率,表示每一次迭代中调整参数的幅度。过小会导致学习变慢,过大可能会导致无法收敛到最优点, 在训练初期可以稍大一些,后期可以调小一
Batch Size: 每一个训练迭代加载的样本数量。
【高级选项】
Retrain HighLoss: 对loss值高的素材进行重新训练。常规训练的时候,每个素材训练的机会是均等的。
训练到一定程度以后,比如某些角度和表情已经训练得很好了,而某些大角度或者少见表情可能
还没有学习满意,这时候可以启用该选项,来增加高loss的样本的
Retrain FaceNum: 重新训练的人连数目。也就是前多少张人脸需要重新训练。
Norm TrainIter:正常训练迭代数
Retrain IterNum : 高Loss重训练的迭代数
SharpGan: 启用清晰度增强的GAN训练
[高Loss重训的流程: 先进行正常训练,进行 NormTrain Iter次之后,开始进入High Loss重训练模式,从loss排序中的前 Retrain FaceNum个素材中,每次随机挑选batch size个素材来训练,训练 Retrain IterNum的迭代之后,又开始常规正常训练。如此循环】
loss实时
--------------------------------
【训练预览图】
预览图一共分为六列,所有分辨率的模型都是六列,前两列是src的原图和重建图,3-4列为dst的输入图和重建图
第五列为dst换为src的重建, 第六列为merge之后的融合图(遮罩来源于dst素材)
|