XFaceKit

 找回密码
 立即注册
搜索
热搜: 遮罩
查看: 283|回复: 0

[基础知识] 训练参数的意义和作用

[复制链接]

24

主题

10

回帖

210

积分

管理员

积分
210
发表于 2024-8-23 22:39:45 | 显示全部楼层 |阅读模式
[模型结构参数]

分辨率(Resolution):  人脸的大小,越高越清晰、需要的显存和运算量越大
模型架构(Archi):   模型的结构类型 vdf/viae
编码器维度(EncoderDims:  编码器的模型参数维度大小
解码器维度(DecoderDims:  解码器的模型参数维度大小
中间特征维度(InterDims:  中间层潜变量的参数维度大小(特征码的维度)
-----------------------------------------------------------------------------
[Train程序界面板块分布】

XFaceKit-train界面

XFaceKit-train界面

Train程序界面如上图,对不清楚的参数代表什么,可以把鼠标停在按钮或标签上,会显示中文提示。
左上方板块是模型信息,右上方板块是素材设置,下方板块是训练参数的设置
--------------------------------------------------
[素材设置]

SrcFace: Src人脸存放的目录,该目录必须要包含切脸文件。可以点击open按钮,在文件浏览器查看该文件夹中的文件。

(本选项为必选项,必须设置)
DstFace: Dst人脸存放的目录,该目录必须要包含切脸文件。可以点击open按钮,在文件浏览器查看该文件夹中的文件。

(本选项为必选项,必须设置)
ShareDir:  src和dst共享的人脸素材文件夹。该文件夹中的素材会同时被添加到src和dst。(本选项可以不设置)

需要选中use按钮才会启用。对于中高级用户,src素材不足需要训练口腔的时候可以采用
Occlude:  用于遮挡增强的素材文件夹。该文件夹中的遮挡素材会随机缩放旋转添加到人脸素材上。
选中src复选框会添加到src素材,选中dst复选框会添加到src素材。


[Schedule]训练规划参数


TargetIter:目标迭代数,训练到这个迭代数之后训练自动停止
PreviewRow:预览行数,但最终显示行数同时受到模型分辨率影响
AutoSaveIter:每隔多少个训练迭代自动保存模型
BackupIter : 每隔多少个训练迭代自动备份模型,备份保存在模型目录的backup文件夹下面
PreviewIter :训练多少个迭代更新一下训练预览图
PreviewSave:  训练多少个迭代之后保存一次预览图。(在开启保存预览选项开启后才会起效)

[备注:模型备份文件保存在模型的同目录的backup文件夹中,备份文件的文件名中会带有备份时的迭代数]

-----------------------------------------------------------------------------------------------------

【训练素材增强参数】

Src FlipHori: 对Src素材进行左右随机翻转。适合Src的素材脸部对称,一侧角度较少的情况。Src脸部不对称,比如
一侧脸部有明显的痣,则不要开启。

Dst FlipHori:对Dst素材进行左右随机翻转,可以增加dst的素材多样性。建模默认开启。
Src ScaleRot: 对Src素材进行小幅度的随机缩放和旋转。
Shift HSV : 对图片随机进行色调和明度的改变。
Random Warp :对素材进行随机的扭曲。增加表情的泛化程度。在预训练的早期都需要开启。
Warp Power: 扭曲的强度,一般用默认值即可。
EyeMouth Prio: 增加眼睛和嘴部区域的权重。此选项开启,Loss值会变大。因为额外将嘴部和眼睛区域的像素差异loss新加入了总loss值

Train InMask: 训练遮罩内像素。勾选此选项之后,将忽略人脸遮罩外的像素差异,只学习
人脸遮罩区域内的像素特征.

NeuroDropout: 随机置零部分神经元的比例。用于增加模型的的健壮性.

Learning Rate: 学习率,表示每一次迭代中调整参数的幅度。过小会导致学习变慢,过大可能会导致无法收敛到最优点, 在训练初期可以稍大一些,后期可以调小一

Batch Size: 每一个训练迭代加载的样本数量。


【高级选项】


Retrain HighLoss:   对loss值高的素材进行重新训练。常规训练的时候,每个素材训练的机会是均等的。

训练到一定程度以后,比如某些角度和表情已经训练得很好了,而某些大角度或者少见表情可能

还没有学习满意,这时候可以启用该选项,来增加高loss的样本的

Retrain FaceNum:   重新训练的人连数目。也就是前多少张人脸需要重新训练。

Norm TrainIter:正常训练迭代数

Retrain IterNum : 高Loss重训练的迭代数  

SharpGan: 启用清晰度增强的GAN训练



[高Loss重训的流程:    先进行正常训练,进行 NormTrain Iter次之后,开始进入High Loss重训练模式,从loss排序中的前 Retrain FaceNum个素材中,每次随机挑选batch size个素材来训练,训练 Retrain IterNum的迭代之后,又开始常规正常训练。如此循环】






loss实时

loss实时



--------------------------------

【训练预览图】

训练预览.png


预览图一共分为六列,所有分辨率的模型都是六列,前两列是src的原图和重建图,3-4列为dst的输入图和重建图

第五列为dst换为src的重建, 第六列为merge之后的融合图(遮罩来源于dst素材)



您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|沪ICP备14036317号-7|XFaceKit

GMT+8, 2024-9-20 00:49 , Processed in 0.079449 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表