1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > ai人工智能培训讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-7

ai人工智能培训讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-7

时间:2022-04-08 17:41:16

相关推荐

ai人工智能培训讲师计算机视觉讲师叶梓:计算机视觉领域的自监督学习模型——MAE-7

接上一篇

P14-P16

VAE

n 按苏剑林的说法: VAE 本质上就是在常规自编码器的基础上,对 encoder 的结果(对应计算均值的网络)加上了“高斯噪声”,使得结果 decoder 能够对噪声有鲁棒性; n 另一个 encoder (对应计算方差的网络)的作用是用来动态调节噪声的强度的。

dVAE

用Gumbel-Softmax(Jang et al.,;Maddison et al.,)松弛法来训练模型参数。

n 首先要训练了一个 discrete variational autoencoder ( dVAE ) 。 n dVAE 的意思是“离散的 VAE ”,它和 VAE 的本质是一样的:都是把一幅图像通过一些操作得到隐变量,再把隐变量通过一个生成器重建原图。 n VAE 使用均值、方差拟合神经网络得到隐变量; 使用生成器重建原图 • dVAE 使用 Tokenizer 得到隐变量;使用 Decoder 重建原图。

BEiT

n BEIT 的目标是最小化计算预测的 token 与真实的 token 之间的差异。 n 上式的含义就是:对盖住的每个 patches , BEIT 的 Encoder 在这个位置的输出,通过线性分类器之后得到预测的 visual token 与真实 patches 对应的 visual token 越接近越好。

未完,下一篇继续……

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。