- 2021年10月10日
- Vasilis Friniots
- 。没有评论

在过去的两个星期里,在“ Pytorch Land”中非常忙碌,我们在Pytorch V1.10和Torchvision V0.11版本中准备了发烧。在该系列的第二批中,我将介绍Torchvision分支中目前包含的一些即将到来的功能。
滑: 尽管下一个版本充满了许多改进和错误/测试/文档,但我在这里强调了我个人关心的领域的新“用户”功能。在撰写博客文章后,我还注意到对我评论,撰写或密切关注的功能有偏见。涵盖(或不涵盖)一项没有说明其重要性的功能。表达的观点只是我的国家。
新型号
新版本充满了新模型:
- Kai Zhang添加了Regnet结构的实现,以及密切的原始纸的14种繁殖类型的预培训重量。
- 我最近添加了效率结构的实现,以及Luke Melas-Kyriazi和Ross Wightman提供的B0-B7变量的预先训练的权重。
增加新数据
一些新的数据扩展技术已添加到最新版本中:
- 塞缪尔·加布里埃尔(Samuel Gabriel)为琐事做出了贡献,这是一种简单但非常有效的策略,似乎提供了出色的自动自动效果。
- 我添加了自动激活方法。
- 我已经在参考文献中提交了混合和cutmix传输的实现。这些将从其应用程序编程接口完成后,将在下一版本中的转移中传输。
工作和新课程
包括许多运营商和新课程:
参考 /培训食谱
尽管我们改进参考程序是一项持续的努力,但以下是下一个版本中列出的一些新功能:
- Prabhat Roy在我们的分类配方中增加了对Si -Sia移动平均值的支持。
- 我更新了我们的参考文献以支持该名称的名称,该名称最近由Joel Shaluser和Thomas J.提出。
- 您已经使用了Ilqar Ramazanli开发的最新LR计划,其中包括了在学习率中执行温暖过程的选项。
其他改进
以下是版本中添加的其他一些突出改进:
- Alexander Sawari和Francisco Massa开发了FX有趣的工具,该工具允许从模型结构中提取任意中间特征。
- Nikita Chulga增加了CUDA 11.3的支持。
- Zhongkai Zhu修复了JPEG LIB依赖性(此问题引起了许多用户的头痛)。
正在进行和下一步
您在此版本中没有制作许多新的开发功能。这里有几个:
- Parmeet Singh Bhatia的Moto Hira制定了RFC,这提出了一种新的机制来释放模型并处理与预训练的权重相关的描述性数据。这将使我们能够支持为每个模型预训练的多个权重,并将附加相关信息(例如贴纸)和预处理变成模型。
- 我目前正在努力使用“列出的电池”项目添加的替代方案来提高我们的预培训模型的准确性。目的是为在火车之前接受过培训的最常见模型取得最佳效果。
- Philip Meier和Francisco Massa为新的Torchvision数据收集制作了令人兴奋的初始模型,并转换了API。
- Prabhat Roy扩展了Pytorch Core的
AveragedModel
除参数外,还支持平均临时仓库。据报道,此功能通常不会被报告为错误,并且将使许多库和射线框架能够删除专用的EMA应用程序。 - Aditya Oke编写了一个工具,该工具允许在原始照片上使用KePoint模型的结果(当我们不知所措时,该功能没有达到版本,并且我们无法及时审查它们🙁)
- 我正在建立一个FX-OT一代,旨在在任意模型的结构中发现其余的通信,并修改网络以添加组织块(例如
StochasticDepth
)。
最后,我们的积累中有一些新功能(很快PR):
我希望您找到了上述摘要。关于如何适应博客系列格式的任何想法非常欢迎。他在LinkedIn或 叽叽喳喳。