学习型和语开源框架深度图像用于言模-逸影云栈

当前所在位置: 首页 >> 焦点

学习型和语开源框架深度图像用于言模

发布时间：2025-06-18 22:01:44 作者：wt 点击：99 【字体：大中小】

导读如果最近的开源框架发展有任何迹象，Facebook对更广泛的深度开发社区的承诺仍然如此强大。继1月开放图像处理库Spectrum，学习型去年年底自然语言处理建模框架P 2019-05-26 11:27:06

如果最近的用于言模发展有任何迹象，Facebook对更广泛的图像开发社区的承诺仍然如此强大。继1月开放图像处理库Spectrum，和语去年年底自然语言处理建模框架PyText以及11月人工智能强化学习平台Horizon之后，开源框架Facebook的深度人工智能研究部门今天宣布Pythia，一个模块化的学习型即插即用框架使数据科学家能够快速构建，复制和基准AI模型，用于言模现在可以在GitHub上免费获得。图像

正如Facebook在一篇博文中解释的和语那样，Pythia--它是开源框架在公司的PyTorch机器学习框架之上构建的 - 主要用于视觉和语言任务，例如回答与视觉数据相关的深度问题并自动生成图像标题。它结合了Facebook AI Research在人工智能竞赛中的学习型顶级参赛作品，如LoRRA，一个同时赢得VQA挑战2018和Vizwiz Challenge 2018的视觉和语言模型，它能够展示以前最先进的AI系统如何实现顶级基准测试结果并将其性能与新模型的性能进行比较。

Pythia还支持分布式培训和各种数据集，以及自定义损失，指标，调度和优化器。存在并考虑了具有常用视觉和语言层实现的模块，以及对分布式培训的支持; 内置语料库，包括VQA，VizWiz，TextVQA和VisualDialog; 和多任务处理等功能，可以一起训练多个语料库。

Facebook表示，它将扩展Pythia的初始开源版本，包括即将推出的工具，任务，数据集和参考模型。

“Pythia平滑了进入不断增长的视觉和语言子领域的过程，并使研究人员能够专注于更快的原型设计和实验。我们的目标是通过提高这些模型和结果的可重复性来加速进步，“Facebook在博客文章中写道。“这将使社区更容易在成功的系统上进行构建和基准测试。我们希望消除一些障碍将使研究人员能够更快地为人们和智能机器开发新的交流方式。这项工作还应该帮助研究人员开发自适应人工智能，将多种理解融合到更基于情境的多模式理解中。“

Pythia的首次亮相是在Facebook在旧金山举行的F8开发者峰会期间推出PyTorch 1.1几周之后，该峰会增加了对谷歌TensorBoard及其即时(JIT)编译器性能改进的支持。去年秋天GitHub的2018年Octoverse报告将PyTorch命名为GitHub上最受欢迎的开源项目之一，全球有超过3100万开发人员。

阅读全文