Facebook开源深度学习框架Pythia用于图像和语言模型 继1月开放图像处理库Spectrum

如果最近的用于言模发展有任何迹象,Facebook对更广泛的图像开发社区的承诺仍然如此强大。继1月开放图像处理库Spectrum,和语去年年底自然语言处理建模框架PyText以及11月人工智能强化学习平台Horizon之后,开源框架Facebook的深度人工智能研究部门今天宣布Pythia,一个模块化的学习型即插即用框架使数据科学家能够快速构建,复制和基准AI模型,用于言模现在可以在GitHub上免费获得。图像
正如Facebook在一篇博文中解释的和语那样,Pythia--它是开源框架在公司的PyTorch机器学习框架之上构建的 - 主要用于视觉和语言任务,例如回答与视觉数据相关的深度问题并自动生成图像标题。它结合了Facebook AI Research在人工智能竞赛中的学习型顶级参赛作品,如LoRRA,一个同时赢得VQA挑战2018和Vizwiz Challenge 2018的视觉和语言模型,它能够展示以前最先进的AI系统如何实现顶级基准测试结果并将其性能与新模型的性能进行比较。
Pythia还支持分布式培训和各种数据集,以及自定义损失,指标,调度和优化器。存在并考虑了具有常用视觉和语言层实现的模块,以及对分布式培训的支持; 内置语料库,包括VQA,VizWiz,TextVQA和VisualDialog; 和多任务处理等功能,可以一起训练多个语料库。
Facebook表示,它将扩展Pythia的初始开源版本,包括即将推出的工具,任务,数据集和参考模型。
“Pythia平滑了进入不断增长的视觉和语言子领域的过程,并使研究人员能够专注于更快的原型设计和实验。我们的目标是通过提高这些模型和结果的可重复性来加速进步,“Facebook在博客文章中写道。“这将使社区更容易在成功的系统上进行构建和基准测试。我们希望消除一些障碍将使研究人员能够更快地为人们和智能机器开发新的交流方式。这项工作还应该帮助研究人员开发自适应人工智能,将多种理解融合到更基于情境的多模式理解中。“
Pythia的首次亮相是在Facebook在旧金山举行的F8开发者峰会期间推出PyTorch 1.1几周之后,该峰会增加了对谷歌TensorBoard及其即时(JIT)编译器性能改进的支持。去年秋天GitHub的2018年Octoverse报告将PyTorch命名为GitHub上最受欢迎的开源项目之一,全球有超过3100万开发人员。
相关文章
- 魔宗现世挑战作为天涯明月刀手游中极具策略性的高难度副本,琴魔作为其中的核心BOSS之一,其独特的音律机制和高爆发技能对玩家的操作意识与输出节奏提出了严苛要求。将从机制解析、走位技巧、输出窗口三个维度,2025-05-09
- 摘要:走进比亚迪总装车厂,充满科技感的智慧工厂场景展现在眼前:大屏幕上“一屏感知”总装产量、车辆出入库、能耗物料等关键指标,AGV小车在固定路线上将保险杠运输到特定机床,员工佩戴AR头盔指导生产,生产2025-05-09
- “3•15消费者之声全媒体互动平台”是中国消费者报社为进一步加强和消费者的沟通与联系,切实发挥“民生探头”作用,推动媒体深度融合,推进采编理念创新的实践探索。自2023年“3•152025-05-09
- 中国消费者报北京讯记者董芳忠)5月22日,第十四届中国国际商标品牌节以下简称商标品牌节)新闻发布会在京举办。本届商标品牌节由中华商标协会主办,陕西省品牌建设促进中心、中企商标发展中心承办,主题为“服务2025-05-09
- 5月1日12时起东海全面进入伏季休渔期宁波3607艘渔船将返港休渔其中象山、奉化、宁海三地渔船占全市94%今年宁波海洋伏季休渔管理制度将更加严格↓↓一、专项特许捕捞更加严格今年对专项特许开捕的四类作业2025-05-09
- 中国消费者报北京讯记者孟刚)4月11日,国家医保局召开2024年上半年例行新闻发布会,介绍了医保基金运行情况、医保药品目录管理等。其中提到,在现有糖尿病、高血压等5种门诊慢特病的基础上,进一步扩大门诊2025-05-09
最新评论