百度文心·CV大模型

发布时间：2022-01-13 作者：创始人

　　今天给大家分享的是以领先的视觉技术为基础，利用海量的图像、视频等数据的百度文心CV大模型，主要为企业和开发者提供强大的视觉基础模型，以及一整套视觉任务定制与应用能力，下面我们能一起来了解下！

百度文心·CV大模型

　　文心·CV大模型

　　1、VIMER-StrucTexT

　　首个聚焦于中英文场景大规模OCR结构化预训练模型，其效果在6项中英文OCR结构化任务基准上大幅度刷新SOTA指标

　　2、VIMER-Image

　　自主研发的图像理解基础模型，基于百亿级别图像训练语料，联合弱监督自监督预训练方案，图像预训练模型在下游任务上达到业界领先。

　　3、VIMER-Video

　　自主研发的视频理解基础模型，基于百万小时时长互联网视频训练语料，联合弱监督自监督预训练方案，视频理解效果行业领先。

　　更多百度文心CV大模型相关内容，百度云服务中心持续分享中！

标签：百度文心 CV大模型视觉技术视觉基础模型 OCR结构化中英文OCR 图像理解基础模型图像训练视频理解