百度文心·CV大模型

百度文心·CV大模型

发布时间:2022-01-13 作者:创始人

  今天给大家分享的是以领先的视觉技术为基础,利用海量的图像、视频等数据的百度文心CV大模型,主要为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力,下面我们能一起来了解下!


百度文心·CV大模型


  文心·CV大模型

  1、VIMER-StrucTexT

  首个聚焦于中英文场景大规模OCR结构化预训练模型,其效果在6项中英文OCR结构化任务基准上大幅度刷新SOTA指标

  2、VIMER-Image

  自主研发的图像理解基础模型,基于百亿级别图像训练语料,联合弱监督自监督预训练方案,图像预训练模型在下游任务上达到业界领先。

  3、VIMER-Video

  自主研发的视频理解基础模型,基于百万小时时长互联网视频训练语料,联合弱监督自监督预训练方案,视频理解效果行业领先。

  更多百度文心CV大模型相关内容,百度云服务中心持续分享中!

  推荐阅读:百度文心大规模中文跨模态生成模型ERNIE-ViLG

7x24小时服务热线:400-996-8756

公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层

I CP备案号:豫B2-20110005-1

公安备案号: 41010502003271

法律顾问:河南天坤律师事务所-段志刚律师