近期,百度文心重磅发布三项功能,新增情感倾向分析、定制多标签文本分类模型等功能,并增强了数据管理能力,更好地满足自然语言处理(NLP)领域开发者需求,开发者可通过百度AI开发平台EasyDL进行使用,下面和腾佑AI人工智能一起来看详细内容:
文心(ERNIE)是依托百度深度学习平台飞桨打造的语义理解技术与平台,集先进的预训练模型、全面的NLP算法集、端到端开发套件和平台化服务于一体,为企业和开发者提供一整套NLP定制与应用能力。在2020世界人工智能大会,百度文心(ERNIE)荣获最高奖项SAIL奖(Super AI Leader,卓越人工智能引领者)。
EasyDL是百度大脑面向企业开发者推出的零门槛AI开发平台,基于百度自主研发的深度学习平台飞桨,结合业界先进的工程服务技术打造,覆盖视觉与自然语言处理两大技术方向,支持一站式智能标注、模型训练、服务部署等全流程功能。使用EasyDL简单三步即可完成NLP任务配置与训练,性能优异。
面向零算法基础的开发者和专业算法工程师,EasyDL提供了经典版、专业版两种产品形态,开放不同层次的开发灵活度。在经典版与专业版中,NLP功能与使用场景存在区别,用户可根据需求灵活选择。
经典版:适合算法零基础或追求高效率开发的用户,无须了解算法细节,最快5分钟上手。可快速定制多种NLP模型,覆盖NLP基础任务和场景化任务。
专业版:适合NLP初学者和专业算法开发者,内置丰富的NLP经典网络和预训练模型,可灵活脚本调参,只需少量数据可达到较优模型效果。
文心三项能力在EasyDL中全新发布
文心公有云服务本次新增了多标签文本分类、情感倾向分析等模型定制功能,并且丰富了数据标注、数据管理能力,以更好地满足开发者需求。
1、新增定制化多标签文本分类功能
“多标签文本分类”指对一段文本同时标记多个标签,如:“未来的学和教正在发生颠覆,学生将会在家里学习,机器人将走上讲台。”可对应标签为“教育”、“科技”。该功能应用场景广泛,如媒体场景中对新闻内容进行自动归类,在内容推荐场景中利用内容标签提升召回,通过自动标签功能对知识文档进行多层级分类等。
目前,平台经典版和专业版均新增了这项功能,在“专业版”的任务配置过程中,开发者还可选择ERNIE Tiny、ERNIE Large、ERNIE Base三种各有所长的预训练模型。
2、新增定制化情感倾向分析功能
“情感倾向分析”指对一段文本进行“积极情感”或“消极情感”的判断,如“酒店位置很好,服务周到热情,下次一定会再来”的用户评价,部署模型后可直接得到“Positive(积极情感)”的标签和99%的置信度。
该功能最常应用于用户评论分析和舆情分析,比如商品、店铺的口碑分析,对事实性的新闻事件或互联网话题进行舆情分析等,在汽车、餐饮、酒店等多个垂类上,分析准确率可达到95%以上。
目前,该功能已经上线平台经典版,后续平台将逐步增加基于实体级和句子级的情感分类,力求覆盖更多的应用需求。
3、文本数据管理和数据标注功能全面升级
针对开发者数据管理和数据标注过程中的痛点,平台支持了更加灵活的数据格式,当前可支持zip、Excel、TXT三种文件格式进行上传。平台除了提供在线标注能力外,还提供了智能标注功能,大幅降低了开发者的标注成本,开发者可直接上传未标注数据体验该功能。
文本智能标注示意图
以上是本次升级带来的新增能力,复制下方链接访问EasyDL零门槛AI开发平台,体验文心的领先技术能力。
EasyDL零门槛AI开发平台:https://ai.baidu.com/easydl/
文心(ERNIE)目前已广泛服务于传媒、金融、医疗等多个行业,助力多家企业完成业务的智能化转型,向智能经济时代迈进。未来,文心(ERNIE)将继续推动技术创新、产品功能丰富与体验优化,让更多的企业级开发者方便快捷地应用前沿NLP技术,以强大的文本智能助力各行各业。