今天给大家带来的是百度文心发套件专业版V1.0.2上线升级的相关信息,自百度文心NLP开发套件专业版发布,首次开放了业界期待已久的ERNIE 2.0中文预训练模型,面向产学研各界的开发者提供领先的语义理解能力。时隔两个月,文心NLP开发套件专业版V1.0.2升级上线,数据处理能力进一步增强,同时新增/升级了5大算法任务。
全新升级的数据处理能力
1,新增“文本数据增强”功能:开发者可以基于此策略丰富已有训练集的数据特征,进而有效提升模型效果;
2,新增“噪声样本挖掘”功能:数据标注的标准不统一或存在的歧义会导致数据标注的质量参差,通过此功能可以有效避免噪声样本在网络训练过程中带来的影响,同时也能在一定程度上降低调优过程中的计算资源消耗;
新上多种算法任务
1,新增“小样本分类”任务:结合few-shot分类技术与效果领先的中文预训练模型ERNIE,显著提升在数据集中样本较少情况下的文本分类效果;
2,新增“文本语义向量化”任务:文心提供两种方式来获取文本语义向量,一是通过ERNIE-Sim模型进行预测来获取语义向量,二是使用数据对ERNIE-Sim模型进行fine-tune得到语义向量;
3,新增“Term重要性”任务:给出一个明文文本中每个短语的重要程度,常用于query理解等场景;
4,“阅读理解”任务能力升级:能力升级后,可以针对训练得到的模型进行推理服务。
抢先体验:https://wenxin.baidu.com/wenxin/sdk
更多百度文心软硬能力升级相关内容,百度云服务中心持续分享中!