编组
控制台用户中心

金融自定义信息抽取平台

帮助金融行业研发人员在线定制金融信息抽取 API。无需任何 NLP 专业知识和大量标注数据也能快速冷启动,方便快捷地构建基准效果用来进行业务场景验证,从容应对灵活多变的业务场景需求。

功能介绍

三大功能

支持金融行业常见信息抽取任务

支持在新闻、公告、研报等不同文体中进行信息抽取。对姓名、公司名、时间等常见字段进行了专门优化。

零门槛定制信息抽取模型

无需 NLP 专业知识和大量标注数据,仅通过调整提示语即可在线定制多字段信息抽取模型。快速响应业务场景复杂多变的需求。

一键发布 API、轻松对接现有系统

在线可预览抽取效果,一键发布为 API 供已有业务平台调用。无缝对接低代码、RPA、聊天机器人等场景。

应用场景和痛点

金融行业信息抽取场景多、业务需求变化快。用纯规则方法做信息抽取应对变化能力较差。大部分场景缺少标注数据,难以进行模型训练。

纯规则抽取难以应对多变的表达

语言文字的描述方式变化多样,只用规则无法理解语义和上下文,难以获得更好的信息抽取效果。

算法模型定制项目实施周期漫长

算法模型标准化程度较低,好的效果往往需要深度定制。从立项、招标到业务上线投入巨大且过程漫长,难以快速响应业务需求。

缺少标注数据、模型训练“冷启动”难

深度定制算法模型不但需要大量数据标注,还涉及业务的高度配合和反馈。项目实施前期难以判断是否值得投入资源。

产品优势

产品优势

覆盖常见信息抽取场景、开箱即用

除了通用的姓名、公司名、时间等字段,还对金融领域常见的文档类型进行了针对性的优化,比如:罚款、诉讼、收购等公告和新闻事件。

基于零样本学习技术、标注需求低至零

基于孟子多任务学习技术,可以在完全没有标注数据的情况下也具有一定的抽取准确率。2022 年 8 月,在中文零样本学习权威榜单 ZeroCLUE、小样本学习权威榜单 FewCLUE 上均排名第一。

先冷启动再升级、项目投入风险低

可以先通过自定义信息抽取模型 API 快速冷启动建立基准效果,清晰定义输入输出。再对效果不及预期的环节加大投入进行针对性优化,有效降低项目风险。

中文零样本学习权威榜单 ZeroCLUE

2022 年 8 月 22 日排名

排名模型研究机构ScoreEPRSTMTCSLDCPTNEWSEIFLYTEKEOCNLIEBUSTMCHIDECSLECLUEWSCE
1Mengzi-T5-MT澜舟科技68.92686.9955.1974.7322.4274.6977.685.184.1765.17
2GPT-MoF阿里云机器学习平台PAI67.45884.260.2957.7351.3167.5963.988.256.5367.59
3二郎神-MRCIDEA研究院63.51586.1948.6569.4736.0845.5974.0584.6553.5379.31

中文小样本学习权威榜单 FewCLUE

2022 年 8 月 22 日排名

排名模型研究机构ScoreEPRSTMTCSLDCPTNEWSEIFLYTEKEOCNLIEBUSTMCHIDECSLECLUEWSCE
1Mengzi-T5-MT澜舟科技76.61288.1863.1578.7351.5474.7578.8585.2584.286.9
2FSL++Meituan NLP76.45888.4568.4275.5354.2777.7680.383.3579.7379.31
3玉言网昜伏羲76.30688.4570.9271.8753.1270.2378.7578.1582.8387.93

相关推荐

金融市场搜索研判平台

为市场研究和投资决策提供的信息搜索、分析研判以及决策支持的一体化平台解决方案。

了解详情

金融 NLP 平台

提供金融行业通用性较强的场景 NLP 能力,可以通过 API 进行调用。

了解详情

金融自定义信息抽取平台已推出在线试用

产品服务

商务合作邮箱

bd@langboat.com

ewm

公司地址

北京市海淀区海淀大街 3 号鼎好 DH3 大厦 A 座 11 层


gongan京公网安备 11010802035393号京ICP备 2021021087号

经营许可证编号:合字 B2-20220333

合作:

bd@langboat.com

地址:

北京市海淀区海淀大街 3 号鼎好 DH3 大厦 A 座 11 层

公众号:

ewm

support
business