搜索
您的当前位置:首页正文

基于主动学习的中文医疗实体识别标注方法及系统[发明专利]

2023-09-18 来源:易榕旅网
专利内容由知识产权出版社提供

专利名称:基于主动学习的中文医疗实体识别标注方法及系统专利类型:发明专利发明人:涂思强,孙庆华,王聪申请号:CN202110108397.6申请日:20210127公开号:CN112800766A公开日:20210514

摘要:本发明公开了一种基于主动学习的中文医疗实体识别标注方法及系统,该方法包括以下步骤:预训练步骤;第一主动学习步骤:构造第一命名实体识别模型,基于训练集进行训练学习,基于验证集进行验证,根据第一验证结果调整学习过程;第二主动学习步骤:结合文本向量和转移分数筛选出待标注数据,整理数据集,对第一命名实体识别模型进行重新训练得到第二命名实体识别模型,对第二命名实体识别模型进行验证,根据第二验证结果调整重新训练的过程;识别步骤:基于第三命名实体识别模型对待识别的中文医疗文本进行识别。本发明采用的主动学习结合了文本向量和转移分数,筛选出来的文本差异度更高,减少了标注成本,并通过专家标注及时纠正输出的错误。

申请人:华南理工大学

地址:510640 广东省广州市天河区五山路381号

国籍:CN

代理机构:广州市华学知识产权代理有限公司

代理人:李斌

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top