面向低资源命名实体识别的CharBiLSTM-Att-CRF模型
CharBiLSTM-Att-BCRF Model for Low Resource Named Entity Recognition
-
作者:
吴佳华
1
-
作者单位:
- 通讯作者:
吴佳华
Email:202041600071@jxnu.edu.cn
-
提交时间:2022-07-19
摘要: 当标注数据较少时,现有模型受训练数据量少的限制,参数没有拟合到预期效果,导致在低资源命名实体识别任务中模型识别性能不佳。本文通过采用K折交叉验证法,使模型较好拟合数据。此外,本文在BiLSTM-CRF模型基础上融合多层字符特征信息和自注意力机制,结合K折交叉验证法,构建了CharBiLSTM-Att-CRF模型。本文提出的CharBiLSTM-Att-CRF模型在20%的CONLL2003和20%的BC5CDR的数据集上,F1值在BiLSTM-CRF模型基础上分别提升了7.00%、4.08%。该模型能较好地适应低资源命名实体识别任务。
版本历史
[V1] |
2022-07-19 06:53:04 |
ChinaXiv:202207.00144V1
|
下载全文 |