Skip to content

Latest commit

 

History

History

ner

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 

中文命名实体识别模型

一个使用条件随机场的中文命名实体识别模型

模型效果

             precision    recall  f1-score   support

      B_LOC      0.944     0.827     0.882       266
      I_LOC      0.892     0.801     0.844      1203
      B_ORG      0.941     0.913     0.927       682
      I_ORG      0.932     0.869     0.899       997
      B_PER      0.985     0.918     0.951       440
      I_PER      0.983     0.939     0.961       824
        B_T      0.993     0.993     0.993       444
        I_T      0.995     0.995     0.995      1099

avg / total      0.953     0.904     0.928      5955

快速开始

特征提取

python manage.py process

模型训练

python manage.py train

实例

from ner.api import recognize
sentence = u'新华社北京十二月三十一日电(中央人民广播电台记者刘振英、新华社记者张宿堂)今天是一九九七年的最后一天。' \
           u'辞旧迎新之际,国务院总理李鹏今天上午来到北京石景山发电总厂考察,向广大企业职工表示节日的祝贺,' \
           u'向将要在节日期间坚守工作岗位的同志们表示慰问'
predict = recognize(sentence)

新华社北京十二月三十一日电(中央人民广播电台记者刘振英、新华社记者张宿堂)今天是一九九七年的最后一天。辞旧迎新之际,国务院总理李鹏今天上午来到北京石景山发电总厂考察,向广大企业职工表示节日的祝贺,向将要在节日期间坚守工作岗位的同志们表示慰问
新华社 北京 十二月三十一日  中央人民广播电台  刘振英  新华社  张宿堂  今天  一九九七年  国务院  李鹏 今天上午  北京石景山发电总厂

文档

代码文档

基于sphnix生成,请确保已经安装

cd doc
make html

博客

博客地址:http://blog.csdn.net/sinat_33741547/article/details/79131223

参考

1、基于规则和条件随机场的中文命名实体识别方法研究 程志刚