• 金鼎卫生院信息网
  • 您的位置:首页 >> 国际新闻 >> 正文

    HanLP-基于HMM-Viterbi的人名识别原理介绍

    发表时间:2019-09-21 信息来源:www.giaoxuphuoc.com 浏览次数:1437

     

    基于HMM-Viterbi处理名称识别内容的Hanm自然语言处理包可能在年初共享这类文章,时间稍长,有点遗忘。我看到这个白子玉的份额比我之前分享的要简单明了得多。以下文章将分享文章供大家交流和学习,并且一些内容必须进行修改。

    本文主要介绍HanLP如何使用HMM识别名称。基本思想是使用单词序列作为观察序列,将字符序列用作隐藏序列。当模型预测最佳隐藏状态序列时,模式最大匹配方法用于匹配名称实体。以下描述了本申请中模型的三个元素的内容,因为需要训练阶段来解决这三个元素的值。

    假设有以下观察序列及其相应的隐藏序列

    观察顺序:单词1单词2 .单词n

    隐含变量序列:角色1角色2 .角色n

    训练阶段:计算三个元素(三个矩阵的元素值)

    初始概率分布:

    每个隐藏变量的含义列于下表

    状态转移概率分布:

    观察到的概率分布:

    这些概率值的计算非常简单,即频率方法,然后在引入隐藏的马时将其写入。

    预测阶段:

    根据训练的三个要素,维特比算法用于求解最优隐藏变量序列。角色1 *角色2 * .角色n *

    最大模式匹配阶段:

    使用下面的模式字符串匹配名称

    {BBCD,BBE,BBZ,BCD,BEE,BE,BG,BXD,BZ,CD,EE,FB,Y,XD}

    这里介绍了基于HMM-Viterbi注释的名称识别原理。我想我应该明确这个原则。如果您还没有理解,我会等待关于隐马的后续文章。基于隐马的名称识别将能够识别具有姓氏的人的姓名,特别是地名中的人的姓名。因此,手动整理使用姓氏的人的姓名,并且需要一些地名。完成之后,我应该把它放在专栏文章中,毕竟它是在公共语料库中完成的,并且它不涉及任何不方便的事情。

    http://wap.gumtu.cn

  • 热门标签

  • 日期归档

  • 友情链接:

    金鼎卫生院信息网 版权所有© www.giaoxuphuoc.com 技术支持:金鼎卫生院信息网 | 网站地图