• 5 命名实体识别

    5 命名实体识别

    在本章开头,我们简要介绍了命名实体(NE)。命名实体是确切的名词短语,指示特定类型的个体,如组织、人、日期等。5.1列出了一些较常用的 NE 类型。这些应该是不言自明的,除了“FACILITY”:建筑和土木工程领域的人造产品;以及“GPE”:地缘政治实体,如城市、州/省、国家。

    表 5.1:

    常用命名实体类型

    1. Eddy N B-PER
    2. Bonte N I-PER
    3. is V O
    4. woordvoerder N O
    5. van Prep O
    6. diezelfde Pron O
    7. Hogeschool N B-ORG
    8. . Punc O
    1. >>> print(nltk.ne_chunk(sent))
    2. (S
    3. The/DT
    4. (GPE U.S./NNP)
    5. is/VBZ
    6. one/CD
    7. ...
    8. according/VBG
    9. to/TO
    10. (PERSON Brooke/NNP T./NNP Mossman/NNP)
    11. ...)