AINLP07 – Extract entities
1 min read

AINLP07 – Extract entities

(Source: https://learn.microsoft.com/en-us/training/modules/analyze-text-ai-language/6-extract-entities)

Named Entity Recognition identifies entities that are mentioned in the text. Entities are grouped into categories and subcategories, for example:

  • Person
  • Location
  • DateTime
  • Organization
  • Address
  • Email
  • URL

Nhận diện thực thể được đặt tên (Named Entity Recognition) xác định các thực thể được đề cập trong văn bản. Các thực thể được nhóm vào các danh mục và phân mục, ví dụ:

  • Người
  • Địa điểm
  • Thời gian
  • Tổ chức
  • Địa chỉ
  • Email
  • URL

Note

For a full list of categories, see the documentation.

Input for entity recognition is similar to input for other Azure AI Language API functions:


Đầu vào cho nhận diện thực thể tương tự như đầu vào cho các chức năng khác của Azure AI Language API:

{
  "kind": "EntityRecognition",
  "parameters": {
    "modelVersion": "latest"
  },
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "Joe went to London on Saturday"
      }
    ]
  }
}

The response includes a list of categorized entities found in each document:


Phản hồi bao gồm một danh sách các thực thể được phân loại được tìm thấy trong mỗi tài liệu:

{
    "kind": "EntityRecognitionResults",
     "results": {
          "documents":[
              {
                  "entities":[
                  {
                    "text":"Joe",
                    "category":"Person",
                    "offset":0,
                    "length":3,
                    "confidenceScore":0.62
                  },
                  {
                    "text":"London",
                    "category":"Location",
                    "subcategory":"GPE",
                    "offset":12,
                    "length":6,
                    "confidenceScore":0.88
                  },
                  {
                    "text":"Saturday",
                    "category":"DateTime",
                    "subcategory":"Date",
                    "offset":22,
                    "length":8,
                    "confidenceScore":0.8
                  }
                ],
                "id":"1",
                "warnings":[]
              }
          ],
          "errors":[],
          "modelVersion":"2021-01-15"
    }
}

To learn more about entities see the Build a conversational language understanding model module.

Leave a Reply

Your email address will not be published. Required fields are marked *