Pular para o conteúdo principal

Desafio 14: Análise de Texto: Frases-Chave e Entidades

Tempo Estimado

20-30 min | Custo: Gratuito | Domínio: Processamento de Linguagem Natural (15-20%)

Habilidades do exame abordadas

  • Identificar recursos e usos para extração de frases-chave
  • Identificar recursos e usos para reconhecimento de entidades
  • Identificar capacidades do serviço Azure AI Language

Visão geral

Análise de texto é o processo de extrair informações significativas de texto não estruturado. Duas capacidades fundamentais são extração de frases-chave e reconhecimento de entidades nomeadas (NER) — ambas disponíveis através do serviço Azure AI Language.

Extração de frases-chave identifica os principais pontos discutidos em um documento. Dado um parágrafo sobre uma avaliação de hotel, pode extrair "equipe simpática", "quartos limpos" e "ótima localização". Isso ajuda você a entender rapidamente sobre o que um documento trata sem ler o texto inteiro. Casos de uso comuns incluem sumarização de documentos, etiquetagem de conteúdo e indexação para busca.

Reconhecimento de entidades nomeadas identifica e categoriza entidades no texto — pessoas, lugares, organizações, datas, quantidades e mais. Por exemplo, na frase "A Microsoft foi fundada por Bill Gates em 1975 em Albuquerque", o NER identificaria "Microsoft" (organização), "Bill Gates" (pessoa), "1975" (data/hora) e "Albuquerque" (localização). Isso potencializa aplicações como extração automatizada de dados, classificação de conteúdo e construção de grafos de conhecimento.

Explorar

Tarefa 1: Entender a extração de frases-chave

A extração de frases-chave identifica os pontos mais importantes do texto. Revise estes exemplos:

Texto de EntradaFrases-Chave Extraídas
"A comida estava deliciosa e a equipe foi maravilhosa no restaurante perto da praia."comida, equipe, restaurante, praia
"Os serviços de Azure AI fornecem modelos de machine learning pré-construídos para cenários comuns."serviços de Azure AI, modelos de machine learning pré-construídos, cenários comuns
"O relatório de resultados trimestrais mostrou aumento de receita no mercado europeu."relatório de resultados trimestrais, aumento de receita, mercado europeu

Sua tarefa: Pense em um parágrafo do seu trabalho (um email, relatório ou documento). Quais frases-chave você esperaria que o serviço extraísse?

Tarefa 2: Explore o reconhecimento de entidades nomeadas

Navegue até o demo do Azure AI Language Studio: language.cognitive.azure.com

  1. Selecione Extract informationNamed entity recognition
  2. Experimente o seguinte texto de exemplo:

"Em 15 de janeiro de 2024, a Contoso Ltd. anunciou um investimento de US$ 2,5 bilhões em sua sede em Seattle. A CEO Jane Smith disse que a expansão criaria 5.000 novos empregos."

Categorias de entidades esperadas:

EntidadeCategoriaSubcategoria
15 de janeiro de 2024DateTimeDate
Contoso Ltd.Organization
US$ 2,5 bilhõesQuantityCurrency
SeattleLocationCity
Jane SmithPerson
5.000QuantityNumber

Tarefa 3: Compare frases-chave vs. entidades

Essas duas capacidades servem a propósitos diferentes:

CapacidadeO que extraiMelhor para
Extração de frases-chaveConceitos e tópicos importantesEntender sobre o que o texto trata
Reconhecimento de entidadesCoisas nomeadas específicas (pessoas, lugares, datas)Extrair dados estruturados do texto

Sua tarefa: Para a frase "O CEO da Microsoft, Satya Nadella, anunciou novos recursos de IA na conferência Build em Seattle em 21 de maio de 2024":

  • Frases-chave seriam: CEO da Microsoft, Satya Nadella, novos recursos de IA, conferência Build, Seattle
  • Entidades seriam: Microsoft (Org), Satya Nadella (Pessoa), Build (Evento), Seattle (Localização), 21 de maio de 2024 (DateTime)

Tarefa 4: Explore as categorias de entidades

O Azure AI Language reconhece muitas categorias de entidades. Consulte a documentação: Categorias de entidades no Azure AI Language

Categorias principais incluem:

  • Person — Nomes de pessoas
  • Location — Localizações físicas, entidades geográficas
  • Organization — Empresas, instituições, agências
  • DateTime — Datas, horários, durações
  • Quantity — Números, porcentagens, moedas
  • Event — Eventos históricos ou nomeados
  • Product — Produtos físicos ou digitais
  • Skill — Capacidades ou áreas de expertise
Alternativa via Azure CLI
# Criar um recurso Azure AI Language (nível Free)
az cognitiveservices account create \
--name my-language-resource \
--resource-group myResourceGroup \
--kind TextAnalytics \
--sku F0 \
--location eastus

Conceitos-Chave

ConceitoDefinição
Extração de frases-chaveIdentifica os principais pontos e conceitos importantes no texto
Reconhecimento de entidades nomeadas (NER)Detecta e categoriza entidades nomeadas (pessoas, lugares, organizações, datas) no texto
Categoria de entidadeO tipo de classificação atribuído a uma entidade detectada (Person, Location, etc.)
Vinculação de entidadesConecta entidades reconhecidas a entradas de base de conhecimento conhecidas (ex.: Wikipédia)
Azure AI LanguageO serviço do Azure que fornece capacidades de análise de texto incluindo NER e frases-chave
Detecção de PIIUma capacidade relacionada ao NER que identifica especificamente informações pessoalmente identificáveis

Equívocos Comuns

EquívocoRealidade
Frases-chave e entidades são a mesma coisaFrases-chave capturam conceitos/tópicos importantes; entidades identificam coisas nomeadas específicas com categorias
NER só funciona em inglêsO Azure AI Language suporta NER em muitos idiomas incluindo espanhol, francês, alemão, chinês e mais
Você precisa treinar um modelo para NER básicoNER pré-construído funciona imediatamente; NER personalizado só é necessário para tipos de entidade específicos de domínio
Extração de frases-chave entende significadoUsa padrões estatísticos para identificar frases importantes — não "entende" verdadeiramente o contexto
Reconhecimento de entidades é 100% precisoA precisão depende do contexto, idioma e domínio; texto ambíguo pode produzir categorizações incorretas

Verificação de Conhecimento

1. Uma empresa quer etiquetar automaticamente tickets de suporte ao cliente com os principais tópicos discutidos. Qual capacidade de análise de texto é mais apropriada?

2. Em qual categoria de entidade "Microsoft" seria classificada pelo reconhecimento de entidades nomeadas?

3. Qual é a principal diferença entre extração de frases-chave e reconhecimento de entidades nomeadas?

4. Um escritório de advocacia quer extrair automaticamente todos os nomes de pessoas, datas e valores monetários de contratos. Qual capacidade deve usar?

5. Qual serviço do Azure fornece tanto extração de frases-chave quanto reconhecimento de entidades nomeadas como capacidades pré-construídas?

Saiba Mais