Pular para o conteúdo principal

Desafio 20: Azure OpenAI Service

Tempo Estimado

25-30 min | Custo: Gratuito | Domínio: IA Generativa (15-20%)

Habilidades do exame abordadas

  • Identificar recursos e capacidades do Azure OpenAI Service
  • Descrever modelos do Azure OpenAI (GPT-4, GPT-3.5, DALL-E, Whisper)
  • Identificar endpoints e implantações do Azure OpenAI

Visão geral

O Azure OpenAI Service fornece acesso aos poderosos modelos de linguagem da OpenAI (GPT-4, GPT-4o, GPT-3.5-Turbo), geração de imagens (DALL-E) e transcrição de áudio (Whisper) através da plataforma de nuvem empresarial do Azure. Ele combina as capacidades de IA de ponta da OpenAI com os recursos de segurança, conformidade, rede e IA responsável do Azure.

Diferente de usar a OpenAI diretamente, o Azure OpenAI fornece benefícios empresariais: seus dados permanecem dentro do perímetro de conformidade do Azure, você obtém autenticação via Azure Active Directory (Microsoft Entra ID), conectividade de rede privada, filtragem de conteúdo integrada e disponibilidade regional com garantias de SLA. Isso o torna adequado para cargas de trabalho de produção em indústrias regulamentadas.

Para usar o Azure OpenAI, você primeiro cria um recurso Azure OpenAI, depois implanta modelos específicos dentro dele. Cada implantação recebe seu próprio endpoint que as aplicações chamam. Você pode ter múltiplas implantações (modelos diferentes ou o mesmo modelo com configurações diferentes) dentro de um único recurso. O Azure OpenAI Studio (agora parte do Azure AI Foundry) fornece um playground para testar prompts antes de integrá-los em aplicações.

Explorar

Tarefa 1: Entender os modelos do Azure OpenAI

O Azure OpenAI oferece várias famílias de modelos para diferentes casos de uso:

ModeloCapacidadesMelhor Para
GPT-4oTexto + visão, modelo mais rápido da classe GPT-4Chat de uso geral, multimodal (texto + imagem)
GPT-4Raciocínio avançado, tarefas complexasAnálise complexa, escrita criativa, conteúdo longo
GPT-4 TurboJanela de contexto grande (128K tokens)Processar documentos longos, instruções detalhadas
GPT-3.5-TurboGeração de texto rápida e econômicaChat simples, geração de conteúdo, classificação
DALL-EGeração de imagens a partir de descrições textuaisCriar ilustrações, arte conceitual, mockups de design
WhisperTranscrição de áudio (fala para texto)Transcrição de reuniões, geração de legendas
Modelos de Text EmbeddingConverter texto em representações vetoriaisBusca semântica, similaridade de documentos

Tarefa 2: Explore o Playground do Azure OpenAI Studio

O Playground do Azure OpenAI Studio (acessível em oai.azure.com) permite que você interaja com modelos implantados. Aqui está o que você veria:

Interface do Chat Playground:

┌─────────────────────────────────────────────────────────┐
│ System message: │
│ ┌─────────────────────────────────────────────────────┐ │
│ │ You are a helpful AI assistant that provides │ │
│ │ concise, accurate information. │ │
│ └─────────────────────────────────────────────────────┘ │
│ │
│ Parameters: │ Chat: │
│ Temperature: 0.7 │ User: What is Azure? │
│ Max tokens: 800 │ AI: Azure is Microsoft's │
│ Top-p: 0.95 │ cloud computing │
│ Deployment: gpt-4o │ platform... │
│ │ │
└─────────────────────────────────────────────────────────┘

Componentes principais do playground:

  • System message — Instruções que definem o comportamento e persona da IA
  • Temperature — Controla aleatoriedade (0-2, padrão ~0.7)
  • Max tokens — Comprimento máximo da resposta
  • Top-p — Controle alternativo de aleatoriedade (0-1)
  • Deployment — Qual modelo implantado usar

Tarefa 3: Entender implantações e endpoints

O Azure OpenAI usa um modelo de implantação para gerenciar o acesso:

Azure OpenAI Resource (my-openai-resource)
├── Deployment: "gpt4o-chat" (model: gpt-4o)
├── Deployment: "gpt35-support" (model: gpt-3.5-turbo)
└── Deployment: "dalle3-images" (model: dall-e-3)

Conceitos-chave:

  • Resource — O recurso Azure que contém suas implantações
  • Deployment — Uma instância de modelo específica com seu próprio nome e endpoint
  • Endpoint — A URL que as aplicações chamam para acessar o modelo
  • API key / Microsoft Entra auth — Métodos de autenticação para acessar implantações

Estrutura do endpoint:

https://{resource-name}.openai.azure.com/openai/deployments/{deployment-name}/chat/completions?api-version=2024-02-01

Tarefa 4: Comparar Chat Completions vs. Completions

O Azure OpenAI fornece diferentes padrões de API:

APIFormatoCaso de Uso
Chat CompletionsArray de mensagens (roles: system, user, assistant)IA conversacional, maioria dos casos de uso modernos
Completions (legado)Texto de prompt únicoCompletar texto simples
EmbeddingsTexto de entrada → array vetorialBusca, similaridade, agrupamento
Images (DALL-E)Descrição textual → imagemGeração de imagens
Audio (Whisper)Arquivo de áudio → textoTranscrição

Formato de mensagens do Chat Completions (o padrão mais comum):

{
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "What is Azure?"},
{"role": "assistant", "content": "Azure is Microsoft's cloud..."},
{"role": "user", "content": "Tell me about pricing."}
]
}

Os roles são:

  • system — Define o comportamento/persona da IA (oculto do usuário)
  • user — As mensagens do humano
  • assistant — As respostas anteriores da IA (para contexto multi-turno)
Alternativa via Azure CLI
# Create an Azure OpenAI resource
az cognitiveservices account create \
--name my-openai-resource \
--resource-group myResourceGroup \
--kind OpenAI \
--sku S0 \
--location eastus2

# List available models for deployment
az cognitiveservices account list-models \
--name my-openai-resource \
--resource-group myResourceGroup \
--output table

Conceitos-Chave

ConceitoDefinição
Azure OpenAI ServiceAcesso hospedado no Azure a modelos da OpenAI com segurança e conformidade empresarial
DeploymentUma instância de modelo específica dentro de um recurso Azure OpenAI com seu próprio endpoint
System messageInstruções que definem o comportamento, persona e restrições do assistente de IA
TokenA unidade básica de processamento de texto (~¾ de uma palavra); determina custo e limites de contexto
Chat Completions APIO formato de API baseado em mensagens usando roles system/user/assistant
Filtragem de conteúdoRecurso integrado do Azure OpenAI que bloqueia conteúdo prejudicial em entradas e saídas

Equívocos Comuns

EquívocoRealidade
Azure OpenAI e a API da OpenAI são idênticosAzure OpenAI adiciona recursos empresariais (conformidade, rede, filtros de conteúdo, autenticação Entra ID) não disponíveis na API direta da OpenAI
Você pode usar qualquer modelo imediatamente sem implantaçãoVocê deve implantar um modelo antes de poder usá-lo — implantações criam o endpoint que sua aplicação chama
GPT-4 é sempre melhor que GPT-3.5 para toda tarefaGPT-3.5 é mais rápido e barato; para tarefas simples (classificação, extração) pode ser suficiente e mais econômico
Azure OpenAI armazena e treina com seus dadosPor padrão, Azure OpenAI NÃO usa seus dados para retreinar modelos; seus dados permanecem dentro do seu perímetro de conformidade
DALL-E e GPT usam a mesma arquitetura de modeloDALL-E usa modelos de difusão para geração de imagens; GPT usa modelos transformer para texto — são arquiteturas diferentes

Verificação de Conhecimento

1. O que você deve criar antes que aplicações possam acessar um modelo do Azure OpenAI?

2. Qual modelo do Azure OpenAI você usaria para gerar imagens a partir de descrições textuais?

3. Qual é o propósito da "system message" no Azure OpenAI Chat Completions?

4. Qual é um benefício chave de usar o Azure OpenAI Service em vez da API direta da OpenAI?

5. Qual modelo do Azure OpenAI é mais adequado para transcrever uma reunião gravada em texto?

Saiba Mais