Telemetria
ADK-Rust oferece observabilidade de nível de produção através da crate adk-telemetry, que integra log estruturado e rastreamento distribuído usando o ecossistema tracing e OpenTelemetry.
Visão Geral
O sistema de telemetria permite:
- Log Estruturado: Logs ricos e consultáveis com informações contextuais
- Rastreamento Distribuído: Rastreie requisições através de hierarquias de Agent e limites de serviço
- Integração OpenTelemetry: Exporte traces para backends de observabilidade (Jaeger, Datadog, Honeycomb, etc.)
- Propagação Automática de Contexto: IDs de Session, usuário e invocação fluem por todas as operações
- Spans Pré-configurados: Funções auxiliares para operações ADK comuns
Início Rápido
Log Básico no Console
Para desenvolvimento e implantações simples, inicialize o log do console:
use adk_telemetry::init_telemetry;
#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
// Inicializa a telemetria com o nome do seu serviço
init_telemetry("my-agent-service")?;
// Seu código de Agent aqui
Ok(())
}
Isso configura o log estruturado para stdout com padrões razoáveis.
Exportação OpenTelemetry
Para implantações em produção com rastreamento distribuído:
use adk_telemetry::init_with_otlp;
#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
// Inicializa com o exportador OTLP
init_with_otlp("my-agent-service", "http://localhost:4317")?;
// Seu código de Agent aqui
// Descarrega os traces antes de sair
adk_telemetry::shutdown_telemetry();
Ok(())
}
Isso exporta traces e métricas para um endpoint de coletor OpenTelemetry.
Níveis de Log
Controle a verbosidade do log usando a variável de ambiente RUST_LOG:
| Nível | Descrição | Caso de Uso |
|---|---|---|
error | Apenas erros | Produção (mínimo) |
warn | Avisos e erros | Produção (padrão) |
info | Mensagens informativas | Desenvolvimento, staging |
debug | Informações detalhadas de depuração | Desenvolvimento local |
trace | Rastreamento muito verboso | Depuração profunda |
Configurando Níveis de Log
# Define o nível de log global
export RUST_LOG=info
# Define níveis de log por módulo
export RUST_LOG=adk_agent=debug,adk_model=info
# Combina níveis globais e específicos de módulo
export RUST_LOG=warn,adk_agent=debug
O sistema de telemetria usa o nível info por padrão se RUST_LOG não for definido.
Macros de Log
Use as macros tracing padrão para log:
use adk_telemetry::{trace, debug, info, warn, error};
// Log informativo
info!("Agent iniciado com sucesso");
// Log estruturado com campos
info!(
agent.name = "my_agent",
session.id = "sess-123",
"Processando requisição de usuário"
);
// Log de depuração
debug!(user_input = ?input, "Entrada recebida");
// Log de aviso e erro
warn!("Limite de taxa se aproximando");
error!(error = ?err, "Falha ao chamar o model");
Campos Estruturados
Adicione campos contextuais às mensagens de log para melhor filtragem e análise:
use adk_telemetry::info;
info!(
agent.name = "customer_support",
user.id = "user-456",
session.id = "sess-789",
invocation.id = "inv-abc",
"Execução do Agent iniciada"
);
Esses campos se tornam consultáveis no seu backend de observabilidade.
Instrumentação
Instrumentação Automática
Use o atributo #[instrument] para criar spans automaticamente para funções:
use adk_telemetry::{instrument, info};
#[instrument]
async fn process_request(user_id: &str, message: &str) {
info!("Processing request");
// Function logic here
}
// Cria um span chamado "process_request" com user_id e message como campos
Pular Parâmetros Sensíveis
Exclua dados sensíveis dos rastreamentos:
use adk_telemetry::instrument;
#[instrument(skip(api_key))]
async fn call_external_api(api_key: &str, query: &str) {
// api_key não aparecerá nos rastreamentos
}
Nomes de Span Personalizados
use adk_telemetry::instrument;
#[instrument(name = "external_api_call")]
async fn fetch_data(url: &str) {
// O Span será nomeado "external_api_call" em vez de "fetch_data"
}
Spans Pré-configurados
ADK-Telemetry oferece funções auxiliares para operações comuns:
Span de Execução de Agente
use adk_telemetry::agent_run_span;
let span = agent_run_span("my_agent", "inv-123");
let _enter = span.enter();
// Código de execução do Agente aqui
// Todos os logs dentro deste escopo herdam o contexto do span
Span de Chamada de Modelo
use adk_telemetry::model_call_span;
let span = model_call_span("gemini-2.0-flash");
let _enter = span.enter();
// Chamada de API do Modelo aqui
Span de Execução de Tool
use adk_telemetry::tool_execute_span;
let span = tool_execute_span("weather_tool");
let _enter = span.enter();
// Código de execução da Tool aqui
Span de Callback
use adk_telemetry::callback_span;
let span = callback_span("before_model");
let _enter = span.enter();
// Lógica de callback aqui
Adicionando Atributos de Contexto
Adicione contexto de usuário e sessão ao span atual:
use adk_telemetry::add_context_attributes;
add_context_attributes("user-456", "sess-789");
Criação Manual de Span
Para instrumentação personalizada, crie spans manualmente:
use adk_telemetry::{info, Span};
let span = tracing::info_span!(
"custom_operation",
operation.type = "data_processing",
operation.id = "op-123"
);
let _enter = span.enter();
info!("Performing custom operation");
// Código da operação aqui
Atributos de Span
Adicione atributos dinamicamente:
use adk_telemetry::Span;
let span = Span::current();
span.record("result.count", 42);
span.record("result.status", "success");
Configuração do OpenTelemetry
Endpoint OTLP
O exportador OTLP envia rastreamentos para um endpoint de coletor:
use adk_telemetry::init_with_otlp;
// Jaeger Local (porta OTLP padrão)
init_with_otlp("my-service", "http://localhost:4317")?;
// Endpoint de provedor de nuvem
init_with_otlp("my-service", "https://otlp.example.com:4317")?;
Executando um Coletor Local
Para desenvolvimento, execute o Jaeger com suporte OTLP:
docker run -d --name jaeger \
-p 4317:4317 \
-p 16686:16686 \
jaegertracing/all-in-one:latest
# Visualize rastreamentos em http://localhost:16686
Visualização de Rastreamentos
Uma vez configurado, os rastreamentos aparecem no seu backend de observabilidade mostrando:
- Hierarquia de execução do Agente
- Latências de chamadas de Modelo
- Tempo de execução de Tool
- Propagação de erros
- Fluxo de contexto (ID do usuário, ID da sessão, etc.)
Integração com ADK
Os componentes do adk-rust emitem telemetria automaticamente quando o sistema de telemetria é inicializado:
use adk_rust::prelude::*;
use adk_telemetry::init_telemetry;
use std::sync::Arc;
#[tokio::main]
async fn main() -> std::result::Result<(), Box<dyn std::error::Error>> {
// Initialize telemetry first
init_telemetry("my-agent-app")?;
let api_key = std::env::var("GOOGLE_API_KEY")?;
let model = Arc::new(GeminiModel::new(&api_key, "gemini-2.5-flash")?);
let agent = LlmAgentBuilder::new("support_agent")
.model(model)
.instruction("You are a helpful support agent.")
.build()?;
// Use Launcher for simple execution
Launcher::new(Arc::new(agent)).run().await?;
Ok(())
}
As operações de Agent, Model e Tool emitirão automaticamente logs e traces estruturados.
Telemetria Personalizada em Tools
Adicione telemetria a Tools personalizadas:
use adk_rust::prelude::*;
use adk_telemetry::{info, instrument, tool_execute_span};
use serde_json::{json, Value};
#[instrument(skip(ctx))]
async fn weather_tool_impl(
ctx: Arc<dyn ToolContext>,
args: Value,
) -> Result<Value> {
let span = tool_execute_span("weather_tool");
let _enter = span.enter();
let location = args["location"].as_str().unwrap_or("unknown");
info!(location = location, "Fetching weather data");
// Tool logic here
let result = json!({
"temperature": 72,
"condition": "sunny"
});
info!(location = location, "Weather data retrieved");
Ok(result)
}
let weather_tool = FunctionTool::new(
"get_weather",
"Get current weather for a location",
json!({
"type": "object",
"properties": {
"location": {"type": "string"}
},
"required": ["location"]
}),
weather_tool_impl,
);
Telemetria Personalizada em Callbacks
Adicione observabilidade a Callbacks:
use adk_rust::prelude::*;
use adk_telemetry::{info, callback_span};
use std::sync::Arc;
let agent = LlmAgentBuilder::new("observed_agent")
.model(model)
.before_callback(Box::new(|ctx| {
Box::pin(async move {
let span = callback_span("before_agent");
let _enter = span.enter();
info!(
agent.name = ctx.agent_name(),
user.id = ctx.user_id(),
session.id = ctx.session_id(),
"Agent execution starting"
);
Ok(None)
})
}))
.after_callback(Box::new(|ctx| {
Box::pin(async move {
let span = callback_span("after_agent");
let _enter = span.enter();
info!(
agent.name = ctx.agent_name(),
"Agent execution completed"
);
Ok(None)
})
}))
.build()?;
Considerações de Desempenho
Amostragem
Para sistemas de alta vazão, considere a amostragem de traces:
// Nota: A configuração de amostragem depende da sua configuração OpenTelemetry
// Configure a amostragem no seu coletor OTLP ou backend
Spans Assíncronos
Sempre use #[instrument] em funções async para garantir o contexto de span adequado:
use adk_telemetry::instrument;
// ✅ Correto - contexto de span preservado em pontos de await
#[instrument]
async fn async_operation() {
tokio::time::sleep(Duration::from_secs(1)).await;
}
// ❌ Incorreto - span manual pode perder o contexto
async fn manual_span_operation() {
let span = tracing::info_span!("operation");
let _enter = span.enter();
tokio::time::sleep(Duration::from_secs(1)).await;
// O contexto pode ser perdido após o await
}
Nível de Log em Produção
Use o nível info ou warn em produção para reduzir o overhead:
export RUST_LOG=warn,my_app=info
Solução de Problemas
Nenhum Log Aparecendo
- Verifique se a variável de ambiente
RUST_LOGestá definida - Garanta que
init_telemetry()seja chamado antes de qualquer log - Verifique se a telemetria é inicializada apenas uma vez (usa
Onceinternamente)
Traces Não Exportados
- Verifique se o endpoint OTLP está acessível
- Verifique se o collector está em execução e aceitando conexões
- Chame
shutdown_telemetry()antes da saída da aplicação para descarregar os spans pendentes - Verifique problemas de rede/firewall
Contexto Ausente nos Spans
- Use
#[instrument]em funções async - Garanta que os spans sejam inseridos com
let _enter = span.enter() - Mantenha o guarda
_enterno escopo pela duração da operação
Melhores Práticas
- Inicialize Cedo: Chame
init_telemetry()no início demain() - Use Campos Estruturados: Adicione contexto com pares chave-valor, não interpolação de string
- Instrumente Funções Async: Sempre use
#[instrument]em funções async - Descarregue na Saída: Chame
shutdown_telemetry()antes do encerramento da aplicação - Níveis de Log Apropriados: Use
infopara eventos importantes,debugpara detalhes - Evite Dados Sensíveis: Pule parâmetros sensíveis com
#[instrument(skip(...))] - Nomenclatura Consistente: Use nomes de campo consistentes (ex:
user.id,session.id)
Relacionado
- Callbacks - Adicione telemetria a callbacks
- Tools - Instrumente ferramentas personalizadas
- Deployment - Configuração de telemetria em produção
Anterior: ← Events | Próximo: Launcher →