Camada Semântica para Agentes de IA: o fim da semântica apenas para humanos

Durante anos, a camada semântica resolveu um problema: permitir que o analista de negócios pudesse conversar com o banco de dados. Hoje, quando os agentes de IA são os consumidores, as regras do jogo mudam completamente.

Há um conceito que está há décadas no centro de qualquer arquitetura séria de Business Intelligence: a camada semântica.

Essa camada de abstração que traduz colunas, joins e lógica de negócio em termos que um analista ou um executivo pode entender sem precisar conhecer SQL. “Receita líquida”, “clientes ativos”, “taxa de churn ajustada”. Um vocabulário empresarial mapeado sobre a realidade técnica dos bancos de dados.

Durante anos, o desafio foi permitir que os usuários consumissem dados de forma autônoma. Ferramentas como Looker, AtScale, dbt Semantic Layer ou o modelo tabular do Analysis Services responderam exatamente a essa necessidade.

Mas o paradigma mudou. Os agentes de IA, sistemas que raciocinam, planejam e executam, estão se tornando consumidores de dados por conta própria. E o que eles precisam de uma camada semântica é radicalmente diferente do que os humanos precisavam.

Uma camada semântica projetada para dashboards é como um cardápio pensado para ser lido com calma no restaurante. Os agentes de IA não leem o cardápio: eles perguntam diretamente ao chef o que está disponível, o que combina com o quê e o que não podem pedir.

O que faz uma camada semântica convencional

A camada semântica convencional surgiu para resolver um problema de mediação: criar uma interface amigável entre o modelo de dados físico e o usuário de negócios. Suas responsabilidades clássicas são claras:

  • Abstração da complexidade: oculta joins, transformações e lógica técnica por trás de dimensões e métricas com nomenclaturas de negócio;

  • Governança de métricas: define uma única fonte de verdade para KPIs como “receita” ou “CAC”, garantindo que todos falem a mesma linguagem;

  • Controle de acesso: aplica Row-Level Security e permissões para que cada usuário visualize apenas o que lhe corresponde;

  • Performance otimizada: gerencia caches, agregações e pré-processamentos para acelerar a exploração dos dados.

Ferramentas como Looker e seu LookML, o modelo semântico do Power BI ou a camada do dbt Semantic Layer fazem isso de forma brilhante. O analista chega, visualiza uma lista de dimensões e métricas compreensíveis, constrói sua exploração e gera seu dashboard. Fim do ciclo.

O problema é que esse ciclo foi projetado tendo o ser humano como unidade de consumo. E isso traz implicações profundas na forma como a camada semântica é estruturada, exposta e mantida.

O que muda quando o consumidor é um agente de IA

Um agente de IA não navega por dashboards. Não clica em filtros. Não interpreta cores em um gráfico de barras. O que ele faz é raciocinar sobre o que precisa saber, formular uma consulta, executá-la, interpretar o resultado e decidir se precisa de mais informações ou se já pode agir.

Isso rompe as premissas fundamentais sobre as quais a camada semântica convencional foi construída:

O CONSUMIDOR É NÃO DETERMINÍSTICO

Um ser humano segue fluxos previsíveis: entra no módulo de vendas, filtra por região, faz o download. Um agente pode formular mil variações da mesma pergunta de acordo com seu contexto de raciocínio. A camada semântica precisa ser robusta diante da ambiguidade e retornar resultados consistentes para perguntas semanticamente equivalentes, mas sintaticamente diferentes.

A INTROSPECÇÃO É UM REQUISITO DE PRIMEIRA CLASSE

Um ser humano aprende o vocabulário da camada semântica ao longo do tempo. Um agente precisa descobri-lo em tempo de execução. Ele deve ser capaz de perguntar: “quais métricas existem?”, “quais dimensões posso cruzar com receita?”, “o que exatamente significa ‘clientes ativos’?”. A camada semântica precisa ser autodescritiva de forma programática.

O VOLUME E A CADÊNCIA DAS CONSULTAS SÃO DIFERENTES

Um analista executa 30 consultas em uma sessão de trabalho. Um agente pode executar 300 em um minuto como parte de seu ciclo de raciocínio. A camada semântica para agentes deve suportar padrões de acesso de alta frequência, idealmente com APIs otimizadas para processamento em lote (batch) e streaming.

A RASTREABILIDADE PRECISA SER BIDIRECIONAL

Quando uma pessoa vê um número incorreto, ela o reporta. Quando um agente produz uma ação incorreta com base em dados errados, pode haver um impacto operacional antes que alguém perceba. A camada semântica precisa oferecer um lineage completo, que permita auditar cada decisão do agente até sua fonte de dados.

CASO REAL

O Looker e sua integração com o Gemini são um exemplo emergente dessa transição. A camada semântica do Looker (Looker Semantic Layer), exposta como ferramenta para um agente Gemini, permite que o agente formule perguntas em linguagem natural, obtenha SQL semanticamente correto e contextualizado, e opere sobre os resultados com a governança preservada. Mas isso exige que o modelo LookML seja projetado tendo essa legibilidade para máquinas em mente, e não apenas para seres humanos.

Comparativo: semântica convencional vs. semântica para agentes

A tabela a seguir resume as principais diferenças entre as duas abordagens em doze dimensões críticas:

 

Dimensão

Camada Semântica Convencional

Camada Semântica para Agentes de IA

CONSUMIDOR PRINCIPAL

Analista, executivo ou cientista de dados humano

Agente LLM, pipeline automatizado ou chatbot corporativo

 

 

 

 

INTERFACE DE ACESSO

Interface visual (Explore, dashboards, filtros) + SQL direto

API programática, ferramentas MCP e integração de funções (function calling) para o agente

 

 

 

 

 

DESCOBERTA DO ESQUEMA

Manual: o usuário aprende explorando a interface

Automática: a camada expõe metadados legíveis por máquinas (JSON Schema, OpenAPI)

 

 

 

 

 

 

TOLERÂNCIA À AMBIGUIDADE

Baixa: o usuário navega por opções explícitas

Alta: deve resolver ambiguidades semânticas e retornar o resultado mais provável

 

 

 

 

VOLUME DE CONSULTAS

Dezenas por sessão, com comportamento previsível

Centenas ou milhares por ciclo de raciocínio, com padrões não previsíveis

 

 

 

 

 

GOVERNANÇA / RLS

Por usuário autenticado, gerenciada pela ferramenta de BI

Por identidade do agente + contexto de execução + cadeia de delegação

 

 

 

 

 

 

RASTREABILIDADE

Lineage técnico (coluna ⇒ métrica)

Lineage completo: fonte ⇒ semântica ⇒ consulta ⇒ raciocínio ⇒ ação

 

 

 

 

DESCRIÇÃO DE MÉTRICAS

Rótulos e descrições para humanos na interface

Descrições estruturadas para LLMs: propósito, restrições, contexto e exemplos

 

 

 

 

 

TRATAMENTO DE ERROS

Mensagem de erro para o usuário, que reformula a consulta

Erro estruturado que o agente interpreta e utiliza para autocorrigir sua consulta

 

 

 

 

 

LATÊNCIA ACEITÁVEL

2 a 10 segundos para exploração interativa

Subsegundo para consultas em contexto de raciocínio agêntico (agentic reasoning)

 

 

 

 

 

CACHE

Baseado em consultas frequentes dos usuários

Baseado em padrões de raciocínio do agente, com invalidação semântica

 

 

 

 

EXEMPLO DE FERRAMENTA

Looker Explore, Power BI Desktop, Tableau

Looker MCP Server, dbt Semantic Layer API, Cube API

 

As cinco capacidades que uma camada semântica deve adicionar para agentes

Não se trata de substituir a camada semântica existente, mas de ampliá-la com capacidades que os agentes de IA exigem e que os seres humanos nunca precisaram explicitamente.

1. API DE INTROSPECÇÃO SEMÂNTICA

O agente precisa ser capaz de perguntar: “o que posso consultar aqui?”. A camada deve expor um endpoint que liste métricas, dimensões, relacionamentos e restrições em um formato estruturado (JSON-LD, OpenAPI ou similar), incluindo descrições em linguagem natural projetadas para serem consumidas por um LLM, e não por um ser humano.

2. DESCRIÇÕES SEMÂNTICAS ORIENTADAS A LLMS

O campo description de uma métrica no LookML foi pensado para aparecer como tooltip na interface. Para um agente, esse mesmo campo é o principal vetor de compreensão. As descrições devem incluir: propósito de negócio, restrições de uso, exemplos de perguntas válidas e inválidas e relacionamentos com outras métricas.

3. RESOLUÇÃO DE AMBIGUIDADE COM RETROALIMENTAÇÃO ESTRUTURADA

Quando um agente formula uma consulta ambígua, por exemplo, solicita “vendas do mês” sem especificar se é por data do pedido, data da fatura ou data do pagamento, a camada não deve simplesmente escolher uma opção ou retornar um erro. Ela deve fornecer uma resposta estruturada que o agente possa utilizar para resolver a ambiguidade de forma autônoma ou escalá-la para o usuário humano.

4. RASTREABILIDADE DE DECISÕES AGÊNTICAS

Cada consulta executada por um agente deve registrar: o agente que a executou, o raciocínio que levou à sua formulação, o resultado obtido e como esse resultado foi utilizado na cadeia de decisões. Isso é fundamental para auditoria em contextos regulados, como finanças ou saúde.

5. GESTÃO DE IDENTIDADE DELEGADA

Um agente atua em nome de um usuário humano. A camada semântica para agentes deve compreender o conceito de identidade delegada: o agente possui suas próprias permissões, mas também herda restrições do usuário humano em cujo contexto opera. Isso se aplica especialmente ao Row-Level Security e à governança de dados sensíveis.

O papel do Looker neste novo paradigma

O Looker é possivelmente a plataforma mais bem posicionada para essa transição, e isso não é por acaso. Sua arquitetura baseada em LookML, um modelo semântico centralizado, versionado e orientado a métricas, possui exatamente as características que uma camada semântica para agentes exige:

  • Modelo centralizado e versionado: não há ambiguidade sobre o significado de uma métrica. Existe uma única definição, em código, auditável;

  • API-first: a API 4.0 do Looker permite consultar o modelo semântico de forma programática, sem necessidade da interface de usuário (UI);

  • Exposição como ferramenta MCP: a camada semântica do Looker (Looker Semantic Layer) pode ser exposta como um servidor MCP, permitindo que agentes baseados em Claude, Gemini ou GPT consultem dados com a governança preservada;

  • Integração nativa com Gemini no Google Cloud: o roadmap do Looker inclui integração direta com o Gemini, permitindo que os agentes raciocinem sobre os dados do modelo sem a necessidade de intermediários adicionais.

PERSPECTIVA CoE (Center of Excellence)

Na NowVertical, estamos observando uma demanda crescente por arquiteturas em que o mesmo modelo LookML que alimenta os dashboards de um cliente também é utilizado pelos seus agentes de IA para análise e tomada de decisão automatizadas. A chave está em investir na qualidade semântica do modelo: descrições ricas, métricas bem definidas e RLS corretamente implementado. Os clientes que possuem dívida técnica em sua camada semântica enfrentarão um custo de remediação maior à medida que incorporarem agentes de IA.

Conclusão: a camada semântica como contrato entre o negócio e os agentes

A camada semântica convencional era um contrato entre o negócio e seus analistas humanos. Ela definia um vocabulário compartilhado para que pessoas com diferentes níveis de conhecimento técnico pudessem operar sobre os mesmos dados com a mesma compreensão.

A camada semântica para agentes de IA é esse mesmo contrato, ampliado para um novo tipo de consumidor. Um consumidor que não aprende de forma incremental, que necessita de introspecção programática, que opera em velocidades não humanas e cujas ações têm consequências reais nos sistemas de negócio.

A boa notícia é que ela não precisa ser construída do zero. Parte-se do que já existe: um bom modelo LookML, uma camada dbt Semantic bem definida e um modelo tabular sólido. A partir dessa base, acrescentam-se as capacidades de que os agentes precisam: APIs de introspecção, descrições orientadas a LLMs, rastreabilidade bidirecional e gestão de identidade delegada.

As organizações que compreenderem isso terão uma vantagem significativa: sua camada semântica não será apenas a base de seus dashboards, mas também a interface de confiança por meio da qual seus agentes de IA operarão sobre o negócio.

“A dívida técnica na camada semântica sempre foi custosa. Na era dos agentes de IA, ela se torna urgente.”

Ativo 27mini bio rodrigo piccini

fale conosco blog

 

Deixe um comentário

    Assine nossa newsletter

    Conheça o BI DevOps
    Leia mais!
    Google Tecnologias - Saiba mais!