PACOTE DE SERVIÇOS

Processamento
Inteligente de
Documentos

AUTOR

Lucas Lascasas

DATA

14 de Maio de 2026

INTRODUÇÃO

O que é IDP?

O processamento inteligente de documentos (IDP, do inglês intelligent document processing) é uma solução de IA focada em processar um documento para que uma IA possa extrair informações dele. Essa arquitetura se aproxima bem de um RAG (retrieval-augmented generation) em princípio, a diferença está na extração específica de certas informações, gerando relatórios, resumos ou classificação de documentos.

CONTEXTO

Quando fazer IDP?

A arquitetura de IDP é muito útil quando existem documentos a serem avaliados ou processados em larga escala, tomando muito tempo de equipes humanas para um processo repetitivo. Alguns casos de uso contemplam a análise de editais, revisão de contratos, conferência de notas fiscais, resumo de documentações, extração de conteúdo de contratos, entre outros.

SOLUÇÃO

Arquitetura de IDP

A figura abaixo apresenta a arquitetura de IDP na AWS:

Arquitetura de IDP na AWS

Nesse diagrama, o API Gateway fornece uma porta de entrada no sistema para comunicação por endpoints REST. Existem 2 caminhos de upload: um para documentos com texto selecionável (PDF, doc, txt, etc.) e outro para upload de documentos com texto em imagens (fotos, scan, etc.). Os documentos com conteúdo em imagens são passados para o Textract para a extração de texto via OCR (optical character recognition), gerando assim um documento passível de indexação por IA.

Todos os documentos já prontos para consumo da IA são armazenados em um bucket S3 e são vetorizados pelo Bedrock, tendo o seu conteúdo armazenado no S3 Vectors. Um prompt estruturado para extração específica de dados é executado no Bedrock para gerar a informação estruturada do relatório, enquanto uma LLM de RAG é conectada à base. Assim, a API fornece opções de query via token ou relatório pré-estruturado. O sistema é orquestrado no Step Functions com apoio de funções Lambda.

REQUISITOS

O que preciso ter para começar um projeto de IDP?

Para começar a desenvolver o seu sistema de IDP na Lascasas Consulting é simples! Separe:

  • Documentos com texto selecionável;
  • Documentos com texto em imagens (fotos ou scan);
  • Acesso à conta AWS para implantação da arquitetura;
  • Repositório Git para a arquitetura;
  • Definição de regras de negócio do relatório:
    • Quais informações são relevantes para extração?
    • Será necessário um resumo?
    • Que outro tipo de processamento é previsto?

MODUS OPERANDI

Como é o projeto de IDP?

Nesse projeto, iniciamos provisionando a arquitetura no ambiente AWS e validando o seu funcionamento. Após assegurar o funcionamento da infraestrutura, preparamos o prompt de relatórios e testamos o RAG com buscas específicas de informações.

PRÓXIMOS PASSOS

Como iniciar meu projeto?

Leia mais sobre um estudo de caso de IA aplicada para IDP:

Escolha um pacote apropriado para a sua demanda de IDP: