ML Canva¶
Modelo Machine Learning Canva (ML Canva)¶
O Machine Learning Canva (ML Canva) é um framework de planejamento estratégico que serve como um mapa para o desenvolvimento de produtos baseados em Inteligência Artificial. Adotamos esta ferramenta para estruturar o projeto OuvidorIA, garantindo que a proposta de valor para o cidadão e para o governo estivesse diretamente conectada às nossas decisões técnicas sobre dados, modelagem e operação. O canvas se organiza em blocos que cobrem todo o ciclo de vida do projeto, desde a concepção até a manutenção. O template do quadro, em seu formato visual, está disponível abaixo com a descrição dos campos.

ML Canva do projeto¶
Você também pode acessar o Canva do projeto aqui
Proposta de Valor (Value Proposition)¶
Para a População Civil (Usuário Final):
Chatbot:
O usuario, que deseja realizar manifestações na plataforma fala.BR, terá acesso a um chatbot de ouvidoria que funciona como uma interface de comunicação. O sistema irá entender as necessidades e explicar informações relacionadas a procedimentos de ouvidoria, direitos e manifestações, além de auxiliar na construção de manifestações qualificadas em uma linguagem simplificada. Dessa forma, o cidadão estará capacitado para usufruir da plataforma e informado sobre seus direitos e o funcionamento dos serviços de Ouvidoria, sem a necessidade da procura manual nos documentos governamentais ou manuais do Fala.BR.
Fluxo de trabalho do chatbot:
- Usuário → mensagem → chatbot → interpretação → resposta ou redirecionamento.
Qualificação de campos:
O usuário conversa por voz com o chatbot explicando sua situação, e ele fará a atribuição dos campos do formulário com base no que foi dito, com o chatbot perguntando, por exemplo, se "o órgão responsável pela denúncia seria a CGU? Sim ou não?". Então os campos do formulários seriam preenchidos ou não com base nas respostas.
OU, o usuário preenche os campos e, ao descrever o problema/solicitação na descrição, o chatbot sugerir que alguma alteração pode ser bem vinda. Por exemplo, "Para sua solicitação, seria mais adequado o assunto XYZ? Sim ou não?"
Para o Governo (Ouvidoria e Gestores Públicos):
O governo, que deseja melhorar o acesso a informação para a população sobre Ouvidoria e disseminar a utilização da plataforma Fala.BR, terá um sistema integrado com todos os documentos e manuais relevantes sobre Ouvidoria Pública e a plataforma Fala.BR, além de informações cruciais sobre as principais dúvidas e solicitações de informações da população. Para isso, o sistema irá analisar os logs de conversa e identificar os principais questionamentos dos cidadões. Com isso, o governo poderá disponibilizar uma ferramenta com todas as informações sobre Ouvidoria Pública em um único lugar, melhorando o acesso à informação para a população civil, além de conseguir encontrar gargalos e necessidades nas documentações disponibilizadas.
Fluxo de trabalho:
- Interpretação logs de mensagens dos usuários → geração de relatório -> envio de relatorio para Orgão Governamental responsável
Fonte de Dados (Data Sources)¶
Para o desenvolvimento do sistema RAG, a base de conhecimento será construída a partir de duas categorias principais de fontes de dados: as normativas e oficiais e as transacionais.
As fontes normativas e oficiais incluem a legislação fundamental sobre ouvidoria pública, como a Lei nº 13.460/2017 e o Decreto nº 9.492/2018, que estabelecem os direitos dos usuários e as diretrizes do sistema. Complementando a legislação, serão utilizados manuais, FAQ's e cartilhas da Controladoria-Geral da União (CGU) e de outros órgãos, que fornecem detalhes procedimentais e práticos sobre a plataforma fala.BR e os processos de ouvidoria pública.
As fontes transacionais, por sua vez, estão ligadas à forma como os cidadãos interagem com o sistema. Elas serão obtidas a partir dos logs das conversas realizadas diretamente com o chatbot. Adicionalmente, será incorporada a base de dados de pedidos de acesso à informação e respectivas respostas já processadas pela plataforma Fala.BR, disponíveis para consulta pública no site https://buscalai.cgu.gov.br.
Coletando Dados (Data Collection)¶
Conjunto inicial de dados
-
Utilização dos documentos e decretos governamentais em formato pdf Webscrapping das páginas de manuais da plataforma Fala.BR e outros sites associados.
-
Data Augmentation: uso de NLG (Natural Language Generation) com BERT para criação de possíveis perguntas que os usuários podem fazer na plataforma.
- Utilização dos FAQ's de Ouvidoria e exemplos manuais para os casos base.
-
Manifestações de acesso a informação
-
Custos associados: A princípio somente a mão de obra para criação dos scrapers e dos exemplos manuais de perguntas
Coletas a longo prazo (contínuo)
-
Logs de conversas do chatbot para coleta de perguntas dos usuários e feedbacks dos usuários com as respostas a partir de pesquisa de satisfação no próprio chatbot
- Quantidade de feedbacks e logs dependente da aderência dos usuários a plataforma.
- Restrição: Garantir privacidade dos usuários e anonimização dos dados coletados no chatbot.
-
Atualizações dos manuais da plataforma fala.BR, obtidos por meio de scrapes atualização semanal no modelo
Funcionalidades (Features)¶
Consulta solicitada pelo usuário (texto):
-
Extração de palavras-chave: Entidades Nomeadas
-
Intenção do usuário: objetivo na consulta
Histórico de conversa:
-
Tópico da Conversa Anterior: O que foi discutido nas mensagens anteriores
-
Estado da Conversa: Em que ponto do fluxo a conversa está (inicio_conversa, solicitando_criacao_manifestacao, informação_fornecida...)
-
Tempo entre mensagens: Identificar se permanece no mesmo contexto, se é algo totalmente diferente...
Construindo Modelos (Building Models)¶
Modelo principal de Processamento de Linguagem Natural (NLP). Treinamento com dados de perguntas e respostas reais da Ouvidoria. Atualizações periódicas (mensal ou trimestral) conforme surgem novas dúvidas.
Decisões (Decisions)¶
As previsões (intenção do usuário) são transformadas em respostas automáticas via WhatsApp. O chatbot decide qual resposta enviar ou se precisa encaminhar o usuário a um atendente humano. O modelo de NLP (ex: BERT ou modelo fine-tuned) é responsável pela classificação da intenção e seleção da resposta correspondente.
-
Geração de Resposta Contextualizada: O modelo de NLP, operando em uma arquitetura RAG (Retrieval-Augmented Generation), não apenas classifica uma intenção, mas busca informações na base de conhecimento e gera uma resposta contextualizada.
-
Parâmetro-Chave: Limiar de Confiança (Confidence Score): Cada resposta gerada é acompanhada de um score de confiança. Este score mede a relevância dos documentos encontrados na base de conhecimento e a consistência da resposta gerada.
-
Árvore de Decisão Automática:
-
Se o Score de Confiança for alto (<=0.85): O sistema entrega a resposta automatizada ao usuário.
-
Se o Score de Confiança for baixo (>0.85) ou se nenhum documento relevante for encontrado: O sistema ativa o protocolo de fallback, pedindo mais informações e, se após a resposta ainda não tiver resultado conclusivo, abortar.
-
Predições de Tarefas (Prediction Task)¶
Tipo de tarefa: Classificação de intenção e recuperação de resposta.
Entidade: Usuário do WhatsApp que faz perguntas sobre a Ouvidoria.
Resultados possíveis: Identificar o tipo de dúvida (ex: “como registrar reclamação”, “acompanhar protocolo”, “função da Ouvidoria”, “tempo de resposta”, etc.) e responder com a informação correta.
Tempo de espera antes da observação: Resposta imediata (em tempo real).
Fazendo Predições (Making Predictions)¶
Previsões feitas em tempo real (mensagens instantâneas).
Criação de embeddings e classificação rápida para cada mensagem.
Tempo disponível: milissegundos, para manter fluidez na conversa.
Processamento realizado no servidor ou em cloud (ex: AWS/Lambda, GCP Functions).
Simulação de impacto (Impact Simulation)¶
O modelo pode ser implantado em produção via API conectada a uma interface web de chatbot. Avaliar desempenho com métricas de acurácia da intenção e satisfação do usuário.
Medir impacto: redução de atendimentos manuais, tempo médio de resposta e nível de automação alcançado.
Garantir imparcialidade e evitar respostas inadequadas (ex: enviesadas politicamente).
Monitoramento (Monitoring)¶
Métricas: taxa de acerto das intenções, tempo médio de resposta, taxa de fallback (respostas genéricas), e satisfação do usuário.
Monitorar também feedbacks e logs de erros.
Avaliar impacto no negócio: redução de custo de atendimento e aumento da disponibilidade de informações públicas.