Pular para conteúdo

Requisitos de Machine Learning

1. Introdução

Esta seção define os Requisitos de Machine Learning (RML) do projeto AlugAI, especificando o comportamento esperado dos modelos de IA utilizados para predizer valores de aluguel de imóveis residenciais.

Os requisitos a seguir foram elaborados considerando aspectos técnicos, éticos e operacionais do ciclo de vida de aprendizado de máquina — desde a coleta de dados até a avaliação contínua do modelo em produção.


2. Requisitos de Dados (RML-D)

Código Requisito Descrição
RML-D01 Fontes de Dados Confiáveis Os dados de treinamento devem ser coletados exclusivamente de fontes públicas ou autorizadas, como Kaggle (Zap Imóveis), IBGE e APIs de geolocalização.
RML-D02 Qualidade dos Dados O conjunto de dados deve passar por etapas de limpeza, padronização e tratamento de outliers, assegurando a consistência e validade das informações.
RML-D03 Balanceamento de Atributos O modelo deve evitar viés regional — garantindo que bairros ou cidades com menos amostras não prejudiquem as previsões.
RML-D04 Atualização Periódica O dataset deve ser atualizado pelo menos uma vez por trimestre, refletindo variações do mercado imobiliário.
RML-D05 Anonimização Nenhum dado sensível de indivíduos (como CPF, nome ou endereço exato) deve ser armazenado, em conformidade com a LGPD.

Fonte: Gabriel Lima


3. Requisitos de Modelagem (RML-M)

Código Requisito Descrição
RML-M01 Tipo de Aprendizado O modelo deve seguir o paradigma de Aprendizado Supervisionado, com foco em Regressão para estimativa numérica de valores de aluguel.
RML-M02 Modelos Testados Devem ser avaliados pelo menos três algoritmos distintos: Regressão Linear, Random Forest e XGBoost.
RML-M03 Feature Engineering O processo de treinamento deve incluir a criação e normalização de features derivadas (ex: preço por m², densidade demográfica, distância ao centro).
RML-M04 Hiperparâmetros Otimizados A escolha de parâmetros deve ser automatizada via Grid Search ou Random Search, com validação cruzada (k-fold ≥ 5).
RML-M05 Explicabilidade do Modelo O sistema deve gerar explicações locais das previsões, indicando quais variáveis mais impactaram o valor estimado (ex: SHAP values ou Feature Importance).
RML-M06 Versionamento de Modelos Cada versão treinada do modelo deve ser registrada com data, hiperparâmetros e métricas de desempenho.
RML-M07 Reprodutibilidade O treinamento deve ser totalmente reproduzível a partir de scripts e seeds fixas, garantindo consistência dos resultados.

Fonte: Gabriel Lima


4. Requisitos de Avaliação e Métricas (RML-A)

Código Requisito Descrição
RML-A01 Métricas de Avaliação O modelo deve ser avaliado usando MAE (Mean Absolute Error), RMSE (Root Mean Squared Error) e R² (Coeficiente de Determinação).
RML-A02 Meta de Precisão O erro médio absoluto (MAE) deve ser inferior a 10% do valor real do aluguel em dados de teste.
RML-A03 Validação Cruzada O desempenho deve ser validado por cross-validation para reduzir overfitting e garantir robustez.
RML-A04 Comparação entre Modelos O modelo final selecionado deve apresentar o menor erro médio e maior estabilidade entre múltiplos datasets de teste.
RML-A05 Monitoramento Contínuo Após a implantação, as métricas de desempenho devem ser monitoradas periodicamente para detectar degradação do modelo (drift).
RML-A06 Feedback de Usuário As avaliações dos usuários (“correto”, “alto”, “baixo”) devem alimentar um módulo de reajuste supervisionado do modelo ao longo do tempo.

Fonte: Gabriel Lima


5. Requisitos Éticos e de Conformidade (RML-E)

Código Requisito Descrição
RML-E01 Transparência Algorítmica O sistema deve permitir ao usuário visualizar um resumo explicativo sobre como a IA chegou ao valor estimado.
RML-E02 Imparcialidade O modelo não deve favorecer ou penalizar regiões específicas; qualquer viés identificado deve ser corrigido.
RML-E03 Auditabilidade Todas as etapas de treinamento, avaliação e atualização do modelo devem ser registradas para auditoria.
RML-E04 Conformidade Legal O uso dos dados deve seguir rigorosamente as normas da LGPD e das políticas de privacidade vigentes.
RML-E05 Uso Responsável da IA O sistema deve apresentar avisos claros de que o valor fornecido é uma estimativa, não uma avaliação oficial.

Fonte: Gabriel Lima


6. Considerações Finais

Os Requisitos de Machine Learning aqui descritos garantem que o AlugAI opere de forma precisa, ética e escalável, assegurando:

  • Confiabilidade técnica, com modelos testados e reproduzíveis;
  • Transparência, com explicações compreensíveis sobre o raciocínio da IA;
  • Evolução contínua, com atualização periódica de dados e métricas;
  • Conformidade ética e legal, conforme a LGPD e boas práticas de IA responsável.

Esses requisitos complementam os requisitos funcionais e não funcionais do sistema, compondo o núcleo inteligente do projeto.


Histórico de versões

Versão Data Descrição Autor Revisor
1.0 07/10/2025 Criação da página Gabriel Lima Mateus, Elias