Lembre -se de aprendizado de máquina é uma medida crítica que desempenha um papel vital na avaliação de modelos de classificação. Compreender o quão bem um modelo pode identificar casos positivos verdadeiros é essencial, especialmente em áreas como assistência médica, finanças e detecção de fraude, onde falta instâncias positivas podem ter consequências significativas.
O que é recall no aprendizado de máquina?
O recall é uma métrica de desempenho usada para avaliar a eficácia de um modelo na identificação de instâncias positivas reais dentro de um conjunto de dados. É particularmente importante quando o objetivo é minimizar falsos negativos, que ocorrem quando um modelo não reconhece um caso positivo.
Principais indicadores de desempenho
- Matriz de confusão: Uma ferramenta fundamental ilustrando previsões verdadeiras e falsas em um modelo.
A matriz de confusão
A matriz de confusão fornece uma quebra detalhada das previsões de um modelo, ajudando a visualizar seu desempenho. Ele mostra quantas previsões foram classificadas correta ou incorretamente.
Componentes da matriz de confusão
- Verdadeiro Positivos (TP): Casos positivos previstos corretamente.
- Falsos positivos (FP): Casos positivos previstos incorretamente.
- False Negatives (FN): Casos positivos perdidos.
Lembre -se de classificação binária
Na classificação binária, o recall é calculado comparando o número de resultados positivos verdadeiros com todas as instâncias positivas reais.
Definição e cálculo
A fórmula para calcular o recall é a seguinte:
Recall = Number of True Positives / (Total True Positives + Total False Negatives)
Exemplo de cálculo de recall
Por exemplo, em um conjunto de dados com uma proporção de 1 classe minoritária para 1000 classes majoritárias, você pode calcular o recall analisando o número de verdadeiros positivos e falsos negativos.
Lembre-se da classificação de várias classes
A recordação se estende além da classificação binária, acomodando cenários de várias classes em que existem várias categorias. Cada classe pode ser avaliada individualmente ou coletivamente.
Expandindo o conceito de recall
Ao abordar a recuperação de várias classes, são necessários ajustes nos cálculos para abranger todas as classes de maneira eficaz.
Cálculo de recall de várias classes
A fórmula para recall de várias classes pode ser expressa como:
Recall = True Positives in all classes / (True Positives + False Negatives in all classes)
Importância e estratégia de recall
Em situações envolvendo classificações desequilibradas, a maximização do recall é imperativa. Um modelo que prioriza minimizar os falsos negativos pode ser crítico em determinadas aplicações.
Balanceing Recall e Precision
Embora a otimização do recall seja essencial, ele pode levar inadvertidamente a uma queda de precisão, enfatizando a necessidade de encontrar um equilíbrio que aumente o desempenho geral do modelo.
Precision vs. Recall
Compreender a relação entre recordação e precisão é essencial para avaliar efetivamente a precisão do modelo.
Definindo precisão
Precisão avalia a correção de previsões positivas usando a seguinte fórmula:
Precisão = True Positives / (True Positives + False Positives)
Usando a pontuação F1 para equilibrar métricas
A pontuação F1 combina recall e precisão em uma única métrica, facilitando uma visão mais holística do desempenho do modelo:
F1 = 2 × (precision × recall) / (precision + recall)