Seleção de variáveis

No mundo dinâmico da previsão, escolher as variáveis certas, também chamadas de indicadores ou características principais, pode fazer toda a diferença entre previsões precisas e não confiáveis. Nossa ferramenta avançada de seleção de variáveis permite que você identifique as variáveis mais relevantes, otimizando seus modelos de previsão para precisão, eficiência e confiabilidade.

Correlação versus métodos avançados

Muitas organizações confiam na correlação para identificar os principais indicadores, mas essa abordagem geralmente não produz previsões precisas.

A correlação mede apenas a relação linear entre duas variáveis, enquanto os métodos avançados podem avaliar as interações entre várias variáveis, quantificar a contribuição de cada uma e contabilizar os efeitos do grupo. Isso leva a uma melhoria significativa na precisão das previsões.

Para obter mais informações, confira nossa entrevista com a professora Sune Karlsson, uma das principais colaboradoras da pesquisa sobre seleção de variáveis bayesianas.

Principais características do Indicio

Webinar - Identificação dos principais indicadores

Neste webinar gravado, exploraremos as vantagens e desvantagens de várias metodologias para identificar os principais indicadores. Abordaremos abordagens que vão desde plotagem visual e análise de correlação até técnicas avançadas de seleção de variáveis.

Como funciona

Perguntas frequentes

O que é seleção de variáveis e por que ela é importante para a precisão da previsão?

A seleção de variáveis é o processo de escolher quais variáveis (recursos) seu modelo deve realmente usar. Coisas como preço, promoções, clima, feriados, indicadores macro ou sinais comerciais personalizados. Em vez de alimentar o modelo com todas as variáveis possíveis, mantemos os sinais que agregam valor preditivo e eliminamos aqueles que adicionam ruído.

Como seu recurso determina quais variáveis e transformações incluir ou excluir?

Nosso recurso oferece várias estratégias para escolher variáveis e transformações. Ele pode usar algoritmos de busca (para trás, para frente, passo a passo) para testar muitas combinações de variáveis, Lasso para reduzir pequenos coeficientes para zero e métodos bayesianos que mantêm variáveis com alta probabilidade de inclusão posterior.

Posso combinar a seleção automática com minhas próprias variáveis escolhidas por especialistas?

Sim, você pode substituir os resultados da seleção de variáveis se precisar ter variáveis específicas em seus modelos de previsão.

Como você lida com multicolinearidade e preditores redundantes?

A multicolinearidade afeta principalmente os modelos estatísticos clássicos, enquanto as abordagens de Lasso e Bayesiana já a penalizam. Para modelos clássicos, você pode descartar variáveis sinalizadas em avisos de multicolinearidade ou permitir que a seleção de variáveis as remova usando um modelo sensível à multicolinearidade.

A seleção de variáveis funciona para séries temporais univariadas e multivariadas?

No Indicio, a seleção de variáveis é aplicada somente a modelos multivariados. Os modelos univariados só podem incluir outras variáveis por meio de modelagem exógena, que precisa de previsões e introduziria um viés de previsão durante a avaliação, uma vez que os valores reais são usados para as variáveis exógenas.

Quais métodos você usa (por exemplo, regularização, importância do recurso, SHAP) para classificar a relevância da variável?

A Indicio oferece vários métodos para classificar variáveis por relevância. Isso pode ser feito na seleção de variáveis, onde usamos algoritmos de busca (para trás, para frente, passo a passo) que testam combinações de variáveis, Lasso para reduzir pequenos coeficientes a zero e métodos bayesianos que mantêm variáveis com alta probabilidade de inclusão posterior.

A classificação da relevância das variáveis também pode ser feita na última etapa do processo de previsão para traduzir modelos de previsão complexos em fatores e barreiras usando o SHAP.


Como o recurso evita o sobreajuste, especialmente com muitas variáveis candidatas?

O Indicio limita o sobreajuste de várias maneiras: divisões de treinamento/validação e validação cruzada, regularização (encolhimento Lasso e Bayesiano) e seleção automatizada de variáveis que remove preditores fracos ou redundantes.

Dica: comparar os resultados dentro e fora da amostra ajuda a identificar o sobreajuste.

Posso ver transparência/explicabilidade sobre por que uma variável foi selecionada ou descartada?

Sim. Você pode inspecionar diagnósticos, como coeficientes e impacto na precisão. Juntos, eles mostram quais variáveis foram mantidas ou eliminadas, quão fortemente elas influenciam o modelo e se elas ajudam ou prejudicam o desempenho da previsão.

Como a seleção de variáveis afeta a velocidade do treinamento e a latência da inferência em grande escala?

A seleção de variáveis adiciona alguma sobrecarga, pois precisa testar e comparar diferentes subconjuntos de preditores. Em grande escala, esse custo é compensado por modelos finais menores: menos preditores aceleram o treinamento do modelo escolhido e reduzem a latência de inferência na produção.

Qual preparação de dados é necessária (valores ausentes, sinalizadores de sazonalidade/feriados, codificações categóricas) para obter melhores resultados?

O Indicio detecta e trata automaticamente os valores ausentes e a sazonalidade. Você também pode sinalizar e manipular valores atípicos e efeitos de calendário, como feriados, para melhorar ainda mais o desempenho do modelo.

Explore mais recursos

Explore todos os recursos

Demonstração virtual

Veja nossa demonstração em cliques

Experimente a facilidade e a precisão da plataforma de previsão automatizada da Indicio em primeira mão. Clique para iniciar uma demonstração virtual hoje mesmo e descobrir como nossas ferramentas de ponta podem agilizar seu processo de tomada de decisão.