Regressão linear – porque ainda é um dos algoritmos mais poderosos!

No conjunto dos algoritmos, a regressão linear é um dos mais conhecidos. É considerado também como um algoritmo poderoso pela capacidade de ajudar a resolver qualquer problema ou questão de regressão. Ajuda na criação de modelo linear e de identificação de pontos cruciais presentes em determinadas questões.

Neste artigo, falaremos um pouco mais sobre esse tipo de algoritmo e sua importância para os projetos do dia a dia de empresas e instituições de diferentes segmentos. Numa visão prática, ele envolve matemática, conceito e aplicação que utiliza um conjunto de dados e amostras.

A regressão linear

Num conceito inicial, refere-se a um tipo de algoritmo e cálculos capazes de gerar equação capaz de descreve a relação estatística entre uma ou mais variáveis dadas como respostas.

Esse tipo de regressão identifica a linha que pode representar de forma fidedigna as diferentes variáveis de entrada com a variável de saída. Além de cálculos, também envolve gráficos e disposição de dados digitais também.

Em relação aos gráficos, no contexto da dispersão é mais difícil identificar determinada linha que passe sobre todos os dados. Se o usuário deseja a aplicação dessa técnica é indicado dominar conhecimentos sobre Green Belt e sobre Lean Manufacturing.

Como utilizar?

Os cálculos podem orientar a formação de gráficos e dados que podem identificar entradas e saídas. Também é indicada para identificar questões e comparações.

Em questões envolvendo hipóteses, determinadas perguntas podem ser como, por exemplo, “será que todos vão ficar acima do peso ou ser tornar obesos?”

Considerando as perspectivas, por volta do ano 2048, a maiorias dos cidadãos norte-americanos serão obesos.  

Por outro lado, considerando a nossa geração que começou a jogar vídeo game nos anos 1980, quem joga videogame demais está fadado a sair matando de maneira indiscriminada por pura diversão e, agora, comeremos fast-food demais e todos morreremos fracos e imóveis, cercados de embalagens de papelão vazias, estirados em sofás dos quais há muito perdemos a capacidade de nos levantar.

A aplicação do cálculo da regressão linear pode ajudar a repor dados e confirmar cálculos de modo assertivo.

As previsões

Ainda sobre a obesidade, avaliando os cálculos de maneira correta, nós não estamos fadados a ficar acima do peso em 2048, lembramos que nem toda curva é uma reta, mas toda curva é bem próxima de uma reta.

Inicialmente, essa é a percepção que orienta a regressão linear, técnica estatística que está para as ciências sociais como a chave de fenda para os consertos domésticos.

Trata-se de uma ferramenta que se aplica em qualquer tema e setor de empresa.

O que está por trás da regressão linear?

Esse tipo de regressão envolve diferentes linhas de cálculos, em certos casos muitas questões podem ser inseridas como, por exemplo, o cálculo do custo de anuidades da universidade e a média de resultados dos exames finais do ensino médio dos alunos admitidos.

Nesse caso, o agente poderá pensar que as universidades cujos alunos tiveram resultados mais elevados teriam propensão a ser mais caras, porém esse tipo de resultado não é absoluto.

No contexto das universidades, a Elon University apresenta uma pontuação média de 1.217 e cobra uma anuidade de 20.441,00. O Guilford College, enquanto cobra 23.420,00, tem como pontuação média nos exames de conclusão para ingresso apenas 1.131.

Mas se o observador detectar as 31 universidades privadas que informaram suas anuidades e pontuações para ingresso em 2007, perceberá uma tendência clara.

A reta previsão

Regressão linear - a reta de prgressao

Para saber como encontrar a reta previsão na regressão linear, é possível encontrar tal dado através do significado que mais de aproxima do resultado.

Nesse caso, é orientado substituir a anuidade real de cada escola pela estimativa sugerida pela reta e então computar a diferença entre a anuidade real e a estimada para cada fator (universidade, escola, produto, empresa, etc).

Posteriormente, é indicado elevar ao quadrado cada um desses números e por fim somar todos esses quadrados. Dessa forma, será obtido uma espécie de medida total de quanto a reta está desviada em relação aos pontos.

Na plataforma digital

A regressão linear também pode ser usada em plataformas digitais. Dessa forma, é indicado importar todas as bibliotecas necessárias.

É indicado importar todas as bibliotecas básicas que usaremos para esse problema. Em determinado exemplo, é possível usar conjunto de dados “preços da habitação em Boston” para este artigo. Esse conjunto de dados está disponível no scikit learn como um conjunto de dados de amostra.

Nesse caminho, depois que importamos as bibliotecas, vamos criar nosso quadro de dados.

boston = load_boston ()

Isso retorna um dicionário python com certas chaves e valores. Para visualizar as chaves presentes no dicionário, você pode fazer o seguinte:

print (boston.keys ())

Isso fornece o seguinte resultado:

dict_keys ([‘data’, ‘target’, ‘feature_names’, ‘DESCR’, ‘filename’])

Mais dados

Regressão linear - mais dados

Assim, para visualizar a descrição do conjunto de dados, você pode usar o boston.DESCR , que descreve cada recurso no conjunto de dados.

CRIM : Taxa de criminalidade per capita por cidade

ZN : Proporção de terrenos residenciais divididos por lotes com mais de 25.000 pés quadrados

INDUS : Proporção de acres comerciais não comerciais por cidade

CHAS : Variável fictícia Charles River (= 1 se o trecho limita o rio; 0 caso contrário)

NOX : Concentração de óxido nítrico (partes por 10 milhões)

RM : Número médio de cômodos por habitação

Idade : Proporção de unidades ocupadas pelo proprietário construídas antes de 1940

DIS : Distâncias ponderadas de cinco centros de emprego em Boston

RAD : Índice de acessibilidade a rodovias radiais

TAX : Taxa de imposto sobre a propriedade de valor total por US $ 10.000

PTRATIO : Proporção de alunos por professor por cidade

B : 1000 (Bk – 0,63) ², onde Bk é a proporção de [pessoas de descendência afro-americana] por cidade

LSTAT : Porcentagem de status mais baixo da população

MEDV : Valor médio das casas ocupadas pelos proprietários em US $ 1000

Reserve um tempo e tente ler e entender claramente a descrição de cada variável. Sempre devemos ter um entendimento claro dos dados com os quais estamos lidando.

Conclusão

Portanto, a regressão linear é um tipo de algoritmo muito eficaz no cálculo e identificação de padrões. Seus resultados podem ajudar na tomada de decisão e na identificação de informação e dados. Além de extremamente poderosa, é indispensável para o sucesso de qualquer projeto.

Compartilhe

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on whatsapp
WhatsApp
Share on print
imprimir
Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on print

O que achou deste artigo?

Leia também