Saturday 19 August 2017

Log regressão linear em stata forex


Análise de regressão linear usando Stata Introdução A regressão linear, também conhecida como regressão linear simples ou regressão linear bivariada, é usada quando queremos prever o valor de uma variável dependente com base no valor de uma variável independente. Por exemplo, você pode usar regressão linear para entender se o desempenho do exame pode ser previsto com base no tempo de revisão (ou seja, sua variável dependente seria o desempenho do exame, medido de 0-100 marcas e sua variável independente seria o tempo de revisão, medido em horas) . Alternativamente, você pode usar regressão linear para entender se o consumo de cigarro pode ser previsto com base na duração do tabagismo (ou seja, sua variável dependente seria o consumo de cigarro, medida em termos de número de cigarros consumidos diariamente e sua variável independente seria a duração do tabagismo, medida Em dias). Se você tem duas ou mais variáveis ​​independentes, em vez de apenas uma, você precisa usar uma regressão múltipla. Alternativamente, se você deseja estabelecer se existe uma relação linear, você poderia usar a correlação Pearsons. Nota: A variável dependente também é referida como a variável resultado, alvo ou critério, enquanto a variável independente também é referida como a variável preditor, explicativa ou regressora. Em última análise, qualquer termo que você use, é melhor ser consistente. Nós nos referiremos a essas variáveis ​​dependentes e independentes ao longo deste guia. Neste guia, mostramos como realizar uma regressão linear usando o Stata, bem como interpretar e denunciar os resultados desse teste. No entanto, antes de apresentarmos este procedimento, você precisa entender os diferentes pressupostos que seus dados devem atender para que a regressão linear lhe dê um resultado válido. Nós discutimos estes pressupostos a seguir. Pressupostos Existem sete pressupostos que sustentam a regressão linear. Se qualquer um desses sete pressupostos não for cumprido, você não pode analisar seus dados usando linear porque você não obterá um resultado válido. Como as suposições 1 e 2 referem-se à sua escolha de variáveis, elas não podem ser testadas para usar o Stata. No entanto, você deve decidir se seu estudo atende a essas premissas antes de seguir em frente. Assunção 1: sua variável dependente deve ser medida no nível contínuo. Exemplos de tais variáveis ​​contínuas incluem altura (medida em pés e polegadas), temperatura (medida em o C), salário (medido em dólares norte-americanos), tempo de revisão (medido em horas), inteligência (medida usando o QI), tempo de reação ( Medido em milissegundos), desempenho do teste (medido de 0 a 100), vendas (medida em número de transações por mês), e assim por diante. Se você não tem certeza se sua variável dependente é contínua (ou seja, medido no intervalo ou nível de relação), consulte o nosso Guia de Tipos de Variáveis. Assunção 2: Sua variável independente deve ser medida no nível contínuo ou categórico. No entanto, se você tem uma variável independente categórica, é mais comum usar uma prova t independente (para 2 grupos) ou ANOVA unidirecional (para 3 grupos ou mais). No caso de você não tiver certeza, exemplos de variáveis ​​categóricas incluem gênero (por exemplo, 2 grupos: masculino e feminino), etnia (por exemplo, 3 grupos: caucasiano, afro-americano e hispânico), nível de atividade física (por exemplo, 4 grupos: sedentário, baixo, moderado e Alto) e profissão (por exemplo, 5 grupos: cirurgião, médico, enfermeiro, dentista, terapeuta). Neste guia, mostramos o procedimento de regressão linear e a saída do Stata quando suas variáveis ​​dependentes e independentes foram medidas em um nível contínuo. Felizmente, você pode verificar os pressupostos 3, 4, 5, 6 e 7 usando o Stata. Ao passar às premissas 3, 4, 5, 6 e 7, sugerimos testá-las nesta ordem porque representa uma ordem em que, se uma violação ao pressuposto não for corrigível, você não poderá mais usar a regressão linear. Na verdade, não se surpreenda se seus dados falharem em uma ou mais dessas premissas, pois isso é bastante típico quando se trabalha com dados do mundo real, em vez de exemplos de livros didáticos, que geralmente mostram apenas como realizar uma regressão linear quando tudo corre bem. No entanto, não se preocupe, porque mesmo quando seus dados falham em certos pressupostos, muitas vezes há uma solução para superar isso (por exemplo, transformar seus dados ou usar outro teste estatístico em vez disso). Basta lembrar que, se você não verificar se seus dados atendem a esses pressupostos ou você os testou incorretamente, os resultados obtidos ao executar a regressão linear podem não ser válidos. Assunção 3: Deve haver uma relação linear entre as variáveis ​​dependente e independente. Embora existam várias maneiras de verificar se existe uma relação linear entre suas duas variáveis, sugerimos criar um diagrama de dispersão usando Stata, onde você pode traçar a variável dependente em relação à sua variável independente. Você pode então inspecionar visualmente o diagrama de dispersão para verificar a linearidade. Seu diagrama de dispersão pode parecer algo como um dos seguintes: Se o relacionamento exibido em seu diagrama de dispersão não for linear, você terá que executar uma análise de regressão não-linear ou transformar seus dados, o que você pode fazer usando o Stata. Assunção 4: Não deve haver valores atípicos significativos. Os outliers são simplesmente pontos de dados únicos dentro de seus dados que não seguem o padrão usual (por exemplo, em um estudo de 100 alunos de pontuação de QI, onde o escore médio foi de 108 com apenas uma pequena variação entre os alunos, um aluno teve uma pontuação de 156, o que É muito incomum, e pode até colocá-la no topo 1 dos escores de QI globalmente). Os seguintes pontos de dispersão destacam o impacto potencial de outliers: o problema com outliers é que eles podem ter um efeito negativo na equação de regressão que é usada para prever o valor da variável dependente com base na variável independente. Isso irá alterar o resultado que a Stata produz e reduzir a precisão preditiva de seus resultados. Felizmente, você pode usar o Stata para realizar diagnósticos casewise para ajudá-lo a detectar possíveis valores atípicos. Assunção 5: você deve ter independência de observações. Que você pode verificar facilmente usando a estatística Durbin-Watson. Que é um teste simples para executar usando o Stata. Assunção 6: seus dados precisam mostrar homoscedasticidade. Que é onde as variações ao longo da linha de melhor ajuste permanecem similares à medida que você se move ao longo da linha. Os dois pontos de dispersão abaixo fornecem exemplos simples de dados que atendem a essa suposição e que falham na suposição: quando você analisa seus próprios dados, você terá sorte se o seu diagrama de dispersão se parecer com um dos dois acima. Embora estes ajudem a ilustrar as diferenças nos dados que atende ou viole a assunção da homoscedasticidade, os dados do mundo real são muitas vezes muito mais confusos. Você pode verificar se seus dados mostraram homoscedasticidade ao traçar os resíduos padronizados padronizados contra o valor predito padronizado de regressão. Assunção 7: Finalmente, você precisa verificar se os resíduos (erros) da linha de regressão são aproximadamente normalmente distribuídos. Dois métodos comuns para verificar esta suposição incluem o uso de um histograma (com uma curva normal sobreposta) ou um traçado P-P normal. Na prática, a verificação de hipóteses 3, 4, 5, 6 e 7 provavelmente ocupará a maior parte do tempo ao realizar a regressão linear. No entanto, não é uma tarefa difícil, e a Stata fornece todas as ferramentas que você precisa para fazer isso. Na seção, Procedimento. Ilustramos o procedimento Stata necessário para executar regressão linear assumindo que nenhum pressuposto foi violado. Primeiro, apresentamos o exemplo que usamos para explicar o procedimento de regressão linear em Stata. Estudos mostram que o exercício pode ajudar a prevenir doenças cardíacas. Dentro de limites razoáveis, quanto mais você se exercita, menos risco você tem de sofrer de doença cardíaca. Uma maneira pela qual o exercício reduz seu risco de sofrer de doenças cardíacas é reduzindo a gordura no sangue, chamado colesterol. Quanto mais você se exercita, menor sua concentração de colesterol. Além disso, recentemente foi demonstrado que a quantidade de tempo que você gasta assistindo TV ndash um indicador de um estilo de vida sedentário pode ser um bom preditor de doenças cardíacas (isto é, quanto mais TV você assiste, maior o risco de doença cardíaca ). Portanto, um pesquisador decidiu determinar se a concentração de colesterol estava relacionada com o tempo gasto assistindo TV em homens saudáveis ​​de 45 a 65 anos de idade (uma categoria de pessoas em risco). Por exemplo, à medida que as pessoas passaram mais tempo assistindo TV, a concentração de colesterol também aumentou (uma relação positiva) ou ocorreu o contrário. O pesquisador também queria saber a proporção de concentração de colesterol que o tempo gasto assistindo a TV poderia explicar, além de ser Capaz de prever a concentração de colesterol. O pesquisador poderia, então, determinar se, por exemplo, as pessoas que passavam oito horas passadas a assistir TV por dia tinham níveis perigosamente elevados de concentração de colesterol em comparação com pessoas que veiam apenas duas horas de TV. Para realizar a análise, o pesquisador recrutou 100 participantes masculinos saudáveis ​​entre as idades de 45 e 65 anos. A quantidade de tempo gasto assistindo TV (ou seja, a variável independente, timetv) e a concentração de colesterol (isto é, a variável dependente, colesterol) foram registradas para todos os 100 participantes. Expresso em termos variáveis, o pesquisador queria regredir o colesterol no timetv. Nota: O exemplo e os dados utilizados para este guia são fictícios. Acabamos de criá-los para os propósitos deste guia. Configuração em Stata In Stata, criamos duas variáveis: (1) timetv. Qual é o tempo médio diário passado assistindo televisão em minutos (ou seja, a variável independente) e (2) colesterol. Que é a concentração de colesterol em mmolL (isto é, a variável dependente). Nota: Não importa se você cria a variável dependente ou independente primeiro. Depois de criar essas duas variáveis, ndash timetv e colesterol ndash, inserimos as pontuações para cada uma nas duas colunas da planilha do Editor de Dados (Editar) (ou seja, o horário em horas que os participantes assistiram TV na coluna da esquerda (ou seja, timetv. Variável independente) e participantes da concentração de colesterol em mmolL na coluna da direita (ou seja, o colesterol, a variável dependente), conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Procedimento de teste em Stata Nesta seção, mostramos como Analise seus dados usando regressão linear em Stata quando as seis premissas na seção anterior, Suposições. Não foram violadas. Você pode realizar regressão linear usando código ou interface gráfica do usuário do Statas (GUI). Depois de ter realizado sua análise, nós Mostre como interpretar seus resultados. Primeiro, escolha se deseja usar o código ou a interface gráfica do usuário do Statas (GUI). O código para realizar a regressão linear em seus dados assume a forma: Regredir DependentVariable IndependentVariable Publicado com permissão por escrito da StataCorp LP. Usando o exemplo em que a variável dependente é colesterol e a variável independente é timetv. O código necessário seria: regressar colesterol timetv Nota 1: Você precisa ser preciso ao inserir o código na caixa. O código diferencia maiúsculas de minúsculas. Por exemplo, se você inseriu Colesterol onde o C é maiúscula em vez de minúsculas (ou seja, um pequeno c), o que deveria ser, você receberá uma mensagem de erro como a seguinte: Nota 2: Se você ainda receber a mensagem de erro na Nota 2 : Acima, vale a pena verificar o nome que você deu suas duas variáveis ​​no Editor de Dados quando você configura seu arquivo (ou seja, veja a tela do Editor de Dados acima). Na caixa do lado direito da tela do Editor de Dados, é a forma como você escreveu suas variáveis ​​na seção, e não a seção que você precisa para entrar no código (veja abaixo nossa variável dependente). Isso pode parecer óbvio, mas é um erro que às vezes é feito, resultando no erro na Nota 2 acima. Portanto, digite o código, regresse o tempo de colesterol. E pressione o botão ReturnEnter no seu teclado. Publicado com permissão por escrito da StataCorp LP. Você pode ver a saída da Stata que será produzida aqui. Interface de usuário gráfica (GUI) As três etapas necessárias para realizar regressão linear em Stata 12 e 13 são mostradas abaixo: Clique em S tatistics gt Modelos lineares e gt relacionados Regressão linear no menu principal, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Você receberá a caixa de diálogo Regress ndash Regressão linear: Publicado com permissão por escrito da StataCorp LP. Selecione o colesterol dentro da variável Dependente: caixa suspensa e timetv dentro das variáveis ​​independentes: caixa suspensa. Você terminará com a seguinte tela: Publicado com permissão por escrito da StataCorp LP. Saída da análise de regressão linear em Stata Se seus dados passaram a suposição 3 (ou seja, houve uma relação linear entre suas duas variáveis), 4 (ou seja, não houve outliers significativos), a suposição 5 (ou seja, você teve independência de observações), suposição 6 ( Ou seja, seus dados mostraram homoscedasticidade) e a suposição 7 (ou seja, os resíduos (erros) foram aproximadamente normalmente distribuídos), o que explicamos anteriormente na seção de Suposições, você só precisará interpretar o seguinte resultado de regressão linear em Stata: Publicado com permissão por escrito de StataCorp LP. A saída consiste em quatro importantes informações: (a) o valor R 2 (linha R quadrada) representa a proporção de variância na variável dependente que pode ser explicada por nossa variável independente (tecnicamente é a proporção de variação representada por Pelo modelo de regressão acima e além do modelo médio). No entanto, R 2 baseia-se na amostra e é uma estimativa positivamente tendenciosa da proporção da variância da variável dependente representada pelo modelo de regressão (ou seja, é muito grande) (b) um valor R 2 ajustado (Adj R - Linha quadrada), que corrige o viés positivo para fornecer um valor que seria esperado na população (c) o valor F, os graus de liberdade (F (1, 98)) e a significância estatística do modelo de regressão (linha G do teste G) E (d) os coeficientes para a variável constante e independente (coluna Coef.), Que é a informação que você precisa para prever a variável dependente, o colesterol. Usando a variável independente, timetv. Neste exemplo, R 2 0,151. R 2 ajustado 0.143 (para 3 d. p.), o que significa que a variável independente, timetv. Explica 14.3 da variabilidade da variável dependente, o colesterol. Na população. R 2 ajustado também é uma estimativa do tamanho do efeito, que em 0.143 (14.3), é indicativo de um tamanho de efeito médio, de acordo com a classificação de Cohens (1988). No entanto, normalmente é R 2 não o R 2 ajustado que é relatado em resultados. Neste exemplo, o modelo de regressão é estatisticamente significativo, F (1, 98) 17,47, p .0001. Isso indica que, em geral, o modelo aplicado pode prever de forma estatística significativamente a variável dependente, o colesterol. Nota: Apresentamos a saída da análise de regressão linear acima. No entanto, como você deve ter testado seus dados para os pressupostos que explicamos anteriormente na seção Suposições, você também precisará interpretar a saída do Stata que foi produzida quando você testou esses pressupostos. Isso inclui: (a) os diagramas de dispersão que você usou para verificar se houve uma relação linear entre suas duas variáveis ​​(ou seja, Assunção 3) (b) diagnósticos casewise para verificar que não houve valores aberrantes significativos (ou seja, Assunção 4) (c) a saída de A estatística de Durbin-Watson para verificar a independência das observações (ou seja, a Assunção 5) (d) um diagrama de dispersão dos resíduos padronizados de regressão contra o valor predito padronizado de regressão para determinar se seus dados mostraram homocedasticidade (isto é, Assunção 6) e um histograma (com sobreposição Curva normal) e Plot Normal PP para verificar se os resíduos (erros) foram aproximadamente normalmente distribuídos (ou seja, a Assunção 7). Além disso, lembre-se de que, se seus dados falharam em qualquer um desses pressupostos, a saída que você obtém do procedimento de regressão linear (ou seja, a saída que discutimos acima) não será mais relevante, e você pode ter que realizar um teste estatístico diferente para analisar seus dados. Relatando a saída da análise de regressão linear Quando você relata a saída de sua regressão linear, é uma boa prática incluir: (a) uma introdução à análise que você realizou (b) informações sobre sua amostra, incluindo quaisquer valores faltantes (c) O valor F observado, os graus de liberdade e o nível de significância (ou seja, o valor p) (d) a porcentagem da variabilidade na variável dependente explicada pela variável independente (ou seja, seu R ajustado) e (e) a equação de regressão Para o seu modelo. Com base nos resultados acima, podemos relatar os resultados deste estudo da seguinte forma: uma regressão linear estabeleceu que o tempo diário passado assistindo TV poderia prever significativamente estatisticamente a concentração de colesterol, F (1, 98) 17,47, p .0001 e tempo gasto assistindo TV Representaram 14,3 da variabilidade explicada na concentração de colesterol. A equação de regressão foi: concentração de colesterol prevista -2.135 0.044 x (tempo gasto assistindo TV). Além dos relatórios dos resultados acima, um diagrama pode ser usado para apresentar visualmente seus resultados. Por exemplo, você poderia fazer isso usando um diagrama de dispersão com intervalos de confiança e predição (embora não seja muito comum adicionar o último). Isso pode tornar mais fácil para os outros entender seus resultados. Além disso, você pode usar sua equação de regressão linear para fazer previsões sobre o valor da variável dependente com base em diferentes valores da variável independente. Enquanto a Stata não produz esses valores como parte do procedimento de regressão linear acima, há um procedimento em Stata que você pode usar para fazê-lo. Linha de Regressão Linear Uma Linha de Regressão Linear é uma linha direta que melhor se ajusta aos preços entre um preço inicial Ponto e um ponto de preço final. Um ajuste o mais bonito significa que uma linha é construída onde há a menor quantidade de espaço entre os pontos de preço e a Linha de Regressão Linear real. A linha de regressão linear é usada principalmente para determinar a direção da tendência. Um gráfico do estoque ATampT (T) é dado abaixo: os comerciantes costumam ver a Linha de Regressão Linear como o preço de valor justo para o par de moedas do futuro, do estoque ou da moeda estrangeira. Quando os preços se desviam acima ou abaixo, os comerciantes podem esperar que os preços voltem para a Linha de Regressão Linear. Como conseqüência, quando os preços estão abaixo da Linear Regression Line, isso pode ser visto por alguns comerciantes como um bom momento para comprar, e quando os preços estão acima da Linear Regression Line, um comerciante pode vender. É claro que outros indicadores técnicos seriam usados ​​para confirmar esses sinais de compra e venda inexatos. Um indicador de gráficos de análise técnica útil que usa uma Linha de Regressão Linear é o Canal de Regressão Linear (veja: Canal de Regressão Linear), o que proporciona sinais de compra e venda de potencial mais objetivos com base na volatilidade dos preços. As informações acima são apenas para fins informativos e de entretenimento e não constituem conselhos de negociação ou solicitação para comprar ou vender qualquer estoque, opção, futuro, commodity ou produto forex. O desempenho passado não é necessariamente uma indicação de desempenho futuro. A negociação é inerentemente arriscada. OnlineTradingConcepts não será responsável por quaisquer danos especiais ou conseqüentes que resultem do uso ou da incapacidade de usar, os materiais e as informações fornecidas por este site. Veja o aviso prévio completo.

No comments:

Post a Comment