Leitura de dados e outras funções

Prof. Fernando de Souza Bastos

06 de outubro de 2018

Orientações

O trabalho irá valer 30 pontos (10 na média)

Vocês devem fazer todos os exercícios da apostila da parte de teste de hipóteses e delineamento inteiramente casualizado no software R. Os scripts e os arquivos de dados devem ser enviados em formato .rar com seu nome e sua matricula (FulanodeTal_8978.rar) para o e-mail:

ufv.florestal.maf261@gmail.com até o dia 27/10/2018. O assunto do e-mail deve ser: “Trabalho 1 - Estatística Experimental”.

No interior do arquivo zip deve ter um script para todos os exercícios do mesmo teste de hipóteses (um script para o teste z, um script para o teste t, e assim por diante.) Os scripts devem ser nomeados como:

No interior do script deve conter cabeçalho com nome do acadêmico e matricula. Por exemplo:

##########################
#Nome: Fernando de Souza Bastos
#Matrícula: 8978-8
############################

O nome dos arquivos devem ser obrigatoriamente no formato acima e devem ser de extensão R (executável), não em txt, doc, pdf ou outro qualquer.

Comandos para leitura de dados (.txt):

Bloco de Notas (.txt)

Podemos ler o banco de dados com o comando:

da <- read.table(“nome_do_arquivo.txt”, header=T, dec=“.”, sep=“”)

ou também:

da <- read.table(file.choose(),header=T,dec=“.”,sep=“”)

attach(da) #Este comando serve para poder nos referirmos a uma coluna do banco de dados utilizando seu nome;

Exemplo:

Criei o banco de dados denominado teste.txt e deixei salvo na mesma pasta do script do software R. Assim, para ler os dados fazemos:

da <- read.table("teste.txt", header=T, dec=".", sep="")
names(da) <- c("Trat","Resp")
attach(da)
head(da)
##   Trat Resp
## 1    A 21.0
## 2    A 22.0
## 3    A 24.0
## 4    A 23.0
## 5    A 22.5
## 6    B 29.0
str(da)
## 'data.frame':    15 obs. of  2 variables:
##  $ Trat: Factor w/ 3 levels "A","B","C": 1 1 1 1 1 2 2 2 2 2 ...
##  $ Resp: num  21 22 24 23 22.5 29 31 30 33 35 ...

\[ \begin{align} H_{0}&:\mu_{A}=\mu_{B}=\mu_{C}\\ H_{1}&: \textrm{Não}\ H_{0}\ (\textrm{Pelo menos uma média difere das demais}) \end{align} \] - Usando o pacote ExpDes.pt dos professores Ferreira, Cavalcanti, and Nogueira (2018)

library(ExpDes.pt)
dic <- dic(Trat,
  Resp,
  quali = TRUE,
  mcomp = "tukey",
  nl = FALSE,
  hvar = 'bartlett',
  sigT = 0.01,
  sigF = 0.01)
## ------------------------------------------------------------------------
## Quadro da analise de variancia
## ------------------------------------------------------------------------
##            GL     SQ      QM     Fc      Pr>Fc
## Tratamento  2 492.23 246.117 95.271 4.3251e-08
## Residuo    12  31.00   2.583                  
## Total      14 523.23                          
## ------------------------------------------------------------------------
## CV = 6.71 %
## 
## ------------------------------------------------------------------------
## Teste de normalidade dos residuos 
## Valor-p:  0.8923022 
## De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser considerados normais.
## ------------------------------------------------------------------------
## 
## ------------------------------------------------------------------------
## Teste de homogeneidade de variancia 
## valor-p:  0.110665 
## De acordo com o teste de bartlett a 5% de significancia, as variancias podem ser consideradas homogeneas.
## ------------------------------------------------------------------------
## 
## Teste de Tukey
## ------------------------------------------------------------------------
## Grupos Tratamentos Medias
## a     B   31.6 
##  b    A   22.5 
##   c   C   17.8 
## ------------------------------------------------------------------------
plotres(dic)

Comandos para leitura de dados (.csv):

Arquivo em formato csv

Podemos ler o banco de dados com o comando:

da <- read.table(“nome_do_arquivo.csv”, header=T, dec=“,”, sep=“;”)

ou também:

da <- read.table(file.choose(),header=T,dec=“,”,sep=“;”)

attach(da) #Este comando serve para poder nos referirmos a uma coluna do banco de dados utilizando seu nome;

Exemplo:

Criei o banco de dados denominado teste.csv e deixei salvo na mesma pasta do script do software R. Assim, para ler os dados fazemos:

da <- read.table("teste.csv", header=T, dec=",", sep=";")
names(da) <- c("Trat","Resp")
attach(da)
head(da)
##   Trat Resp
## 1    A 21.0
## 2    A 22.0
## 3    A 24.0
## 4    A 23.0
## 5    A 22.5
## 6    B 29.0
str(da)
## 'data.frame':    15 obs. of  2 variables:
##  $ Trat: Factor w/ 3 levels "A","B","C": 1 1 1 1 1 2 2 2 2 2 ...
##  $ Resp: num  21 22 24 23 22.5 29 31 30 33 35 ...

\[ \begin{align} H_{0}&:\mu_{A}=\mu_{B}=\mu_{C}\\ H_{1}&: \textrm{Não}\ H_{0}\ (\textrm{Pelo menos uma média difere das demais}) \end{align} \] - Usando o pacote ExpDes.pt dos professores Ferreira, Cavalcanti, and Nogueira (2018)

library(ExpDes.pt)
dic <- dic(Trat,
  Resp,
  quali = TRUE,
  mcomp = "tukey",
  nl = FALSE,
  hvar = 'bartlett',
  sigT = 0.01,
  sigF = 0.01)
## ------------------------------------------------------------------------
## Quadro da analise de variancia
## ------------------------------------------------------------------------
##            GL     SQ      QM     Fc      Pr>Fc
## Tratamento  2 492.23 246.117 95.271 4.3251e-08
## Residuo    12  31.00   2.583                  
## Total      14 523.23                          
## ------------------------------------------------------------------------
## CV = 6.71 %
## 
## ------------------------------------------------------------------------
## Teste de normalidade dos residuos 
## Valor-p:  0.8923022 
## De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser considerados normais.
## ------------------------------------------------------------------------
## 
## ------------------------------------------------------------------------
## Teste de homogeneidade de variancia 
## valor-p:  0.110665 
## De acordo com o teste de bartlett a 5% de significancia, as variancias podem ser consideradas homogeneas.
## ------------------------------------------------------------------------
## 
## Teste de Tukey
## ------------------------------------------------------------------------
## Grupos Tratamentos Medias
## a     B   31.6 
##  b    A   22.5 
##   c   C   17.8 
## ------------------------------------------------------------------------
plotres(dic)

Comandos para leitura de dados (.xls):

Arquivo em formato xls

Temos que usar o pacote:

library(readxl)

E, posteriormente, ler o banco de dados com o comando:

da <- read_excel(“teste.xls”)

attach(da) #Este comando serve para poder nos referirmos a uma coluna do banco de dados utilizando seu nome;

Exemplo:

Criei o banco de dados denominado teste.csv e deixei salvo na mesma pasta do script do software R. Assim, para ler os dados fazemos:

library(readxl)
da <- read_excel("teste.xls")
names(da) <- c("Trat","Resp")
attach(da)
head(da)
## # A tibble: 6 x 2
##   Trat   Resp
##   <chr> <dbl>
## 1 A      21  
## 2 A      22  
## 3 A      24  
## 4 A      23  
## 5 A      22.5
## 6 B      29
str(da)
## Classes 'tbl_df', 'tbl' and 'data.frame':    15 obs. of  2 variables:
##  $ Trat: chr  "A" "A" "A" "A" ...
##  $ Resp: num  21 22 24 23 22.5 29 31 30 33 35 ...
da$Trat <- as.factor(da$Trat)
str(da)
## Classes 'tbl_df', 'tbl' and 'data.frame':    15 obs. of  2 variables:
##  $ Trat: Factor w/ 3 levels "A","B","C": 1 1 1 1 1 2 2 2 2 2 ...
##  $ Resp: num  21 22 24 23 22.5 29 31 30 33 35 ...

\[ \begin{align} H_{0}&:\mu_{A}=\mu_{B}=\mu_{C}\\ H_{1}&: \textrm{Não}\ H_{0}\ (\textrm{Pelo menos uma média difere das demais}) \end{align} \] - Usando o pacote ExpDes.pt dos professores Ferreira, Cavalcanti, and Nogueira (2018)

library(ExpDes.pt)
dic <- dic(Trat,
  Resp,
  quali = TRUE,
  mcomp = "tukey",
  nl = FALSE,
  hvar = 'bartlett',
  sigT = 0.01,
  sigF = 0.01)
## ------------------------------------------------------------------------
## Quadro da analise de variancia
## ------------------------------------------------------------------------
##            GL     SQ      QM     Fc      Pr>Fc
## Tratamento  2 492.23 246.117 95.271 4.3251e-08
## Residuo    12  31.00   2.583                  
## Total      14 523.23                          
## ------------------------------------------------------------------------
## CV = 6.71 %
## 
## ------------------------------------------------------------------------
## Teste de normalidade dos residuos 
## Valor-p:  0.8923022 
## De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser considerados normais.
## ------------------------------------------------------------------------
## 
## ------------------------------------------------------------------------
## Teste de homogeneidade de variancia 
## valor-p:  0.110665 
## De acordo com o teste de bartlett a 5% de significancia, as variancias podem ser consideradas homogeneas.
## ------------------------------------------------------------------------
## 
## Teste de Tukey
## ------------------------------------------------------------------------
## Grupos Tratamentos Medias
## a     B   31.6 
##  b    A   22.5 
##   c   C   17.8 
## ------------------------------------------------------------------------
plotres(dic)

Comandos para leitura de dados (.xlsx):

Arquivo em formato .xlsx

Temos que usar o pacote:

library(readxl)

E, posteriormente, ler o banco de dados com o comando:

da <- read_excel(“teste.xlsx”)

attach(da) #Este comando serve para poder nos referirmos a uma coluna do banco de dados utilizando seu nome;

Exemplo:

Criei o banco de dados denominado teste.csv e deixei salvo na mesma pasta do script do software R. Assim, para ler os dados fazemos:

library(readxl)
da <- read_excel("teste.xlsx")
names(da) <- c("Trat","Resp")
attach(da)
head(da)
## # A tibble: 6 x 2
##   Trat   Resp
##   <chr> <dbl>
## 1 A      21  
## 2 A      22  
## 3 A      24  
## 4 A      23  
## 5 A      22.5
## 6 B      29
str(da)
## Classes 'tbl_df', 'tbl' and 'data.frame':    15 obs. of  2 variables:
##  $ Trat: chr  "A" "A" "A" "A" ...
##  $ Resp: num  21 22 24 23 22.5 29 31 30 33 35 ...
da$Trat <- as.factor(da$Trat)
str(da)
## Classes 'tbl_df', 'tbl' and 'data.frame':    15 obs. of  2 variables:
##  $ Trat: Factor w/ 3 levels "A","B","C": 1 1 1 1 1 2 2 2 2 2 ...
##  $ Resp: num  21 22 24 23 22.5 29 31 30 33 35 ...

\[ \begin{align} H_{0}&:\mu_{A}=\mu_{B}=\mu_{C}\\ H_{1}&: \textrm{Não}\ H_{0}\ (\textrm{Pelo menos uma média difere das demais}) \end{align} \] - Usando o pacote ExpDes.pt dos professores Ferreira, Cavalcanti, and Nogueira (2018)

library(ExpDes.pt)
dic <- dic(Trat,
  Resp,
  quali = TRUE,
  mcomp = "tukey",
  nl = FALSE,
  hvar = 'bartlett',
  sigT = 0.01,
  sigF = 0.01)
## ------------------------------------------------------------------------
## Quadro da analise de variancia
## ------------------------------------------------------------------------
##            GL     SQ      QM     Fc      Pr>Fc
## Tratamento  2 492.23 246.117 95.271 4.3251e-08
## Residuo    12  31.00   2.583                  
## Total      14 523.23                          
## ------------------------------------------------------------------------
## CV = 6.71 %
## 
## ------------------------------------------------------------------------
## Teste de normalidade dos residuos 
## Valor-p:  0.8923022 
## De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser considerados normais.
## ------------------------------------------------------------------------
## 
## ------------------------------------------------------------------------
## Teste de homogeneidade de variancia 
## valor-p:  0.110665 
## De acordo com o teste de bartlett a 5% de significancia, as variancias podem ser consideradas homogeneas.
## ------------------------------------------------------------------------
## 
## Teste de Tukey
## ------------------------------------------------------------------------
## Grupos Tratamentos Medias
## a     B   31.6 
##  b    A   22.5 
##   c   C   17.8 
## ------------------------------------------------------------------------
plotres(dic)

Referências

Ferreira, Eric Batista, Portya Piscitelli Cavalcanti, and Denismar Alves Nogueira. 2018. ExpDes.pt: Pacote Experimental Designs (Portuguese). https://CRAN.R-project.org/package=ExpDes.pt.