Lo acabo de intentar y sigue apareciendo: 'x' must be numeric
From: j.para.fernandez en hotmail.com
To: valeagui en outlook.es; cof en qualityexcellence.es; r-help-es en r-project.org
Subject: RE: [R-es] Problema con la lectura de datos
Date: Wed, 11 Nov 2015 16:17:58 +0100
Has probado con
cor(datos,use="pairwise.complete.obs")
???
From: valeagui en outlook.es
To: cof en qualityexcellence.es; r-help-es en r-project.org
Date: Wed, 11 Nov 2015 15:13:55 +0000
Subject: Re: [R-es] Problema con la lectura de datos
Hola Carlos, muchas gracias....pero hago exactamente lo mismo que tu..y
al intentar de hacer la matriz de correlaciones sigue generando error:
'x' must be numeric
se podrá deber a algo relacionado con la configuración de mi equipo, o
qué más podrÃa hacer para que funcione!
Muchas gracias!
Date: Wed, 11 Nov 2015 15:53:44 +0100
Subject: Re: [R-es] Problema con la lectura de datos
From: cof en qualityexcellence.es
To: valeagui en outlook.es
CC: r-help-es en r-project.org
?Hola,
A mà me funciona la importación directa. Previamente he guardado la hoja
de Excel en .csv (separado por ";").
Y hago sin problemas la correlación entre dos variables (las dos
datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";",
EMPRESAS AA AB AC AD AE AF AG AH AI AJ
BA BB BC DA DB DC DD DE EA EB EE
1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207
13.47170 588.00 834 0.00 0.00000 0.0000 0.00 477 763 57.19424
62.51638
2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411
15.69663 891.00 1655 29.00 0.00000 0.0000 43.03 738 1400 44.59592
52.71429
3 A.SERVICIOS 219 0 62 1411 743 112 71 45 11461538 5190688
21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214
63.20583
4 B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0
12.54286 2768.00 3677 58.00 82.00000 68.0000 55.00 2206 3332 59.99456
66.20648
5 B.SEVILLA 143 394 0 502 0 30 30 18 2966295 1173798
15.85185 355.00 894 0.00 56.49913 0.0000 32.92 444 779 49.66443
56.99615
6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599
9.00000 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278
46.88458
[1] 0.2626692
También puedo hacer sin problemas la correlación entre todas las
variables salvo obviamente la primera.
cor(datIn[,c(2:ncol(datIn))])
AA AB AC AD AE AF
AA 1.00000000 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002
0.20140216 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924
AB 0.84869774 1.0000000 0.7727162 0.6800804 0.60239429 0.4549922
0.20038993 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968
AC 0.82659015 0.7727162 1.0000000 0.4311124 0.54400731 0.4709625
0.28513806 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135
AD 0.65962689 0.6800804 0.4311124 1.0000000 0.57683448 0.4778828
0.21678760 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627
AE 0.68866326 0.6023943 0.5440073 0.5768345 1.00000000 0.7380745
0.31759392 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056
AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.0000000
0.61495885 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965
AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588
1.00000000 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773
AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377
0.71671688 1.00000000 0.56378874 0.7522773 0.33759298 0.3339301 0.3772097
Saludos,
Carlos Ortega
www.qualityexcellence.es
?
El 11 de noviembre de 2015, 15:32, Jesús Para Fernández <
j.para.fernandez en hotmail.com> escribió:
Si es un excel, yo siempre los paso a R de la misma manera:
Los copio del excel y los pego en R usando el comando:
datos<-read.table("clipboard",header=T,dec=",",sep="\t")
siendo dec="," si el separador decimal es l acoma, header=T si lo sdatos
Y te quitas de usar pqeutees y de lÃos.
Un saludo
Jesús
From: josea.bartolome en mineco.es
To: valeagui en outlook.es; r-help-es en r-project.org
Date: Wed, 11 Nov 2015 14:22:23 +0000
Subject: Re: [R-es] Problema con la lectura de datos
He estado viendo los datos que adjuntas en el correo. Al ser un
fichero Excel xlsx ¿por qué no lo abres directamente?
Te aconsejarÃa la librerÃa openxlsx (si no la has usado nunca ,
instálala con install.packages(?openxlsx?))
Este es el código que he ejecutado y los resultados que obtengo:
dat <- read.xlsx("Variables.xlsx")
'data.frame': 42 obs. of 22 variables:
$ EMPRESAS: chr "A.AUDITORÃA" "A.JURÃDICAS" "A.SERVICIOS" "B.MÃLAGA"
$ AA : num 200 0 219 776 143 481 380 205 806 0 ...
$ AB : num 350 499 0 1796 394 ...
$ AC : num 90 120 62 1590 0 ...
$ AD : num 2000 825 1411 1888 502 ...
$ AE : num 500 358 743 2381 0 ...
$ AF : num 30 81 112 392 30 46 140 46 283 214 ...
$ AG : num 59 82 71 168 30 125 69 27 132 268 ...
$ AH : num 24 27 45 107 18 0 50 17 85 148 ...
$ AI : num 5937586 5012257 11461538 21441999 2966295 ...
$ AJ : num 2644207 2666411 5190688 0 1173798 ...
$ BA : num 13.5 15.7 21.1 12.5 15.9 ...
$ BB : num 588 891 855 2768 355 ...
$ BC : num 834 1655 1222 3677 894 ...
$ DA : num 0 29 21 58 0 6.14 59 78.3 40 0 ...
$ DB : num 0 0 80 82 56.5 ...
$ DC : num 0 0 65.6 68 0 ...
$ DD : num 0 43 69 55 32.9 ...
$ DE : num 477 738 694 2206 444 ...
$ EA : num 763 1400 1098 3332 779 ...
$ EB : num 57.2 44.6 56.8 60 49.7 ...
$ EE : num 62.5 52.7 63.2 66.2 57 ...
En este caso, excepto la primera variable del data.frame, EMPRESAS, el
resto de variables son todas numéricas.
Al calcular la correlación,
AA 1.00000000 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002
0.20140216 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924
AB 0.84869774 1.0000000 0.7727162 0.6800804 0.60239429 0.4549922
0.20038993 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968
AC 0.82659015 0.7727162 1.0000000 0.4311124 0.54400731 0.4709625
0.28513806 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135
AD 0.65962689 0.6800804 0.4311124 1.0000000 0.57683448 0.4778828
0.21678760 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627
AE 0.68866326 0.6023943 0.5440073 0.5768345 1.00000000 0.7380745
0.31759392 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056
AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.0000000
0.61495885 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965
AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588
1.00000000 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773
AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377
0.71671688 1.00000000 0.56378874 0.7522773 0.33759298 0.3339301 0.3772097
AI 0.15680060 0.0761117 0.2070148 0.2309632 0.35888923 0.5665039
0.75102728 0.56378874 1.00000000 0.7238554 0.36718739 0.3593759 0.3648694
AJ 0.18155782 0.1867806 0.1489140 0.1605449 0.42798492 0.4192717
0.58157047 0.75227731 0.72385544 1.0000000 0.32383985 0.2251971 0.3290529
BA 0.04421944 0.1490019 0.1155607 0.2339443 0.23914953 0.5220171
0.35942749 0.33759298 0.36718739 0.3238398 1.00000000 0.4741997 0.4849367
BB 0.26266922 0.2935827 0.2635190 0.2778728 0.34660209 0.5480744
0.34589670 0.33393007 0.35937594 0.2251971 0.47419975 1.0000000 0.8644753
BC 0.37009242 0.3828968 0.3144135 0.4127627 0.46650558 0.5570965
0.35217726 0.37720971 0.36486945 0.3290529 0.48493672 0.8644753 1.0000000
DA 0.12729358 0.2097083 0.2273743 0.2586080 0.04903814 0.1337604
0.04770505 -0.02820084 -0.08026755 -0.0690546 0.10452352 0.2456501 0.2663439
DB 0.34433620 0.3644439 0.2742700 0.2915012 0.37237335 0.4424803
0.26910692 0.18049995 0.07458397 0.1720090 0.25373766 0.2838717 0.3686991
DC 0.31138871 0.4351456 0.3708863 0.2879036 0.27894283 0.3910026
0.35626679 0.25150771 0.04803632 0.1964792 0.21908448 0.3448711 0.3715649
DD 0.12114443 0.2021762 0.2608359 0.1905531 0.22097695 0.5625022
0.50523504 0.31467457 0.39783383 0.2595466 0.53118085 0.2289631 0.1301571
DE 0.35222168 0.3349595 0.3395499 0.3520103 0.38773536 0.4383205
0.31627815 0.32071392 0.36785525 0.2521859 0.48523738 0.8300639 0.9513514
EA 0.38719393 0.3943053 0.3165222 0.4447254 0.49626537 0.5603614
0.34303174 0.38201422 0.36379446 0.3440225 0.44728760 0.8477830 0.9917205
EB 0.23715300 0.2161053 0.2874953 0.2931956 0.16217684 0.2491931
0.28613475 0.24330620 0.31937182 0.1708668 0.68896759 0.2480708 0.3048419
EE 0.17607827 0.1706387 0.2458498 0.2010243 0.08499049 0.1842111
0.23259246 0.17859229 0.24737884 0.1069764 0.63462949 0.1897725 0.2332711
AA 0.12729358 0.34433620 0.31138871 0.12114443 0.35222168 0.38719393
AB 0.20970834 0.36444390 0.43514558 0.20217623 0.33495945 0.39430527
AC 0.22737429 0.27426997 0.37088630 0.26083592 0.33954991 0.31652223
AD 0.25860803 0.29150116 0.28790356 0.19055307 0.35201029 0.44472536
AE 0.04903814 0.37237335 0.27894283 0.22097695 0.38773536 0.49626537
AF 0.13376042 0.44248035 0.39100256 0.56250225 0.43832051 0.56036142
AG 0.04770505 0.26910692 0.35626679 0.50523504 0.31627815 0.34303174
AH -0.02820084 0.18049995 0.25150771 0.31467457 0.32071392 0.38201422
AI -0.08026755 0.07458397 0.04803632 0.39783383 0.36785525 0.36379446
AJ -0.06905460 0.17200898 0.19647923 0.25954659 0.25218588 0.34402252
BA 0.10452352 0.25373766 0.21908448 0.53118085 0.48523738 0.44728760
BB 0.24565007 0.28387172 0.34487115 0.22896314 0.83006391 0.84778301
BC 0.26634388 0.36869915 0.37156494 0.13015707 0.95135143 0.99172045
DA 1.00000000 0.34271551 0.46962484 0.21028693 0.22537099 0.24605036
DB 0.34271551 1.00000000 0.82643586 0.37753408 0.31011191 0.38632011
DC 0.46962484 0.82643586 1.00000000 0.48052101 0.29376338 0.37927205
DD 0.21028693 0.37753408 0.48052101 1.00000000 0.07915853 0.09352177
DE 0.22537099 0.31011191 0.29376338 0.07915853 1.00000000 0.93416336
EA 0.24605036 0.38632011 0.37927205 0.09352177 0.93416336 1.00000000
EB 0.18805779 0.17754666 0.10637802 0.37506880 0.41256496 0.25464611
EE 0.23275533 0.12354507 0.07589745 0.38475445 0.34015216 0.16211743
Espero haberte ayudado. Un cordial saludo.
De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de
Enviado el: Wednesday, November 11, 2015 2:31 PM
Asunto: Re: [R-es] Problema con la lectura de datos
Holaa...yo estoy utilizando el siguiente código, pero no me va...y lo
que quiero es que R lea la base de datos, donde la primera columna es el
nombre de la empresa y las otras variables, para luego calcular una matriz
de correlaciones:
Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv",
header=TRUE, sep=";", comment.char="" ,
colClasses=c(Empresas="character", rep("numeric",21)), strip.white=FALSE,
dec = ",")
pero con esto genera el sgte error, como ya he mencionado antes:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines,
na.strings, : scan() expected 'a real', got 'ND'
Luego, si sólo escribo el siguiente código:
Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv",
R los lee, pero cuando quiero generar la matriz de correlaciones,
genera el siguiente error:
Error in cor(Variables) : 'x' must be numeric
Realmente no sé que se deba hacer, por lo que agradecerÃa si me pueden
ayudar, aquà adjunto la base de datos en formato excel.