Skip to content

[R-es] Quitar datos atípicos de una recta

6 messages · Isidro Hidalgo, Jesús Para Fernández, Olivier Nuñez +1 more

#
Buenas,


Tengo unas rectas en las que cada x número de ellas hay algún error en la captura de los datos y se produce un outlier.

Os pongo un ejemplo:

x<-rnorm(15,12,2)
y<-jitter(x,200)
y[7]<-20
plot(x,y)


En este ejemplo se ve muy claro que el outlier y quitarlo seria facil, pero... ¿como hacerlo de manera automatica? es que hay mil curvas com oesta y puede ser una locura.


Gracias chicos

Jesús
#
Hay un paquete que lo hace, pero no lo he utilizado, así que no sé cómo se porta: "outliers"...
Un saludo

Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo
Consejería de Economía, Empresas y Empleo
http://www.castillalamancha.es/


-----Mensaje original-----
De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de Jesús Para Fernández
Enviado el: lunes, 24 de octubre de 2016 9:33
Para: r-help-es en r-project.org
Asunto: [R-es] Quitar datos atípicos de una recta

Buenas,


Tengo unas rectas en las que cada x n?mero de ellas hay alg?n error en la captura de los datos y se produce un outlier.

Os pongo un ejemplo:

x<-rnorm(15,12,2)
y<-jitter(x,200)
y[7]<-20
plot(x,y)


En este ejemplo se ve muy claro que el outlier y quitarlo seria facil, pero... ?como hacerlo de manera automatica? es que hay mil curvas com oesta y puede ser una locura.


Gracias chicos

Jes?s
#
Ok, lo pruebo y os digo...


Jesús
#
Igual, no hace falta quitarlos:

require(MASS)
fit=rlm(y~x) # regresión robusta
abline(fit)

Un saludo. Olivier

----- Mensaje original -----
De: "Jesús Para Fernández" <j.para.fernandez en hotmail.com>
Para: "Isidro Hidalgo Arellano" <ihidalgo en jccm.es>, r-help-es en r-project.org
Enviados: Lunes, 24 de Octubre 2016 10:00:29
Asunto: Re: [R-es] Quitar datos atípicos de una recta

Ok, lo pruebo y os digo...


Jes?s
#
Buenas Olivier


Te lo agradezco, pero no quiero aplicar una regresión robusta, ya que aunque parezca que siguen una regresión lineal (en el ejemplo lo siguen) en la realidad no sería ese tipo de curva.


Gracias

Jesús
#
Hola,

Otra alternativa que puedes utilizar es filtrar los datos que estén fuera
del IQR...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 24 de octubre de 2016, 11:03, Jesús Para Fernández <
j.para.fernandez en hotmail.com> escribió: