[R-es] Ayuda para campo con numerico y texto con Problemas
Efectivamente siga el consejo de Javier, tiene datos no normalizados y por tanto le toca limpiar y preparar la informaci?n como sea necesaria. Pero tenga en cuenta que la falta de normalizaci?n har? que en todo caso solucione el problema para un caso en concreto, cuando trate de unir esos datos ?limpios? con otros, otra vez vuelta a empezar. Por normalizar entiendo en su contexto tener identificados al menos los municipios por un c?digo que puede ser el c?digo municipal. Por otro lado si tiene otro programa que le corrige los errores, ?selo o bien pase ese programa a R, si va a usar R es porque alguna ganancia debe reportarle Un saludo Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para Windows 10
De: R-help-es <r-help-es-bounces en r-project.org> en nombre de Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>
Enviado: Sunday, March 17, 2019 8:19:36 PM Para: Maria Ruiz Cc: r-help-es Asunto: Re: [R-es] Ayuda para campo con numerico y texto con Problemas Estimada Mar?a Ruiz. Lo m?s simple, si son pocos datos, arregle los datos con excel, una base de datos, etc. Limpieza de datos fuera de R. Luego, las palabras y su trabajo, mire tm, texto mining. Saludos Javier Rub?n Marcuzzi El dom., 17 de mar. de 2019 3:17 PM, Maria Ruiz <brew5157 en gmail.com> escribi?: > Hola a todos, > Soy nueva usando R y tengo unos problema en procesado de datos que quiero > hacer en R. > > Tengo un fichero de datos en formato texto separado con ; (punto y coma). > Este fichero contiene las columnas: > Poblacion;Sexo;Nota; EdadP, EdadM > Tengo 2 problemas que no se como tratar. > 1.- Problema > La columna *Poblacion* debo tenerla siempre con la primera letra en > may?sculas y tengo poblaciones que tiene art?culos o prepsosicones entre > medias como por ejemplo: ( de, del,, las...) > Albaida *de*l Aljarafe o Santa Cruz de Tenerife, tambien tengo algunas > con Valencia, valencia, y (blanco)Valencia o Valencia(blanco) > > > NO s? c?mo tratar este dato para que solo aparezca en La primera letra de > cada palabra y no los enlace o art?culos, es decir no debe aparecer: del o > de . > > 2,. Problema > La columna *Nota* por hay errores y los datos no todso son de tipo 7.8 o > 8.9 > Parece que han errores y tengo algunos 6,5 o 6,9 > ES decir han introducido la coma como separador decimal en vez de punto. > > Nota podria corregir los errores con otro programa pero quiero hacerlo > todo con R. > > Gracias y espero un pronta respuesta > Adjunto un troz del fichero > > > Un trozo de ejemplo del fichero : > > Poblacion;Sexo;Nota;EdadP;EdadM > > Valencia ;m;7.23;45;34 > > Albaida del Aljarafe;M;5.93;36;37 > > valencia;M;NA;34;35 > > Barcelona;M;6.33;37;29 > > Albalate de las Nogueras; M;8.93;35;26 > > Valencia ;M;7.23;29;44 > > Santa Cruz de Tenerife; M ;NA;26;23 > > Valencia;M;9.23;44;46 > > Valencia; M ;7.63;23;35 > > Valencia ;M;5.73;46;31 > > Valencia;M;5.03;35;35 > > Valencia;M;NA;31;-24 > > Valencia;M ;6.13;35;28 > > Albalate de las Nogueras; M;7.63;24;37 > > Valencia;M ;7.53;28;26 > > Valencia; M;6.33;37;20 > > Santa Cruz de Tenerife;M;5.33;26;25 > > Santa cruz de Tenerife; m;7.33;20;35 > > Santa Cruz de tenerife;M;8.23;-25;39 > > Santa cruz de tenerife;M ;6.93;35;36 > > valencia; M;5.33;39;44 > > Valencia; M;7.73;36;46 > > Valencia;M ;6.23;44;35 > > Valencia;M;6.43;40;31 > > Santa cruz de Tenerife; m;6.83;36;35 > > valencia;M;5,73;39;24 > > valencia;M;6.23;58;28 > > valencia ; m;7.03;50;37 > > Albalate de las Nogueras; m;7.33;20;35 > > Albaida del Aljarafe;M;8.23;25;39 > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es