Data

Sat, Mar 20, 2021 7:13 AM

Hi Enrico,

thanks for the feedback.
I am having something different here:
I would be grateful for your assistance.

res <- strsplit(as.character(my.data$Strike), ":")
#[[1]]
#[1] "character(0)"

#[[2]]
#[1] "c(\"CAP ATM Fwd\", \" -0.49%\")"

#[[3]]
#[1] "c(\"SWT 0.50% fwd\", \" 0.05%\")"

#[[4]]
#[1] "c(\"CAP ATM Fwd\", \" -0.46%\")"

#[[5]]
#[1] "c(\"SWT 0.50% fwd\", \" 0.08%\")"




col1 <- sapply(res, `[[`, 1L)

#> col1
#[1] "character(0)"                     "c(\"CAP ATM Fwd\", \" -0.49%\")"
 "c(\"SWT 0.50% fwd\", \" 0.05%\")"
#[4] "c(\"CAP ATM Fwd\", \" -0.46%\")"  "c(\"SWT 0.50% fwd\", \" 0.08%\")"
"c(\"CAP ATM Fwd\", \" -0.40%\")"
#[7] "c(\"SWT 0.50% fwd\", \" 0.11%\")" "c(\"CAP ATM Fwd\", \" -0.32%\")"
 "c(\"SWT 0.50% fwd\", \" 0.14%\")"
#[10] "c(\"CAP ATM Fwd\", \" -0.23%\")"  "c(\"SWT 0.50% fwd\", \" 0.17%\")"
"c(\"CAP ATM Fwd\", \" -0.14%\")"


col2 <- sapply(res, `[[`, 2L)


#Error in FUN(X[[i]], ...) : subscript out of bounds

col2 <- as.numeric(sub("%", "", col2, fixed = TRUE))/100
res <- data.frame(col1, col2)


#col1 col2
#1                  character(0)   NA
#2   c("CAP ATM Fwd", " -0.49%")   NA
#3  c("SWT 0.50% fwd", " 0.05%")   NA
#4   c("CAP ATM Fwd", " -0.46%")   NA
#5  c("SWT 0.50% fwd", " 0.08%")   NA
#6   c("CAP ATM Fwd", " -0.40%")   NA
#7  c("SWT 0.50% fwd", " 0.11%")   NA
#8   c("CAP ATM Fwd", " -0.32%")   NA

i <- seq(from = 1, to = nrow(res), by = 2)
res[i, ]
#col1 col2
#1                  character(0)   NA
#3  c("SWT 0.50% fwd", " 0.05%")   NA
#5  c("SWT 0.50% fwd", " 0.08%")   NA
#7  c("SWT 0.50% fwd", " 0.11%")   NA
#9  c("SWT 0.50% fwd", " 0.14%")   NA
#11 c("SWT 0.50% fwd", " 0.17%")   N
res[i + 1, ]

#2  c("CAP ATM Fwd", " -0.49%")   NA
#4  c("CAP ATM Fwd", " -0.46%")   NA
#6  c("CAP ATM Fwd", " -0.40%")   NA
#8  c("CAP ATM Fwd", " -0.32%")   NA
#10 c("CAP ATM Fwd", " -0.23%")   NA

Many thanks,
Emmanuel


The information transmitted is intended only for the person or entity
to which it is addressed and may contain confidential and/or
privileged material. Any review, retransmission, dissemination or
other use of, or taking of any action in reliance upon, this
information by persons or entities other than the intended recipient
is prohibited. If you received this in error, please contact the
sender and delete the material from any computer.







<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
Virus-free.
www.avast.com
<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
<#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>

On Sat, Mar 20, 2021 at 9:18 AM Enrico Schumann <es at enricoschumann.net>
wrote:

On Sat, 20 Mar 2021, Fianu, Emmanuel Senyo writes:

Hello Enrico,

here is a reproducible result:
As you could see, I have separated CAP ATM Fwd and SWT 0.5% fwd
Now, I move on to have two separate tables). I would be grateful for any
support.
Currently, I want to remove all:  "c(\"" and if necessary have decimals
instead of % symbols.
#my.data$Strike
#1  CAP ATM Fwd: -0.49%
#2 SWT 0.50% fwd: 0.05%
#  3  CAP ATM Fwd: -0.46%
#4 SWT 0.50% fwd: 0.08%
#  5  CAP ATM Fwd: -0.40%
#6 SWT 0.50% fwd: 0.11%


  txt0<-strsplit(as.character(df),'CAP ATM Fwd:', "")
#[[1]]
#[1] "c(\""                                     " -0.49%\", \"SWT 0.50%
fwd: 0.05%\", \""
#[3] " -0.46%\", \"SWT 0.50% fwd: 0.08%\", \""  " -0.40%\", \"SWT 0.50%
fwd: 0.11%\", \""
#[5] " -0.32%\", \"SWT 0.50% fwd: 0.14%\", \""  " -0.23%\", \"SWT 0.50%
fwd: 0.17%\", \""
#[7] " -0.14%\", \"SWT 0.50% fwd: 0.20%\", \""  " -0.05%\", \"SWT 0.50%
fwd: 0.23%\", \""
#[9] " 0.07%\", \"SWT 0.50% fwd: 0.25%\", \""   " 0.15%\", \"SWT 0.50%

fwd:

0.27%\", \""
#[11] " 0.22%\", \"SWT 0.50% fwd: 0.28%\", \""   " 0.29%\", \"SWT 0.50%
fwd: 0.28%\", \n\""
#[13] " 0.32%\", \"SWT 0.50% fwd: 0.28%\", \""   " 0.34%\", \"SWT 0.50%
fwd: 0.28%\", \""
#[15] " 0.35%\", \"SWT 0.50% fwd: 0.26%\", \""   " 0.33%\", \"SWT 0.50%
fwd: 0.25%\", \""
#[17] " 0.28%\", \"SWT 0.50% fwd: 0.22%\", \""   " 0.26%\", \"SWT 0.50%
fwd: 0.20%\", \""
#[19] " 0.21%\", \"SWT 0.50% fwd: 0.18%\", \""   " 0.13%\", \""

#[21] " 0.11%\", \""                             " 0.08%\")"

txt1<-strsplit(as.character(df),'SWT 0.50% fwd:',"x")
#[[1]]
#[1] "c(\"CAP ATM Fwd: -0.49%\", \""

#[2] " 0.05%\", \"CAP ATM Fwd: -0.46%\", \""

#[3] " 0.08%\", \"CAP ATM Fwd: -0.40%\", \""

#[4] " 0.11%\", \"CAP ATM Fwd: -0.32%\", \""

#[5] " 0.14%\", \"CAP ATM Fwd: -0.23%\", \""

#[6] " 0.17%\", \"CAP ATM Fwd: -0.14%\", \""

#[7] " 0.20%\", \"CAP ATM Fwd: -0.05%\", \""

#[8] " 0.23%\", \"CAP ATM Fwd: 0.07%\", \""

#[9] " 0.25%\", \"CAP ATM Fwd: 0.15%\", \""

#[10] " 0.27%\", \"CAP ATM Fwd: 0.22%\", \""

#[11] " 0.28%\", \"CAP ATM Fwd: 0.29%\", \""

#[12] " 0.28%\", \n\"CAP ATM Fwd: 0.32%\", \""

#[13] " 0.28%\", \"CAP ATM Fwd: 0.34%\", \""

#[14] " 0.28%\", \"CAP ATM Fwd: 0.35%\", \""

#[15] " 0.26%\", \"CAP ATM Fwd: 0.33%\", \""

#[16] " 0.25%\", \"CAP ATM Fwd: 0.28%\", \""

#[17] " 0.22%\", \"CAP ATM Fwd: 0.26%\", \""

#[18] " 0.20%\", \"CAP ATM Fwd: 0.21%\", \""

#[19] " 0.18%\", \"CAP ATM Fwd: 0.13%\", \"CAP ATM Fwd: 0.11%\", \"CAP

ATM

Fwd: 0.08%\")"
#df <- as.data.frame(my.data$Strike)
 #head(df)
#my.data$Strike
#1  CAP ATM Fwd: -0.49%
#2 SWT 0.50% fwd: 0.05%
#  3  CAP ATM Fwd: -0.46%
#4 SWT 0.50% fwd: 0.08%
#  5  CAP ATM Fwd: -0.40%
#6 SWT 0.50% fwd: 0.11%

  txt0<-strsplit(as.character(df),'CAP ATM Fwd:', "")

#[[1]]
#[1] "c(\""                                     " -0.49%\", \"SWT 0.50%
fwd: 0.05%\", \""
#[3] " -0.46%\", \"SWT 0.50% fwd: 0.08%\", \""  " -0.40%\", \"SWT 0.50%
fwd: 0.11%\", \""
#[5] " -0.32%\", \"SWT 0.50% fwd: 0.14%\", \""  " -0.23%\", \"SWT 0.50%
fwd: 0.17%\", \""
#[7] " -0.14%\", \"SWT 0.50% fwd: 0.20%\", \""  " -0.05%\", \"SWT 0.50%
fwd: 0.23%\", \""
#[9] " 0.07%\", \"SWT 0.50% fwd: 0.25%\", \""   " 0.15%\", \"SWT 0.50%

fwd:

0.27%\", \""
#[11] " 0.22%\", \"SWT 0.50% fwd: 0.28%\", \""   " 0.29%\", \"SWT 0.50%
fwd: 0.28%\", \n\""
#[13] " 0.32%\", \"SWT 0.50% fwd: 0.28%\", \""   " 0.34%\", \"SWT 0.50%
fwd: 0.28%\", \""
#[15] " 0.35%\", \"SWT 0.50% fwd: 0.26%\", \""   " 0.33%\", \"SWT 0.50%
fwd: 0.25%\", \""
#[17] " 0.28%\", \"SWT 0.50% fwd: 0.22%\", \""   " 0.26%\", \"SWT 0.50%
fwd: 0.20%\", \""
#[19] " 0.21%\", \"SWT 0.50% fwd: 0.18%\", \""   " 0.13%\", \""

#[21] " 0.11%\", \""                             " 0.08%\")"

txt1<-strsplit(as.character(df),'SWT 0.50% fwd:',"x")
#[[1]]
#[1] "c(\"CAP ATM Fwd: -0.49%\", \""

#[2] " 0.05%\", \"CAP ATM Fwd: -0.46%\", \""

#[3] " 0.08%\", \"CAP ATM Fwd: -0.40%\", \""

#[4] " 0.11%\", \"CAP ATM Fwd: -0.32%\", \""

#[5] " 0.14%\", \"CAP ATM Fwd: -0.23%\", \""

#[6] " 0.17%\", \"CAP ATM Fwd: -0.14%\", \""

#[7] " 0.20%\", \"CAP ATM Fwd: -0.05%\", \""

#[8] " 0.23%\", \"CAP ATM Fwd: 0.07%\", \""

#[9] " 0.25%\", \"CAP ATM Fwd: 0.15%\", \""

#[10] " 0.27%\", \"CAP ATM Fwd: 0.22%\", \""

#[11] " 0.28%\", \"CAP ATM Fwd: 0.29%\", \""

#[12] " 0.28%\", \n\"CAP ATM Fwd: 0.32%\", \""

#[13] " 0.28%\", \"CAP ATM Fwd: 0.34%\", \""

#[14] " 0.28%\", \"CAP ATM Fwd: 0.35%\", \""

#[15] " 0.26%\", \"CAP ATM Fwd: 0.33%\", \""

#[16] " 0.25%\", \"CAP ATM Fwd: 0.28%\", \""

#[17] " 0.22%\", \"CAP ATM Fwd: 0.26%\", \""

#[18] " 0.20%\", \"CAP ATM Fwd: 0.21%\", \""

#[19] " 0.18%\", \"CAP ATM Fwd: 0.13%\", \"CAP ATM Fwd: 0.11%\", \"CAP

ATM

Fwd: 0.08%\")"

Many thanks,
Emm

Hi Emm

try this:

    my.data <- list()
    my.data$Strike <- c("CAP ATM Fwd: -0.49%",
                        "SWT 0.50% fwd: 0.05%",
                        "CAP ATM Fwd: -0.46%",
                        "SWT 0.50% fwd: 0.08%",
                        "CAP ATM Fwd: -0.40%",
                        "SWT 0.50% fwd: 0.11%")
    res <- strsplit(my.data$Strike, ":")
    ## [[1]]
    ## [1] "CAP ATM Fwd" " -0.49%"
    ##
    ## [[2]]
    ## [1] "SWT 0.50% fwd" " 0.05%"
    ##
    ## [[3]]
    ## [1] "CAP ATM Fwd" " -0.46%"
    ##
    ## [[4]]
    ## [1] "SWT 0.50% fwd" " 0.08%"
    ##
    ## [[5]]
    ## [1] "CAP ATM Fwd" " -0.40%"
    ##
    ## [[6]]
    ## [1] "SWT 0.50% fwd" " 0.11%"

    col1 <- sapply(res, `[[`, 1L)
    col2 <- sapply(res, `[[`, 2L)
    col2 <- as.numeric(sub("%", "", col2, fixed = TRUE))/100
    res <- data.frame(col1, col2)
    ##            col1    col2
    ## 1   CAP ATM Fwd -0.0049
    ## 2 SWT 0.50% fwd  0.0005
    ## 3   CAP ATM Fwd -0.0046
    ## 4 SWT 0.50% fwd  0.0008
    ## 5   CAP ATM Fwd -0.0040
    ## 6 SWT 0.50% fwd  0.0011

If CAP and SWT rows alternate,  you can easily extract
every second row:

    i <- seq(from = 1, to = nrow(res), by = 2)
    res[i, ]
    ##           col1   col2
    ## 1 CAP ATM Fwd -0.0049
    ## 3 CAP ATM Fwd -0.0046
    ## 5 CAP ATM Fwd -0.0040
    res[i + 1, ]
    ##            col1   col2
    ## 2 SWT 0.50% fwd 0.0005
    ## 4 SWT 0.50% fwd 0.0008
    ## 6 SWT 0.50% fwd 0.0011


kind regards
    Enrico

On Fri, Mar 19, 2021 at 9:07 PM Enrico Schumann <es at enricoschumann.net>
wrote:

On Fri, 19 Mar 2021, Fianu, Emmanuel Senyo writes:

Hello Enrico,

thanks for the feedback: this is what I have:
As you can see we have to things here:

  "CAP ATM Fwd"   and  SWT 0.50% fwd

strsplit(as.character(df),':', '')# separate the column entry into
multiples specified but not organized into tables.
[[1]]
 [1] "c(\"CAP ATM Fwd"            " -0.49%\", \"SWT 0.50% fwd" "

0.05%\",

\"CAP ATM Fwd"    " -0.46%\", \"SWT 0.50% fwd"
 [5] " 0.08%\", \"CAP ATM Fwd"    " -0.40%\", \"SWT 0.50% fwd" "

0.11%\",

\"CAP ATM Fwd"    " -0.32%\", \"SWT 0.50% fwd"
 [9] " 0.14%\", \"CAP ATM Fwd"    " -0.23%\", \"SWT 0.50% fwd" "

0.17%\",

\"CAP ATM Fwd"    " -0.14%\", \"SWT 0.50% fwd"
[13] " 0.20%\", \"CAP ATM Fwd"    " -0.05%\", \"SWT 0.50% fwd" "

0.23%\",

\"CAP ATM Fwd"    " 0.07%\", \"SWT 0.50% fwd"
[17] " 0.25%\", \"CAP ATM Fwd"    " 0.15%\", \"SWT 0.50% fwd"  "

0.27%\",

\"CAP ATM Fwd"    " 0.22%\", \"SWT 0.50% fwd"

Many thanks
Emmanuel

(I put R-SIG-Finance into Cc. again.)


As I said, please provide a reproducible example: use
?dput to provide example data, and also describe what
you want to achieve.  Perhaps this helps:

  txt <- c("CAP ATM Fwd: -0.49%", "CAP ATM Fwd: -0.49%")
  spl <- strsplit(txt, ":", fixed = TRUE)
  ## [[1]]
  ## [1] "CAP ATM Fwd" " -0.49%"
  ##
  ## [[2]]
  ## [1] "CAP ATM Fwd" " -0.49%"

  sapply(spl, `[[`, 1)  ## column 1
  ## [1] "CAP ATM Fwd" "CAP ATM Fwd"

  sapply(spl, `[[`, 2)  ## column 2
  ## [1] " -0.49%" " -0.49%"

Now you can remove the '%' and call 'as.numeric' and so on....

[...]

On Fri, Mar 19, 2021 at 9:59 AM Enrico Schumann <

es at enricoschumann.net>

wrote:

On Fri, 19 Mar 2021, Fianu, Emmanuel Senyo writes:

Dear All,

Please, I am working on raw financial data and would  like to have

the

data

cleaned. I am working on it a bit further and will be very grateful

for

any

idea or support. Below are my codes and results.
I would like to have the numbers  after the semi-columns separate.


Strike<-unlist(c(my.data$Strike))
#
#
Strike <- sapply(Strike[], trimws) # l??scht ??berfl??ssige

Leerzeichen

Strike <- Strike[-1] # l??scht die erste Zeile

 CAP ATM Fwd: -0.49%                SWT 0.50% fwd: 0.05%
              "CAP ATM Fwd: -0.49%"              "SWT 0.50% fwd:

0.05%"

        CAP ATM Fwd: -0.46%                SWT 0.50% fwd: 0.08%
              "CAP ATM Fwd: -0.46%"              "SWT 0.50% fwd:

0.08%"

        CAP ATM Fwd: -0.40%                SWT 0.50% fwd: 0.11%
              "CAP ATM Fwd: -0.40%"              "SWT 0.50% fwd:

0.11%"

        CAP ATM Fwd: -0.32%                SWT 0.50% fwd: 0.14%
              "CAP ATM Fwd: -0.32%"              "SWT 0.50% fwd:

0.14%"

        CAP ATM Fwd: -0.23%                SWT 0.50% fwd: 0.17%
              "CAP ATM Fwd: -0.23%"              "SWT 0.50% fwd:

0.17%"

        CAP ATM Fwd: -0.14%                SWT 0.50% fwd: 0.20%
              "CAP ATM Fwd: -0.14%"              "SWT 0.50% fwd:

0.20%"

        CAP ATM Fwd: -0.05%                SWT 0.50% fwd: 0.23%
              "CAP ATM Fwd: -0.05%"              "SWT 0.50% fwd:

0.23%"

         CAP ATM Fwd: 0.07%                SWT 0.50% fwd: 0.25%
               "CAP ATM Fwd: 0.07%"              "SWT 0.50% fwd:

0.25%"

Many thanks
Emmanuel

Please provide a reproducible example, so that people can help you.

(It's not what you have written, but did you mean "the
 numbers after the colons"? Then perhaps look at
 ?strsplit :

   strsplit("CAP ATM Fwd: -0.49%", split = ":", fixed = TRUE)
   ## [[1]]
   ## [1] "CAP ATM Fwd" " -0.49%"

   sapply(strsplit("CAP ATM Fwd: -0.49%", ":", fixed = TRUE), `[[`,

2L)

   ## [1] " -0.49%"

)

--
Enrico Schumann
Lucerne, Switzerland
http://enricoschumann.net

<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
Virus-free.
www.avast.com
<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
<#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>

Data

Thread (5 messages)