1. 程式人生 > >R語言筆記:[[ :punct: ]]在gsub中的使用

R語言筆記:[[ :punct: ]]在gsub中的使用

[[ :punct: ]]和眾多regex類似,這個表示所有的標點符號。

在資料分析時,如果你不需要句子裡的標點,可以使用:

gsub("[[:punct:]]", "", x)  #這裡將x資料裡的所有標點符號變成“”(空)。

如下:

x<- 'hello.+$%..world'

gsub("[[:punct:]]", "", x)  #結果為 "helloworld"

可以看到,所有標點符號都被消除了

如果想在中間加一個空格(為了美觀),我們可以寫成:

x<- 'hello.+$%..world'

gsub("[[:punct:]]+", " ", x)  #結果為 "hello world"