Dizede bir karakterin konumunu bulun


88

Bir dizedeki bir karakterin yerini bulmak istiyorum.

Söyle: string = "the2quickbrownfoxeswere2tired"

Ben dönmek için işlevini istiyorum 4ve 24karakteri konumunu - 2in s string.


Neden normal ifade kullanmalı? R'de .indexOf()falan yok mu?
2013

2
Şüpheliyim. Geliştiriciler Nixers'dı ve herkesin regex'i bildiğini varsaydılar. R'nin dizgi kullanımı biraz karışık.
IRTFM

Yanıtlar:


116

Kullanabilirsiniz gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

veya belki için bir sarmalayıcı olan str_locate_allpaketten ( sürüm 1.0'dan itibaren)stringrgregexpr stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

sadece kullanabileceğinizi unutmayın stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

Tabandaki başka bir seçenek Rde şöyle bir şey olabilir

lapply(strsplit(x, ''), function(x) which(x == '2'))

çalışmalı (bir karakter vektörü verildiğinde x)


İlk 3 çözümünüzün döndürdüğü listelerden / nesnelerden tam sayıları nasıl çıkarabiliriz?
3pitt

Tam sayıları kolayca elde etmek için regexpryerine kullanın gregexpr. Veya unlistçıktıda aşağıdaki başka bir cevapta belirtildiği gibi kullanın .
Arani

43

İşte başka bir basit alternatif.

> which(strsplit(string, "")[[1]]=="2")
[1]  4 24

Ne yaptığını açıklayabilir misin [[1]]?
francoiskroll

@francoiskroll, [[1]] listenin ilk öğesini temsil eder.
Prafulla

20

Unlist kullanarak çıkışı sadece 4 ve 24 yapabilirsiniz:

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

3

str1'de str2'nin n'inci oluşumunun konumunu bulun (Oracle SQL INSTR ile aynı parametre sırası), bulunamazsa 0 döndürür

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

2

Yalnızca ilk konumları bulmak için lapply()şununla kullanın min():

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

Yalnızca son konumları bulmak için lapply()şununla kullanın max():

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

1

Sen de kullanabilirsin grep:

grep('2', strsplit(string, '')[[1]])
#4 24
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.