गैर-सम में शामिल होने के दो तालिकाओं

Question 1

मैं 2 dataframes मैं कहाँ खोजने की जरूरत है कि कैसे कई बार प्रविष्टियों में नकली$num सीमा के भीतर गिर के x-y द्वारा निर्दिष्ट सीमा dataframe.

id <- c(1:9)
num <- c(99,101,199,250,999,1500,3000,4000,5000)
mock <- data.frame(id, num)

x <- c(100,100,200,1000,4000,4000)
y <- c(198,200,300,2000,5000,5000)
range <- data.frame(x,y)

वांछित आउटपुट के नीचे दिखाया गया है

id num check
1 99   0
2 101  2
3 199  1
4 250  1
5 999  0
6 1500 1
7 3000 0
8 4000 2
9 5000 2

जो द्वारा प्राप्त किया जा सकता निम्न कोड

mock$check <- mapply(
    function(x){
        count = 0
        for (i in 1:nrow(range)){
            if (x >= range$x[i] & x <= range$y[i]){
                count = count + 1
            }
        }
        paste0(count)
    },
    mock$num
)

उपरोक्त दृष्टिकोण के लिए अनुपयुक्त है, बड़े डेटासेट के कारण पाश के लिए और मैं कोशिश कर रहा था का उपयोग करने के लिए एक गैर-सम में शामिल होने विधि (के माध्यम से data.table). हालांकि, मैं फँस गया हूँ के रूप में करने के लिए कैसे करने के लिए एक गैर-सम में शामिल होने के दो तालिकाओं के बीच (नहीं यकीन है कि कैसे करने के लिए आगे बढ़ना करने के लिए...)

nonequi <- mock[range, on =.(num >= x, num <=y),]

होगा की तरह की तलाश करने के लिए कुछ मार्गदर्शन करने के लिए इस समस्या है. तुम्हारी मदद की सराहना.

Question 2

पहली बार गैर-सम में शामिल हों तो संक्षेप में प्रत्येक के लिए id कैसे कई बार यह प्रकट होता है और वापस शामिल होने के लिए mock पता लगाने के लिए जो आईडी के बाहर छोड़ दिया गया । उन लोगों के लिए ids सेट शून्य करने के लिए गिनती.

res <- setDT(mock)[setDT(range), .(id), on = .(num >= x, num <= y)][, .N, by = id][mock, on = .(id)][is.na(N), N := 0][]

Question 3

नहीं यकीन है कि के बारे में निष्पादन की गति के लिए बड़े डेटा सरणियों

id <- c(1:9)
num <- c(99,101,199,250,999,1500,3000,4000,5000)
mock <- data.frame(id, num)

x <- c(100,100,200,1000,4000,4000)
y <- c(198,200,300,2000,5000,5000)
RANGE <- data.frame(x,y)

mock$check <- sapply(mock$num, function(z) sum(z >= RANGE$x & z <= RANGE$y))

mock
#>   id  num check
#> 1  1   99     0
#> 2  2  101     2
#> 3  3  199     1
#> 4  4  250     1
#> 5  5  999     0
#> 6  6 1500     1
#> 7  7 3000     0
#> 8  8 4000     2
#> 9  9 5000     2

^{पर बनाया 2021-11-24 द्वारा reprex पैकेज (v2.0.1)}

det · Answer 1 · 2021-11-24T07:12:05

पहली बार गैर-सम में शामिल हों तो संक्षेप में प्रत्येक के लिए id कैसे कई बार यह प्रकट होता है और वापस शामिल होने के लिए mock पता लगाने के लिए जो आईडी के बाहर छोड़ दिया गया । उन लोगों के लिए ids सेट शून्य करने के लिए गिनती.

res <- setDT(mock)[setDT(range), .(id), on = .(num >= x, num <= y)][, .N, by = id][mock, on = .(id)][is.na(N), N := 0][]

Yuriy Saraykin · Answer 2 · 2021-11-24T07:20:12

नहीं यकीन है कि के बारे में निष्पादन की गति के लिए बड़े डेटा सरणियों

id <- c(1:9)
num <- c(99,101,199,250,999,1500,3000,4000,5000)
mock <- data.frame(id, num)

x <- c(100,100,200,1000,4000,4000)
y <- c(198,200,300,2000,5000,5000)
RANGE <- data.frame(x,y)

mock$check <- sapply(mock$num, function(z) sum(z >= RANGE$x & z <= RANGE$y))

mock
#>   id  num check
#> 1  1   99     0
#> 2  2  101     2
#> 3  3  199     1
#> 4  4  250     1
#> 5  5  999     0
#> 6  6 1500     1
#> 7  7 3000     0
#> 8  8 4000     2
#> 9  9 5000     2

^{पर बनाया 2021-11-24 द्वारा reprex पैकेज (v2.0.1)}

गैर-सम में शामिल होने के दो तालिकाओं

सवाल

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में