कैसे करने के लिए स्पष्ट को 50% की पंक्तियों का हिस्सा है कि एक निश्चित स्तंभ मान

Question 1

df.groupby(['target']).count()

लक्ष्य	डेटा
नकारात्मक	103210
सकारात्मक	211082

ठीक है अब, मेरी सकारात्मक डेटा बहुत बड़ा है. मैं चाहता हूँ को नष्ट करने के लिए 50% की पंक्तियों जिसका मूल्य में Target स्तंभ है Positive. मैं कैसे कर सकते हैं यह?

Question 2

रखने के लिए आधे के Positive पंक्तियों, sample का 50% Positive पंक्तियों का उपयोग कर frac=0.5 और drop उन अनुक्रमित:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

वास्तव में रखने के लिए 100K Positive पंक्तियों, sample 100K Positive पंक्तियों का उपयोग कर n=100_000 और concat के साथ उन्हें Negative पंक्तियाँ:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])

tdy · Answer 1 · 2021-11-24T04:27:20

रखने के लिए आधे के Positive पंक्तियों, sample का 50% Positive पंक्तियों का उपयोग कर frac=0.5 और drop उन अनुक्रमित:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

वास्तव में रखने के लिए 100K Positive पंक्तियों, sample 100K Positive पंक्तियों का उपयोग कर n=100_000 और concat के साथ उन्हें Negative पंक्तियाँ:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])

कैसे करने के लिए स्पष्ट को 50% की पंक्तियों का हिस्सा है कि एक निश्चित स्तंभ मान

सवाल

सबसे अच्छा जवाब

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में