कैसे करने के लिए स्पष्ट को 50% की पंक्तियों का हिस्सा है कि एक निश्चित स्तंभ मान

0

सवाल

df.groupby(['target']).count()
लक्ष्य डेटा
नकारात्मक 103210
सकारात्मक 211082

ठीक है अब, मेरी सकारात्मक डेटा बहुत बड़ा है. मैं चाहता हूँ को नष्ट करने के लिए 50% की पंक्तियों जिसका मूल्य में Target स्तंभ है Positive. मैं कैसे कर सकते हैं यह?

dataframe drop pandas python
2021-11-24 03:30:28
1

सबसे अच्छा जवाब

6

रखने के लिए आधे के Positive पंक्तियों, sample का 50% Positive पंक्तियों का उपयोग कर frac=0.5 और drop उन अनुक्रमित:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

वास्तव में रखने के लिए 100K Positive पंक्तियों, sample 100K Positive पंक्तियों का उपयोग कर n=100_000 और concat के साथ उन्हें Negative पंक्तियाँ:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])
2021-11-24 04:27:20

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में