अजगर पंडों str.शामिल हैं() हाइपरलिंक के साथ पंक्तियों में

0

सवाल

मैं दो पंडों dataframes की तरह तो:

df1

साइट लिंक
retailer_site1 https://www.retailer_site1.com
... ...
retailer_siteX https://www.retailer_siteX.com

df2

साइट लिंक
retailer_site1 https://www.retailer_site1.com
... ...
retailer_siteY https://www.retailer_siteY.com

तो मैं जाने के लिए चाहते हैं के माध्यम से df2 और खोजने के उदाहरणों से लिंक df2 में df1. यहाँ अपने कोड:

    for row in df2['link'].astype(str):
        boolean_findings = df1['link'].str.contains(row)

जब मैं प्रिंट boolean_findings, मैं कर रहा हूँ, सब झूठे है, जो मुझे पता है कि सच नहीं हो सकता क्योंकि मैं देख रहा हूँ मैचों पर स्थानीय रूप से अपने एक्सेल फाइल:

boolean_findings
झूठी
झूठी
...
झूठी

मैं क्या करना चाहते हैं पता है क्यों हाइपरलिंक पाठ स्ट्रिंग नहीं है, मिलान किया जा रहा है के साथ यह बराबर पर पहली लोमो, और मैं क्या कर सकते हैं मैच के लिए साइटों.

dataframe hyperlink pandas python
2021-10-22 22:50:57
1

सबसे अच्छा जवाब

1

"मैं एक नज़र लिया और पाया कुछ वेबसाइटों है एक ( और ) में शामिल है, उनके लिंक हो सकता है, जो दूर फेंक लिंक

ऐसा लगता है आप की जरूरत करने के लिए केवल खाते के लिए अक्षरांकीय/अंडरस्कोर वर्ण की तुलना करते समय दिए गए लिंक का उपयोग कर सकते हैं

df2["link"].str.replace(r'\W+','', regex=True).isin(
    df1["link"].str.replace(r'\W+','', regex=True))

के .str.replace(r'\W+','', regex=True) हिस्सा निकाल देंगे किसी भी वर्ण के अलावा अन्य पत्र, विशेषक, अंक और कनेक्टर विराम चिह्न (सबसे आम चार अंडरस्कोर उन के बीच में) से लिंक.

2021-10-23 10:27:53

मैं निम्नलिखित त्रुटि के लिए regex में बदलें: TypeError: replace() takes no keyword arguments. जब मैं दूर regex=True, यह नहीं करता है, त्रुटि, लेकिन यह नहीं करता है, यह जगह या तो. मुझे लगता है कि मैं में देखो re मॉड्यूल के लिए इस तरह बाहर है, लेकिन डालने के लिए धन्यवाद मुझे सही रास्ते पर!
G H

@GH सुनिश्चित करें कि आप नवीनतम का उपयोग पांडा संस्करण है । pip install -U pandas. यह कोड का परीक्षण किया गया है के खिलाफ अपने डेटा और साबित काम करने के लिए.
Wiktor Stribiżew

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में