कैसे प्राप्त करने के लिए सूची आम दोस्तों की किसी भी जोड़ी के बीच में दोस्तों का उपयोग कर नेटवर्क pyspark

0

सवाल

मैं तीन रिकॉर्ड की तरह इस [('a1', ['b1', 'c1', 'd1', 'e1']), ('a2', ['b1', 'c2', 'd2', 'e1']),('a3', ['b1', 'c2', 'd1', 'e2'])] युक्त आईडी के लिए कुंजी के रूप में सूची के मानों में से प्रत्येक के लिए कुंजी ।

  1. मैं प्राप्त करना चाहते हैं की कुल संख्या के मूल्यों के लिए सूची में प्रत्येक कुंजी में pyspark.
  2. मैं कैसे प्राप्त कर सकते हैं की सूची आम दोस्तों के बीच किसी भी जोड़ी के fiends में pyspark.
key-value pyspark
2021-11-24 00:54:04
1

सबसे अच्छा जवाब

0

1 बस का उपयोग करें size समारोह.

df = df.withColumn('num_friends', F.expr('size(friends)'))

2 का उपयोग करें array_intersect समारोह प्राप्त करने के लिए चौराहे की सरणियों.

cp_df = df.toDF('key_pair', 'friends_pair')
cross_df = df.crossJoin(cp_df).filter('key!=key_pair')
cross_df = cross_df.select(F.create_map('key', 'key_pair').alias('key_pair'),
                           F.array_intersect('friends', 'friends_pair').alias('common_friends'))
cross_df.show(truncate=False)
2021-11-24 02:39:00

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में