पुनरावृति से फ़ाइलें फ़ोल्डर और उन्हें प्रक्रिया स्काला में

0

सवाल

मैं एक जोड़ी के फ़ाइलों के लिए एक फ़ोल्डर में अलग-अलग देशों के. नीचे की तरह

Casedata_GBR_202110_timestamp.सीएसवी

Casedata_ARG_202110_timestamp.सीएसवी

अब मैं करने के लिए प्रक्रिया को ले इन फ़ाइलों की प्रक्रिया के द्वारा उन्हें देश बुद्धिमान और कॉपी करने के लिए संबंधित फ़ोल्डर. मेरे गंतव्य फ़ोल्डर संरचना तरह होगा

2021-->11-->GBR

2021-->11-->ARG

स्पार्क में स्काला/स्काला मेरी मदद करने के लिए कोड लिखने के लिए प्रक्रिया फ़ाइल देश से और स्थानांतरित करने के लिए संबंधित देश फ़ोल्डर ।

apache-spark scala
2021-11-24 06:42:17
1

सबसे अच्छा जवाब

0

यह की तरह लगता है आप के लिए देख रहे हैं partitionBy पर परिभाषित DataFrameWriter. से scaladoc:

def partitionBy(colNames: String*): DataFrameWriter[T]

विभाजन के उत्पादन के द्वारा दिए गए कॉलम फाइल सिस्टम पर. यदि निर्दिष्ट नहीं है, उत्पादन पर बाहर रखी है फाइल सिस्टम के लिए इसी तरह के छत्ते की विभाजन योजना. एक उदाहरण के रूप में, जब हम विभाजन डेटासेट द्वारा वर्ष और फिर महीने, निर्देशिका लेआउट की तरह लग रही होगी:

year=2016/month=01/
year=2016/month=02/

विभाजन में से एक है सबसे व्यापक रूप से इस्तेमाल किया तकनीकों का अनुकूलन करने के लिए शारीरिक डेटा लेआउट. यह प्रदान करता है एक भोंडा सूचकांक लंघन के लिए अनावश्यक डेटा पढ़ता है जब क्वेरीज़ है predicates पर partitioned स्तंभ हैं । के लिए आदेश में विभाजन करने के लिए अच्छी तरह से काम, की संख्या अलग मूल्यों प्रत्येक स्तंभ में होना चाहिए आम तौर पर कम से कम हजारों की दसियों.

इस पर लागू होता है के लिए सभी फ़ाइल-आधारित डेटा स्रोतों (जैसे लकड़ी की छत, JSON) के साथ शुरू चिंगारी 2.1.0.

2021-11-24 08:25:52

वहाँ वैसे भी है पाने के लिए की तरह 2016/01 और foreach मदद से पुनरावृति करने के लिए एक के बाद एक फाइल
Krishna Murthy

मैं करने के लिए है, प्रक्रिया एक एक करके फ़ाइल में dataframe और कॉपी में बूँद
Krishna Murthy

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में