राशि की गणना के समय की एक शब्द में प्रकट होता है BigQuery स्तंभ

0

सवाल

मैं एक स्तंभ के साथ कुछ लंबी तार और गिनती करने की आवश्यकता है सबसे अधिक इस्तेमाल किया शब्दों में यह.

मैं की जरूरत है कि कुछ इस तरह काम करता है https://towardsdatascience.com/very-simple-python-script-for-extracting-most-common-words-from-a-story-1e3570d0b9d0. शब्द गिनती के भाग में कम से कम...

और यह बहुत महत्वपूर्ण है कि मैं करने के लिए विकल्प है ब्लैकलिस्ट कुछ शब्द तो वे गिनती नहीं है.

google-bigquery
2021-11-23 18:33:36
1

सबसे अच्छा जवाब

2

कोशिश नीचे दिए गए सरल दृष्टिकोण

with blacklist as (
  select 'with' word union all 
  select 'that' union all
  select 'add more as you see needed'
)
select lower(word) word, count(*) frequency
from data, unnest(regexp_extract_all(col, r'[\w]*')) word
where length(word) > 3  
and word not in (select word from blacklist)
group by word
order by frequency desc     

 
2021-11-23 22:40:30

यह काम नहीं... वाक्यांशों पुर्तगाली में हैं, यह हो सकता है समस्या है? या शायद मैं नहीं था सही substituion पर अपने कोड idk
Murilo

), काली सूची के रूप में ( का चयन करें 'के साथ' शब्द संघ के सभी का चयन करें 'कि' संघ के सभी जोड़ें 'का चयन करें और अधिक देखने के रूप में आप की जरूरत है' ) का चयन करें कम(शब्द) शब्द, गिनती() आवृत्ति से T0, unnest(regexp_extract_all(T0.स्तंभ, r'[\डब्ल्यू]')) शब्द है, जहां की लंबाई(word) > 3 और शब्द में नहीं का चयन करें (शब्द से काला सूची में डालना) समूह द्वारा शब्द क्रम से आवृत्ति desc ///मैं इस की कोशिश की..
Murilo

कृपया अधिक विशिष्ट हो - तुम क्या मतलब है "यह काम नहीं"? प्रदान करते हैं उदाहरण के इनपुट डेटा । आदि....
Mikhail Berlyant

मेरा बुरा है, मैं यह संदेश प्राप्त होता है "इस प्रश्न का कोई परिणाम नहीं लौटा".
Murilo

कभी मन, मैं एक गलती पर मेरा मूल प्रश्न है, यह पूरी तरह से काम करता अब, बहुत बहुत धन्यवाद
Murilo

धन्यवाद आप के लिए इस बात की पुष्टि. खुशी है कि यह काम करता है आप के लिए. विचार भी मतदान जवाब अगर यह मदद मिली है :ओ)
Mikhail Berlyant

btw, im पर देख रहे हैं परिणाम और कोड काटना है कि शब्दों के होते हैं कुछ "ब्राजील पत्र" की तरह "Ç" "एक" "ओ", वहाँ एक तरीका है इसे बनाने के लिए उन पर विचार करें. में एक शब्द की तरह "informação", यह मायने रखता है के रूप में "सूचना"
Murilo

यकीन है कि साध्य जाँच करेगा, शीघ्र ही. लेकिन इस बीच मेरे लिए मेरे अन्य जवाब के इलाज के लिए कैसे लहजे, आदि. यह होना चाहिए कम से कम कुछ जवाब करने के लिए संबंधित है कि :ओ)
Mikhail Berlyant

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में