हाय, मैं एक तालिका बनाने के लिए एक सरल प्रश्न के साथ के रूप में नीचे:
select distinct
b.week_start_date,
count(distinct visitor_id) as uu,
count(distinct visit_id) as session,
sum(1) FILTER (WHERE event_name = 'pageview') AS pageview
from
table a
join
table b on a.date = b.cy_date_num_yyyymmdd
where
a.date between '20211107' and '20211113'
group by
1
हालांकि, मैं एक त्रुटि मिलती है
GENERIC_INTERNAL_ERROR: अंत सूचकांक (-2147483642) नहीं होना चाहिए नकारात्मक
और मैं की जरूरत करने के लिए मैन्युअल रूप से साफ डेटा से निर्दिष्ट स्थानों में प्रकट. एथेना को नष्ट नहीं होगा, डेटा, अपने खाते में.
तो मैं करने की कोशिश की करने के लिए बनाने के लिए एक सुपर रिक्त तालिका (क्वेरी नीचे) के साथ निर्धारित प्रारूप प्रत्येक मीट्रिक के लिए और फिर से ऊपर डालें क्वेरी में तालिका. लेकिन यह अभी भी रिटर्न एक ही त्रुटि है. कोई मेरी मदद कर सकता, इस समस्या को ठीक?
CREATE EXTERNAL TABLE IF NOT EXISTS database.super_table
(
week_start_date date,
uu bigint,
session bigint,
pageview bigint
)ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION
's3://abc-dataeng-temp-prod/xyz/product/'
TBLPROPERTIES (
'has_encrypted_data'='false',
'parquet.compression'='GZIP');