Как выгрузить данные из Redshift в Parquet
В Amazon Redshift с недавних пор появились возможность выгрузить данные сразу в бинарный колоночный формат Parquet. Пример ниже:
UNLOAD (
'
SELECT
created_date,
campaign,
campaign_source,
placement,
installs,
payers,
revenue1,
revenue2
FROM big_data_table
')
TO 's3://big-data-bucket/unload/'
CREDENTIALS 'aws_access_key_id=<key>;aws_secret_access_key=<secret>'
FORMAT PARQUET
PARTITION BY created_date;