Snowflake Architecture: Multi-Cluster Shared Data & Virtual Warehouses

Architecture Diagram 1: Complete Snowflake Architecture

Architecture Diagram 2: Micro-Partition & Pruning Strategy

Architecture Diagram 3: Virtual Warehouse Scaling & Multi-Cluster

Architecture Diagram 4: Query Execution Lifecycle

Architecture Diagram 5: Three-Layer Architecture Stack

Architecture Diagram 6: Query Execution Lifecycle

Architecture Diagram 7: Cost Model & Credit Consumption

A micro-partition is a compressed, columnar data chunk (50–500 MB uncompressed) that serves as Snowflake's fundamental storage unit. Each micro-partition stores metadata including min/max values per column, distinct counts, and null counts, enabling partition pruning — skipping irrelevant micro-partitions during query execution.

A virtual warehouse is an independent compute cluster of 1–128 nodes, each containing CPU cores, RAM, and local SSD cache. Warehouses execute SQL queries and DML operations, scaling independently of storage. Multiple warehouses can access the same data simultaneously without contention.

Partition Pruning Formula

partitions\_scanned = total\_partitions \times filter\_selectivity

Warehouse Sizing Model

memory_per_vwh = base_memory × scaling_factor
base_memory = 2 GB (X-Small) × 2^(size_index) where size_index = 0..7
Scaling factors: XS=2 GB, S=4 GB, M=8 GB, L=16 GB, XL=32 GB, 2XL=64 GB, 3XL=128 GB, 4XL=256 GB
Credit rate = size_index × base_rate (~$0.00036/s per vCPU)
Max concurrent queries = 1 × 2^(size_index)

Snowflake's compute-storage separation means warehouses are ephemeral — they can be started, stopped, or resized independently of persistent cloud storage (S3/Azure/GCS). This enables true multi-tenancy where different workloads use isolated compute resources.

Three-layer design: Cloud Services (metadata/optimization), Query Processing (warehouses), Storage (micro-partitions)
Micro-partition pruning eliminates 80–95% of data before scanning via metadata
Multi-cluster warehouses auto-scale from 1 to N clusters based on queue depth
Result cache accelerates repeated identical queries with zero compute
Compression ratio of 4–6× across all data types reduces storage costs

Detailed Explanation

What is Snowflake's Architecture?

Snowflake implements a multi-cluster shared data architecture that completely separates compute from persistent cloud storage. This enables independent scaling of each layer without the trade-offs of traditional data warehouses.

The Three-Layer Architecture

Cloud Services Layer

Handles metadata operations, query parsing, optimization, and security
Fully managed by Snowflake across all availability zones
Maintains centralized metadata store (objects, access control, transactions)

Query Processing Layer

Contains virtual warehouses for SQL/DML execution
Each warehouse is independent (CPU, RAM, local SSD cache)
Scalable up (node size) or out (cluster count) independently

Storage Layer

Micro-partitioning: 50–500MB compressed columnar chunks
Automatic management — no user-defined partitions required
Rich metadata: min/max values, distinct counts, null counts per column

Micro-Partitioning and Automatic Clustering

Feature	Description
Compression	Run-length, dictionary, delta, ZSTD → 4–6× ratio
Automatic Organization	Data organized transparently on ingestion
Clustering Keys	User-defined keys optimize data locality
Background Process	Runs asynchronously, adapts to data/query patterns

Virtual Warehouse Architecture

Elastic compute — dynamically scales based on workload demands
Each node: CPU cores + RAM + local SSD cache for hot data
Multi-cluster warehouses auto-start/suspend clusters based on queue depth
True multi-tenancy: different workloads use isolated warehouses

Data Flow and Query Execution

Cloud services layer parses SQL and generates optimized query plan
Optimizer uses micro-partition metadata for partition pruning (80–95% data eliminated)
Virtual warehouse fetches required micro-partitions from cloud storage
Processes in parallel across all available nodes
Results cached at node, warehouse, and global levels

Key Takeaway: Snowflake's separation of compute and storage enables true multi-tenancy, elastic scaling, and cost-efficient query execution through micro-partition pruning.

Key Concepts Table

Component	Description	Scaling Behavior	Cost Model
Cloud Services	Metadata, security, query optimization	Automatic, serverless	Included in compute cost
Virtual Warehouse	Query execution, DML processing	Manual or auto-scale	Per-second billing (60s minimum)
Micro-Partition	50-500MB compressed columnar chunks	Automatic creation	Storage cost only
Result Cache	Query result caching	Automatic invalidation	No additional cost
Storage	Persistent cloud blob storage	Automatic expansion	Per TB per month

Warehouse Size	vCPU	Memory	Max Concurrent Queries
X-Small	1	2 GB	1
Small	2	4 GB	2
Medium	4	8 GB	4
Large	8	16 GB	8
X-Large	16	32 GB	16
2X-Large	32	64 GB	32
3X-Large	64	128 GB	64
4X-Large	128	256 GB	128

Metric	Value	Description
Compression Ratio	4-6x	Average compression across all data types
Micro-Partition Size	50-500 MB	Target size after compression
Partition Pruning	80-95%	Average data skipped during queries
Result Cache Hit Rate	30-70%	Depends on query repetition patterns
Fail-Safe Retention	7 days	Additional protection beyond Time Travel

Code Examples

-- Example 1: Create a multi-cluster warehouse with specific configuration
CREATE WAREHOUSE analytics_wh
    WAREHOUSE_SIZE = 'xlarge'
    MIN_CLUSTER_COUNT = 1
    MAX_CLUSTER_COUNT = 5
    SCALING_POLICY = 'ECONOMY'
    AUTO_SUSPEND = 300
    AUTO_RESUME = TRUE
    INITIALLY_SUSPENDED = FALSE
    RESOURCE_MONITOR = 'analytics_monitor'
    COMMENT = 'Multi-cluster warehouse for analytics workloads';

-- Example 2: Configure warehouse with advanced settings
CREATE WAREHOUSE etl_wh
    WAREHOUSE_SIZE = '2xlarge'
    MIN_CLUSTER_COUNT = 2
    MAX_CLUSTER_COUNT = 4
    SCALING_POLICY = 'STANDARD'
    AUTO_SUSPEND = 60
    AUTO_RESUME = TRUE
    STATEMENT_QUEUED_TIMEOUT_IN_SECONDS = 3600
    STATEMENT_TIMEOUT_IN_SECONDS = 86400
    COMMENT = 'ETL warehouse with aggressive scaling';

-- Example 3: Query micro-partition metadata
SELECT 
    partition_id,
    row_count,
    uncompressed_bytes,
    compressed_bytes,
    (uncompressed_bytes / compressed_bytes) as compression_ratio,
    created_time,
    last_modified_time
FROM TABLE(INFORMATION_SCHEMA.PARTITION_HISTORY(
    TABLE_NAME => 'sales_data',
    START_TIME => DATEADD(day, -7, CURRENT_TIMESTAMP())
))
ORDER BY created_time DESC;

-- Example 4: Analyze warehouse performance metrics
SELECT 
    warehouse_name,
    warehouse_size,
    cluster_number,
    AVG(queries_completed) as avg_queries,
    AVG(queued_overload_queries) as avg_queued,
    AVG(execution_time_ms) / 1000 as avg_exec_seconds,
    SUM(credits_used) as total_credits,
    AVG(bytes_scanned) / 1024 / 1024 / 1024 as avg_gb_scanned
FROM SNOWFLAKE.ACCOUNT_USAGE.WAREHOUSE_METERING_HISTORY
WHERE start_time >= DATEADD(day, -30, CURRENT_TIMESTAMP())
GROUP BY 1, 2, 3
ORDER BY total_credits DESC;

-- Example 5: Monitor auto-scaling events
SELECT 
    warehouse_name,
    event_name,
    event_timestamp,
    event_reason,
    cluster_number
FROM TABLE(INFORMATION_SCHEMA.WAREHOUSE_LOAD_HISTORY(
    START_TIME => DATEADD(hour, -24, CURRENT_TIMESTAMP())
))
WHERE event_name IN ('RESUME', 'SUSPEND', 'ADD_CLUSTER', 'REMOVE_CLUSTER')
ORDER BY event_timestamp DESC;

-- Example 6: Analyze partition pruning effectiveness
SELECT 
    query_id,
    query_text,
    partitions_scanned,
    partitions_total,
    (partitions_scanned / partitions_total) * 100 as scan_percentage,
    bytes_scanned / 1024 / 1024 as mb_scanned,
    compilation_time_ms,
    execution_time_ms
FROM SNOWFLAKE.ACCOUNT_USAGE.QUERY_HISTORY
WHERE start_time >= DATEADD(day, -1, CURRENT_TIMESTAMP())
  AND partitions_total > 0
ORDER BY scan_percentage DESC
LIMIT 100;

Performance Metrics

Metric	Target	Warning	Critical	Description
Query Queue Depth	< 5	5-10	> 10	Number of queries waiting to execute
Cluster Scaling Time	< 30s	30-60s	> 60s	Time to start additional cluster
Warehouse Utilization	60-80%	80-95%	> 95%	CPU/Memory utilization
Partition Pruning	> 80%	60-80%	< 60%	Percentage of partitions eliminated
Cache Hit Rate	> 50%	30-50%	< 30%	Result cache effectiveness
Auto-Suspend Delay	60-300s	300-600s	> 600s	Time before warehouse suspends

Best Practices

Right-size warehouses: Start with Medium for ad-hoc queries, scale up for batch ETL. Monitor queue depth to identify under-provisioned warehouses.
Use multi-cluster warehouses: Set MIN_CLUSTER_COUNT=1 and MAX_CLUSTER_COUNT=3-5 for concurrent workloads. Use SCALING_POLICY=ECONOMY for cost optimization.
Implement warehouse isolation: Create separate warehouses for different workloads (ETL, reporting, ad-hoc) to prevent resource contention and enable independent scaling.
Configure appropriate timeouts: Set STATEMENT_QUEUED_TIMEOUT for queries that shouldn't run indefinitely and STATEMENT_TIMEOUT to kill long-running queries.
Leverage result cache: Ensure identical queries can hit the cache by avoiding non-deterministic functions. Use QUERY_TAG to group similar queries.
Monitor partition pruning: Use QUERY_HISTORY to identify queries with poor pruning (< 60% data elimination). Consider adding clustering keys for frequently filtered columns.
Implement resource monitors: Set up alerts for credit consumption to prevent unexpected costs. Use MAX_CREDIT_QUOTA per warehouse for budget control.
Use automatic clustering: Define clustering keys on large tables (100GB+) that are frequently filtered. Start with low cardinality columns used in WHERE/JOIN clauses.
Optimize data placement: Distribute data across micro-partitions based on query patterns. Regularly review CLUSTERING_INFORMATION() for clustering depth and overlap metrics.
Cache management: Understand result cache invalidation rules (data modifications, DDL changes). Use PERSISTENT_RESULT_CACHE_VARCHAR for long-lived result sets.

Snowflake Architecture: Multi-Cluster Shared Data & Virtual Warehouses

Snowflake Architecture: Multi-Cluster Shared Data & Virtual Warehouses

Architecture Diagram 1: Complete Snowflake Architecture

Architecture Diagram 2: Micro-Partition & Pruning Strategy

Architecture Diagram 3: Virtual Warehouse Scaling & Multi-Cluster

Architecture Diagram 4: Query Execution Lifecycle

Architecture Diagram 5: Three-Layer Architecture Stack

Architecture Diagram 6: Query Execution Lifecycle

Architecture Diagram 7: Cost Model & Credit Consumption

Warehouse Sizing Model

Detailed Explanation

What is Snowflake's Architecture?

The Three-Layer Architecture

Micro-Partitioning and Automatic Clustering

Virtual Warehouse Architecture

Data Flow and Query Execution

Key Concepts Table

Code Examples

Performance Metrics

Best Practices

See Also

Premium Content

Need Expert Snowflake Help?