Sự khác biệt giữa Lược đồ ngôi sao và Bông tuyết

Kho dữ liệu là một hệ thống được thiết kế để lưu trữ và sắp xếp dữ liệu trong kho trung tâm bao gồm dữ liệu từ các nguồn khác. Đó là một khái niệm cốt lõi về trí tuệ kinh doanh trong các mô hình cơ sở dữ liệu quan hệ sử dụng các kỹ thuật phân tích để tích hợp dữ liệu kinh doanh vào cơ sở dữ liệu trung tâm.

Có hai mô hình kiến ​​trúc phổ biến được sử dụng trong kho dữ liệu:

  • Lược đồ sao
  • Lược đồ bông tuyết

Cả hai đều là các mô hình cơ sở dữ liệu đa chiều phổ biến được sử dụng để giải quyết các nhu cầu của cơ sở dữ liệu lớn cho mục đích phân tích trong kho dữ liệu thực.

Chúng tôi trình bày một so sánh không thiên vị giữa hai để hiểu rõ hơn cái nào tốt hơn cái kia.

Lược đồ sao là gì?

Đây là mô hình kiến ​​trúc phổ biến và được chấp nhận rộng rãi nhất được sử dụng để phát triển kho dữ liệu và dữ liệu trong đó dữ liệu được sắp xếp thành các sự kiện và kích thước. Đây là mô hình kiến ​​trúc đơn giản nhất trong đó một bảng thực tế được sử dụng để chỉ các bảng nhiều chiều, mô phỏng theo mô hình ngôi sao.

Như tên cho thấy, sơ đồ giống như một ngôi sao với bảng thực tế ở giữa và các bảng nhiều chiều tỏa ra từ nó, tạo ra một mô hình giống như một ngôi sao.

Nó còn được gọi là Lược đồ Star Join và nó lưu trữ tất cả các thuộc tính của thứ nguyên vào một bảng thực tế không chuẩn hóa để nhanh chóng điều hướng qua các tập dữ liệu đa chiều lớn, chiếm thời gian phản hồi truy vấn nhanh.

Lược đồ bông tuyết là gì?

Nó là một phần mở rộng của lược đồ sao với các chức năng được thêm vào. Không giống như lược đồ sao, các bảng kích thước trong lược đồ bông tuyết được chuẩn hóa thành nhiều bảng có liên quan.

Mô hình kiến ​​trúc biểu thị sự sắp xếp logic của các bảng theo phân cấp mối quan hệ nhiều-một trong đó các bảng nhiều chiều được chuẩn hóa thành các bảng thứ nguyên, giống như một mô hình giống như bông tuyết, do đó có tên.

Đây là một phiên bản phức tạp hơn của lược đồ sao với nhiều phép nối giữa các bảng thứ nguyên chiếm thời gian xử lý chậm để tìm nạp dữ liệu có nghĩa là thời gian phản hồi truy vấn chậm. Nó giảm thiểu sự dư thừa dữ liệu từ đó cải thiện hiệu năng truy vấn.

Sự khác biệt giữa Lược đồ ngôi sao và Bông tuyết

Kiến trúc của Star and Snowdrops Schema

Trong các cơ sở dữ liệu quan hệ, lược đồ sao là mô hình kiến ​​trúc đơn giản nhất được sử dụng để phát triển kho dữ liệu và các dữ liệu đa chiều. Như tên cho thấy, mô hình giống như một ngôi sao với các điểm tỏa ra từ trung tâm có nghĩa là bảng thực tế là trung tâm và các điểm là các bảng kích thước. Giống như các mô hình thứ nguyên khác, nó bao gồm dữ liệu ở dạng sự kiện và kích thước. Mặt khác, lược đồ Bông tuyết là mô hình kiến ​​trúc phức tạp hơn đề cập đến một cơ sở dữ liệu đa chiều với sự sắp xếp logic của các bảng dưới dạng một bông tuyết.

Bảng kích thước

Lược đồ bông tuyết khá giống với lược đồ sao ngoại trừ nó có thể có nhiều hơn một bảng thứ nguyên được tiếp tục chuẩn hóa thành nhiều bảng có liên quan được gọi là bảng thứ nguyên phụ. Nó đại diện cho nhiều cấp độ của mối quan hệ phân nhánh thành một mô hình bông tuyết. Tuy nhiên, lược đồ sao lưu trữ tất cả các thuộc tính có liên quan của thứ nguyên vào một bảng thứ nguyên không chuẩn hóa, giúp dễ hiểu và xử lý các truy vấn đơn giản hơn.

Mô hình kinh doanh của Star and Snowdrops Schema

Bảng thứ nguyên không thể chứa các hàng trùng lặp trong các mô hình cơ sở dữ liệu quan hệ vì thực tế đơn giản là nó có thể tạo ra sự mơ hồ khi truy xuất. Mỗi bảng nên có một cột hoặc một tổ hợp các cột được gọi là khóa chính xác định duy nhất tất cả các bản ghi bảng. Khóa ngoại là một cột hoặc một nhóm các cột cung cấp một liên kết giữa hai bảng. Trong lược đồ sao, mỗi bảng thứ nguyên có một khóa chính có liên quan đến khóa ngoại trong bảng thực tế. Hệ thống phân cấp doanh nghiệp trong lược đồ bông tuyết được biểu thị bằng mối quan hệ khóa chính / khóa ngoại giữa các bảng thứ nguyên.

Tính toàn vẹn dữ liệu trong Lược đồ sao và bông tuyết

Sự khác biệt chính giữa hai mô hình cơ sở dữ liệu quan hệ là chuẩn hóa. Các bảng thứ nguyên trong lược đồ sao không được chuẩn hóa, có nghĩa là mô hình kinh doanh sẽ sử dụng nhiều không gian hơn để lưu trữ các bảng thứ nguyên và nhiều không gian hơn có nghĩa là các bản ghi dư thừa mà cuối cùng sẽ gây ra sự không nhất quán. Mặt khác, lược đồ bông tuyết, giảm thiểu sự dư thừa dữ liệu vì các bảng kích thước được chuẩn hóa, chiếm các bản ghi dự phòng ít hơn nhiều. Hệ thống phân cấp kinh doanh và kích thước của nó được bảo toàn thông qua quan hệ toàn vẹn tham chiếu có nghĩa là có thể được cập nhật độc lập trong kho dữ liệu.

Hiệu suất truy vấn

Lược đồ sao có ít phép nối giữa bảng thứ nguyên và bảng thực tế so với lược đồ bông tuyết có nhiều phép nối chiếm ít phức tạp truy vấn hơn. Vì các kích thước trong lược đồ sao được liên kết thông qua bảng thực tế trung tâm, nên nó có đường dẫn nối rõ ràng có nghĩa là thời gian phản hồi truy vấn nhanh và thời gian phản hồi nhanh có nghĩa là hiệu suất tốt hơn. Lược đồ Bông tuyết có số lượng tham gia cao hơn nên thời gian phản hồi truy vấn lâu hơn dẫn đến các truy vấn phức tạp hơn, cuối cùng làm ảnh hưởng đến hiệu suất.

Lược đồ hình sao so với Lược đồ bông tuyết: Biểu đồ so sánh


Tóm tắt các câu thơ Star Snowema Schema

Cả hai đều là mô hình kiến ​​trúc phổ biến nhất và được áp dụng rộng rãi được sử dụng để phát triển kho cơ sở dữ liệu và dữ liệu. Tuy nhiên, mọi mô hình kinh doanh đều có những ưu và nhược điểm hợp lý. Mặc dù lược đồ sao là mô hình đa chiều đơn giản nhất được sử dụng để sắp xếp dữ liệu thành các sự kiện và kích thước, nhưng đó là lý tưởng để phát triển các biểu đồ dữ liệu liên quan đến các mối quan hệ ít phức tạp hơn. Lược đồ bông tuyết là một biểu diễn logic của các bảng trong cơ sở dữ liệu đa chiều, trong đó các kích thước được lưu trữ trong các bảng thứ nguyên phụ. Sự khác biệt chính giữa hai là bình thường hóa. Các bảng kích thước trong lược đồ bông tuyết được chuẩn hóa hoàn toàn thành nhiều bảng tra cứu, trong khi đó trong lược đồ sao, các bảng kích thước được chuẩn hóa thành một bảng thực tế trung tâm.