Database MongoDB

Cài đặt Sharding trong MongoDB với Docker Compose

Thương Phạm

27/03/2024

3 Min Read

267 Views

0 Comments

Table Of Content

Giới thiệu về Sharding
Chuẩn bị
Tạo Docker Compose file
Cấu hình Sharding
Kết luận

Giới thiệu về Sharding

Sharding trong MongoDB là một kỹ thuật lưu trữ và xử lý dữ liệu, cho phép chia nhỏ dữ liệu ra thành nhiều phần (shards) và phân tán chúng trên nhiều máy chủ khác nhau. Điều này giúp tăng khả năng mở rộng quy mô của cơ sở dữ liệu, cải thiện hiệu suất và đảm bảo tính khả dụng cao.

Khi sử dụng sharding, dữ liệu sẽ được chia nhỏ thành nhiều phần dựa trên một trường nhất định (shard key), và mỗi phần sẽ được lưu trữ trên một shard riêng biệt. MongoDB sẽ tự động phân phối dữ liệu giữa các shards, đồng thời cung cấp một lớp trừu tượng để người dùng có thể tương tác với dữ liệu như thể chúng vẫn nằm trong một cơ sở dữ liệu duy nhất.

Quá trình sharding trong MongoDB bao gồm các thành phần chính sau:

Shards: Là các phân đoạn dữ liệu, mỗi shard chứa một phần của dữ liệu.
Shard Key: Là trường dữ liệu được sử dụng để chia nhỏ dữ liệu, dựa trên giá trị của trường này, MongoDB sẽ quyết định đặt một tài liệu vào shard nào.
Mongos: Đóng vai trò là router, nhận các truy vấn từ ứng dụng và điều phối chúng đến các shards thích hợp.
Config Servers: Lưu trữ các metadata về cluster sharding, bao gồm thông tin về các shards và cách phân phối dữ liệu giữa chúng.

Sharding giúp gia tăng khả năng mở rộng quy mô của MongoDB bằng cách cho phép thêm nhiều máy chủ để lưu trữ dữ liệu. Nó cũng cải thiện hiệu suất bằng cách phân tán tải trên nhiều máy chủ, giảm bớt áp lực trên một máy chủ duy nhất. Tuy nhiên, sharding cũng đem lại một số phức tạp nhất định, vì vậy bạn cần cân nhắc kỹ lưỡng trước khi quyết định sử dụng nó cho dự án của mình.

Chuẩn bị

Trước khi bắt đầu, bạn cần cài đặt Docker và Docker Compose trên máy của mình. Sau đó, tạo một thư mục mới và di chuyển vào thư mục đó.

Tạo Docker Compose file

Tạo một file mới có tên nano docker-compose.yml

Thêm cấu hình sau vào file version: '3' services: mongo-1: image: mongo:4.4 restart: always command: mongod --shardsvr --replSet rs1 ports: - 27017:27017 mongo-2: image: mongo:4.4 restart: always command: mongod --shardsvr --replSet rs2 ports: - 27018:27018 mongo-3: image: mongo:4.4 restart: always command: mongod --shardsvr --replSet rs3 ports: - 27019:27019 mongo-router: image: mongo:4.4 restart: always command: mongos --configdb rs1/mongo-1:27017,rs2/mongo-2:27018,rs3/mongo-3:27019 --bind_ip_all ports: - 27020:27020 depends_on: - mongo-1 - mongo-2 - mongo-3 Giải thích: Chúng ta sẽ tạo ra 3 replicas sets (rs1, rs2, rs3), mỗi replica set có 1 node duy nhất. Mỗi node sẽ chạy trong một container Docker riêng biệt với cổng được ánh xạ tương ứng. Container Tùy chọn docker-compose up -d Lệnh này sẽ khởi chạy tất cả các container trong nền (detached mode).

Cấu hình Sharding Kết nối vào mongo-router docker exec -it <container_id> mongo Trong đó, . Khởi tạo replicas sets sh.addShard("rs1/mongo-1:27017") sh.addShard("rs2/mongo-2:27018") sh.addShard("rs3/mongo-3:27019") Bật sharding cho database Giả sử bạn muốn bật sharding cho database sh.enableSharding("mydb") Chọn một collection để shard Ví dụ, chúng ta sẽ shard trên collection : sh.shardCollection("mydb.users", { "_id": "hashed" }) Kiểm tra trạng thái sharding sh.status() Lệnh này sẽ hiển thị thông tin về các shards, databases và collections đã được shard. Kết luận Bằng cách sử dụng Docker Compose, bạn có thể dễ dàng cài đặt một môi trường sharding trong MongoDB. Việc chia nhỏ dữ liệu ra thành nhiều shards giúp tăng khả năng mở rộng quy mô, cải thiện hiệu suất và đảm bảo tính khả dụng cao cho ứng dụng của bạn. Hãy nhớ rằng, sharding cũng đi kèm với một số phức tạp nhất định, do đó, bạn nên cân nhắc kỹ lưỡng trước khi quyết định sử dụng nó cho dự án của mình. Last Update: 29/05/2024 dockerdocker composeMongoDBSharding