1 RAID LÀ GÌ?
RAID (Redundant Arrays of Inexpensive Disks hoặc Redundant Arrays of Independent Disks) là hình thức cho phép gom nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa logic nhằm mục đích gia tăng tốc độ truy xuất dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc đôi lúc kết hợp cả hai yếu tố trên.
Raid được phát triển theo theo nhiều chuẩn khác nhau, mỗi chuẩn lại có sự khác biệt về hiệu năng, dung lượng lưu trữ và độ tin cậy. Có thể gom thành hai hướng phát triển RAID như sau
- RAID theo chuẩn chung
- RAID cải tiến và phát triển theo chuẩn riêng
Sau đây, chúng ta sẽ cùng đi vào chi tiết
2 CÁC CHUẨN RAID CHUNG
2.1 RAID 0
Đây là dạng RAID mang lại hiệu suất trao đổi dữ liệu cao nhất.
Raid 0 cần tối thiểu hai đĩa cứng, RAID 0 cho phép máy tính ghi dữ liệu theo phương thức đặc biệt được gọi là Striping. Ví dụ bạn có 8 đoạn dữ liệu được đánh số từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ hai, giúp giảm một nửa thời gian làm việc theo lý thuyết
Tổng quát là với n đĩa cứng thì mỗi đĩa chỉ cần phải đọc/ghi 1/n lượng dữ liệu được yêu cầu. Lý thuyết thì tốc độ sẽ tăng n lần..
Tuy vậy RAID 0 lại có nguy cơ mất dữ liệu cao, nguyên nhân chính nằm ở cách ghi thông tin xé lẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa cứng nào và mỗi khi cần truy xuất thông tin (ví dụ một file nào đó), máy tính sẽ phải tổng hợp từ các đĩa cứng.
Chỉ cần một đĩa cứng gặp trục trặc thì thông tin (file) đó coi như không thể đọc được và hư hoàn toàn dữ liệu.
Dung lượng cuối cùng của hệ thống RAID 0 bằng tổng dung lượng của các ổ đơn (hai ổ 80GB chạy RAID 0 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 160GB).
Có thể thấy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, video số.
2.2 RAID 1
Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu.
Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường. Bạn có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin hư hỏng.
Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là lựa chọn không thể thiếu.
Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB).
2.3 RAID 2
Cơ chế kiểm tra lỗi của loại raid này ở mức Bit sử dụng cơ chế Hamming code, nhưng gần như mặc định các ổ cứng hiện tại đều đã tích hợp kiểm tra mức Bit bằng Hamming code do vậy loại Raid này hiện nay không còn được sử dụng nữa.
2.4 RAID 3
Đây là loại raid đầu tiên sử dụng cơ chế dự phòng dữ liệu bằng Parity.
Parity là kết quả được tạo ra bằng việc tính toán XOR giữa các bit trong block dữ liệu đã lưu trữ. Ví dụ một file dữ liệu được chia làm 1 block lưu trữ trong 6 phần, phần lưu trữ từ Block A1 – A3 lưu trên 3 ổ cứng thì Raid 3 sẽ tính toán XOR của các bit trong từ Block 1 à 3 này thành một block parity lưu trữ trên ổ cứng thứ 4.
Khi xảy ra hư hỏng thì hệ thống sẽ tính toán lại dữ liệu từ phép toán:
A-Parity(1-3) = Block A1 Ꚛ Block A2 Ꚛ Block A3
Tuy nhiên thực tế thì hiện này loại Raid này cũng không còn được sử dụng do hiệu năng quá thấp đặc biệt là với Database do việc xử lý theo từng Bit rất mất thời gian khi lưu trữ và truy xuất.
2.5 RAID 4
RAID 4 tương tự như RAID 3 nhưng ở một mức độ các khối dữ liệu lớn hơn chứ không phải đến từng byte. Chúng cũng yêu cầu tối thiểu 3 đĩa cứng (ít nhất hai đĩa dành cho chứa dữ liệu và ít nhất 1 đĩa dùng cho lưu trữ dữ liệu Parity)
Tuy nhiên, hiện loại raid này cũng không được sử dụng nhiều nữa.
2.6 RAID 5
Đây có lẽ là dạng RAID mạnh mẽ và thông dụng nhất. Dữ liệu và bản sao lưu được chia lên tất cả các ổ cứng. Nguyên tắc này khá phức tạp
Chúng ta quay trở lại ví dụ về 8 đoạn dữ liệu (1-8) và giờ đây là 3 ổ đĩa cứng. Đoạn dữ liệu số 1 và số 2 sẽ được ghi vào ổ đĩa 1 và 2 riêng rẽ, đoạn sao lưu của chúng được ghi vào ổ cứng 3. Đoạn số 3 và 4 được ghi vào ổ 1 và 3 với đoạn sao lưu tương ứng ghi vào ổ đĩa 2. Đoạn số 5, 6 ghi vào ổ đĩa 2 và 3, còn đoạn sao lưu được ghi vào ổ đĩa 1 và sau đó trình tự này lặp lại, đoạn số 7,8 được ghi vào ổ 1, 2 và đoạn sao lưu ghi vào ổ 3 như ban đầu. Như vậy RAID 5 vừa đảm bảo tốc độ có cải thiện, vừa giữ được tính an toàn cao. Dung lượng đĩa cứng cuối cùng bằng tổng dung lượng đĩa sử dụng trừ đi một ổ. Tức là nếu bạn dùng 3 ổ 80GB thì dung lượng cuối cùng sẽ là 160GB.
2.7 RAID 6
RAID 6 phần nào giống như RAID 5 nhưng lại được sử dụng lặp lại nhiều hơn số lần sự phân tách dữ liệu để ghi vào các đĩa cứng khác nhau. Ví dụ như ở RAID 5 thì mỗi một dữ liệu được tách thành hai vị trí lưu trữ trên hai đĩa cứng khác nhau, nhưng ở RAID 6 thì mỗi dữ liệu lại được lưu trữ ở ít nhất ba vị trí (trở lên), điều này giúp cho sự an toàn của dữ liệu tăng lên so với RAID 5.
RAID 6 yêu cầu tối thiểu 4 ổ cứng.
Trong RAID 6, ta thấy rằng khả năng chịu đựng rủi ro hư hỏng cứng được tăng lên rất nhiều. Nếu với 4 ổ cứng thì chúng cho phép hư hỏng đồng thời đến 2 ổ cứng mà hệ thống vẫn làm việc bình thường, điều này tạo ra một xác xuất an toàn rất lớn. Chính do đó mà RAID 6 thường chỉ được sử dụng trong các máy chủ chứa dữ liệu cực kỳ quan trọng
3 CÁC RAID KHÔNG TIÊU CHUẨN
3.1 RAID 10 & RAID 01
Đây là loại Raid kết hợp giữa Raid 1 và Raid 0 nhưng là hai cơ chế hoàn toàn khác nha:
Raid 10: Chia dữ liệu thành hai phần bằng cơ chế Raid 0, mỗi phần lại được mirror bằng cơ chế Raid 1
Raid 01: Dữ liệu được Mirror giống nhau ở lần ghi thứ nhất theo cơ chế raid 1 nhưng lại được chia thành hai phần ở lần ghi thứ hai theo cơ chế raid 0
Xét về hiệu năng thì rõ ràng Raid 10 có ưu thế hơn hẳn cả về tốc độ truy xuất đọc và ghi so với Raid 01. Với các hệ thống đòi hòi hiệu năng cao mà vẫn đảm bảo an toàn dữ liệu thì Raid 10 là lựa chọn tối ưu.
3.2 Raid 50
Là sự kết hợp hoàn hảo giữa Raid 5 và Raid 0, dữ liệu được ghi lần đầu theo cơ chế Raid 0 nhưng lại được chia theo cơ chế Raid 5 ở lần ghi thứ hai.
Nhờ vậy loại raid này vẫn đảm bảo tốc độ truy vấn rất tốt tương tự như RAID 10 nhưng lại tận dụng dung lượng ổ cứng tốt hơn Raid 10 rất nhiều.
3.3 Hot spare disks
Đây là một ổ cứng mà chức năng chính chỉ để sử dụng dự phòng. Khi một ổ cứng trong nhóm Raid bị hư, hệ thống sẽ tự động lấy ổ cứng HotSpare để thay thế vào ổ cứng hư nhằm đảm bảo dữ liệu được bảo vệ tối ưu nhất. Hot spare disk có thể dùng cho 1 cụm raid hoặc có thể dụng share chung cho nhiều cụm raid khác nhau.
Nguồn: http://searchstorage.techtarget.com/definition/RAID
Phần tiếp theo: Triển khai GlusterFS