Tìm hiểu công nghệ gom dữ liệu rác giúp tăng hiệu năng ổ SSD thêm 300%
(GenK.vn) - Một giải pháp quét dọn dữ liệu rác trên SSD của Viện khoa học và công nghệ Đại Học Chuo (Nhật Bản), giúp nâng hiệu năng hoạt động của SSD thêm tới hơn 300%.
Dòng ổ cứng SSD hiện nay đã cho tốc độ truyền tải dữ liệu rất tốt, hơn hẳn ổ HDD truyền thống. Tuy nhiên, trong tương lai, hiệu năng của chúng hứa hẹn còn được tăng thêm rất nhiều lần nữa, nếu như một công nghệ mới đây của các nhà nghiên cứu Nhật Bản được áp dụng rộng rãi.
Nhóm nghiên cứu thuộc Viện khoa học và công nghệ của Đại Học Chuo ở Nhật vừa công bố một giải pháp quét dọn dữ liệu rác trên SSD giúp nâng hiệu năng hoạt động của loại ổ cứng này thêm tới hơn 300%, trong một số trường hợp nhất định. Chi tiết của nghiên cứu sau khi được công bố tại hội thảo quốc tế về bộ nhớ thường niên của IEEE (2014 IEEE International Memory Workshop) đã thu hút được rất nhiều sự chú ý của đại diện các hãng sản xuất, nhất là trong bối cảnh các công nghệ sản xuất NAND flash hiện nay đều được đánh giá là sẽ tiến triển rất chậm trong một vài năm tới.
Để giải thích kĩ hơn về nghiên cứu này, trước hết chúng ta cần nhắc lại hai đặc tính quan trọng của bộ nhớ NAND flash. Trước hết, quá trình ghi dữ liệu lên các chip nhớ này thường được cho là một quá trình tương đối “thô bạo”. Các kĩ thuật ghi hiện nay vẫn sử dụng rất nhiều năng lượng cho tác vụ này và hiện vẫn chưa có phương pháp hiệu quả nào để ngăn chặn các điện năng dư thừa trong quá trình ghi lên một cell khỏi rò rỉ sang các cell xung quanh. Sau một thời gian dài sử dụng, điều này có ảnh hưởng không nhỏ tới độ bền các cell nhớ, đôi lúc làm chết hẳn một vài cell.
Điểm quan trọng thứ hai là dữ liệu trên ổ SSD cấu thành từ nhiều block (khối), mỗi block lại có cấu tạo nhiều page (trang). Quá trình ghi dữ liệu lên các chip nhớ NAND được thực hiện ở cấp độ các trang (với dung lượng lưu trữ khoảng 2-4KB), nhưng tác vụ xóa lại được thực hiện trên toàn bộ block (kích thước trung bình từ 128-512KB. Khi người dùng xóa dữ liệu khỏi ổ SSD, nội dung dữ liệu thực chất có thể được phân tán trong rất nhiều page, nếu may mắn thì nằm trên cùng một block, nhưng thường là các page này rải rác trên nhiều block khác nhau. Để giải phóng các vùng dữ liệu này, controller trên ổ cứng sẽ phải thực hiện một quy trình thường được gọi là garbage collection – thu thập dữ liệu rác. Trong quá trình này, dữ liệu còn được sử dụng sẽ được chuyển ra khỏi các block chứa nhiều page rác sang các block mới hơn để cuối cùng hình thành các block chỉ chứa page rác có thể xóa được.
Như ta thấy trong hình minh họa: sau khi ghi thêm dữ liệu lên các page E-H, đồng thời chỉnh sửa dữ liệu trên các page A-D sang bản mới A’-D’, bộ điều khiển sẽ phải chuyển toàn bộ dữ liệu mới trên các page này từ block X sang các page trống trên block Y. Chỉ khi đó block X mới ở trạng thái an toàn, chỉ bao gồm các page rác A-D và các page trống, đồng nghĩa với việc bộ điều khiển có thể xóa block X mà không ảnh hưởng đến dữ liệu của người dùng. Qúa trình này chính là garbage collection
Nếu quan sát kĩ hình minh họa, chắc chắn bạn sẽ nhận ra một điểm: các dữ liệu mới cần phải được chuyển hết khỏi block rác trước khi quá trình xóa diễn ra. Nhận thức được hạn chế của vấn đề này, nhóm nghiên cứu đã đề xuất một giải pháp mới, trong đó dữ liệu mới sẽ kích hoạt ngay lập tức quá trình chuyển dữ liệu trên các block được xác định là sắp cần được xóa.
* Ghi chú: trong hình minh họa ta có 2 block, 1 block được xác định là đối tượng chuẩn bị được xóa, 1 là block mới để ghi dữ liệu mới. Hình bên trái (Conv. – conventional) thể hiện cơ chế ghi cũ: ghi thẳng các dữ liệu mới lên page của block mới. Hình bên phải (Prop. – Proposal) thể hiện cơ chế được đề xuất.
Như ta có thể thấy trong hình minh họa, khi sử dụng phương pháp mới này, các dữ liệu mới sẽ được chủ động đổ đầy vào các page còn chỗ trống trên block chuẩn bị được xóa. Dữ liệu trên các page còn giá trị sử dụng này sẽ được chuyển ngay sang block mới trong quá trình ghi. Hiệu quả là các page rác sẽ được dồn về một vài block nhanh hơn và tiến trình garbage collection sẽ diễn ra thường xuyên hơn, nhưng hiệu quả hơn.
Về lâu dài, các tác vụ garbage collection diễn ra hiệu quả hơn cũng sẽ đồng nghĩa với việc giảm số lượng các yêu cầu ghi/chuyển dữ liệu, kéo dài tuổi thọ của ổ cứng.
Biểu đồ thể hiện mức cải thiện về hiệu năng so với các ổ SSD sử dụng cơ chế garbage collection cũ. Đường nét đứt trong hình thể hiện hiệu năng của các ổ cũ, còn các cột màu đỏ, lục, lam, xám thể hiện hiệu năng của các ổ sử dụng cơ chế mới với dung lượng trống lần lượt ở mức 20, 40, 60 và 80%. Như ta có thể thấy trong một số trường hợp cá biệt, hiệu năng tăng tới 200-300%, nhưng đa phần mức tăng năm vào khoảng 20%, con số không hề nhỏ trong các ngành công nghệ điện tử.
Theo như một số đánh giá trước đây, các nhà sản xuất hiện đang rất bận rộn với việc cải thiện kích thước kiến trúc xử lí của chip nhớ và quan trọng hơn là giải quyết các vấn đề về độ bền, độ tin cậy khi giảm kích thước như vậy. Đồng nghĩa với một điều rằng việc cải thiện hiệu năng của các ổ SSD giờ đây sẽ phụ thuộc phần lớn vào các công sản xuất bộ điều khiển, giao diện truyền tải, các “thủ thuật” nhưSamsung đã từng làm: kết hợp cell đơn cấp (single-level cell – SLC) với cell tam cấp (triple-level cell TLC), và trên hết sẽ là các thuật toán quản lý dữ liệu – chính là các nghiên cứu dạng như trong bài viết này. Chính vì vậy nhiều ý kiến cho rằng dù mới chỉ dừng lại ở mức nghiên cứu lý thuyết, nhưng kỹ thuật này sẽ sớm được ứng dụng trên các bộ điều khiển mới nhất. Trong một vài năm tới, vố số những kỹ thuật dạng này sẽ được cập nhật trên các firmware và bộ điều khiển mới để khi tổng hợp lại có thể đem đến hiệu năng hơn nhiều lần so với ổ cứng ban đầu người dùng mua về.
Tham khảo: Extremetech
NỔI BẬT TRANG CHỦ
Cận cảnh độc quyền Galaxy S25 Edge trực tiếp tại Mỹ: Phiên bản siêu mỏng của Galaxy S25 Ultra
Galaxy S25 Edge đã có màn ra mắt đầy bất ngờ, mặc dù chưa chính thức được bán ra.
Đây là Galaxy S25 Ultra: Galaxy AI tiếng Việt “như con người”, thiết kế mới với viền màn hình siêu mỏng, chip Snapdragon 8 Elite for Galaxy, giá từ 33.9 triệu đồng