Hai nghiên cứu gần đây cho thấy số trường hợp hỏng đĩa cứng nhiều hơn con số ước tính của nhà sản xuất.

Ổ cứng của bạn có thể không đáng tin như những gì nhà sản xuất nói. Các nghiên cứu gần đây của Carnegie Mellon và Google cho thấy tỉ lệ hỏng đĩa MTTF (Mean Time To Failure) cho ổ cứng mà nhà sản xuất đưa ra còn bị sai lệch.

Carnegie Mellon khảo sát ở vài nơi, phát hiện tỉ lệ hỏng hóc từ trung bình 2% đến 4% và cao nhất là đạt đến 13%, ngược lại với con số thấp hơn 1% của tỉ lệ MTTF mà nhà sản xuất đưa ra (xem bảng). Còn nghiên cứu của Google đưa ra tỉ lệ hỏng hàng năm ở mức 3%. Cả 2 nghiên cứu đều dựa trên sự quan sát khoảng 100.000 ổ cứng.

Định nghĩa hỏng hóc

Như thế nào thì ổ cứng mới bị “liệt” vào tình trạng hỏng hóc? Có sự không nhất quán về định nghĩa này giữa các nhà sản xuất ổ cứng và kết quả mà Google và Carnegie Mellon khảo sát. Đối với nhà sản xuất, ổ cứng hỏng khi trong một lần đọc hoặc ghi không thành công với một khoảng thời gian nhất định, cụ thể là 24 giờ ở điều kiện thử nghiệm. Nếu với tiêu chí trên, có gần 40% lượng ổ cứng trả về không thực sự hỏng.

Tuy nhiên, hai nghiên cứu mới này lại đặt ra tiêu chí hỏng hóc là: ổ cứng xảy ra bất cứ dấu hiệu nào mà khiến người dùng (cho cả người dùng thông thường lẫn chuyên gia CNTT) phải thay ổ cứng khác. Những dấu hiệu này như là vấn đề phần mềm, xung đột trình điều khiển... cộng với những dấu hiệu hỏng hóc mà nhà sản xuất đưa ra. Các nhà sản xuất cũng dựa trên số MTTF về tốc độ của các ổ cứng cũ để quyết định hỏng hóc.

Điều ngạc nhiên là trong khảo sát của Google không tìm thấy sự tương quan giữa hỏng hóc, nhiệt độ và tần suất hoạt động của ổ cứng. Tỉ lệ hỏng hóc cao nhất thường xảy ra khi ổ cứng hoạt động ở nhiệt độ từ 77-88 độ. Tuy vậy, theo nghiên cứu của Google, máy tính để bàn thông thường có thể hoạt động qua mức tối đa là 125 độ. Vì vậy, kết quả nghiên cứu không nêu rõ được ổ cứng đang hoạt động với thiết bị tản nhiệt có phù hợp hay không.

Nghiên cứu của Google dựa trên một phần dữ liệu SMART (Self-Monitoring And Reporting Technology) của các ổ cứng có công nghệ này. Tuy vậy, nhiều ổ cứng tuy không bị thông báo lỗi SMART nhưng vẫn bị hỏng nên Google kết luận trên thực tế, SMART không có ích gì khi dự đoán hỏng hóc cho ổ cứng.

Các số liệu của Google chỉ hỗ trợ được một điều: nếu bạn gặp một lỗi khi quét ổ cứng (ví dụ khi bạn chạy ScanDisk) thì trong vòng 60 ngày, ổ cứng của bạn dễ hỏng gấp 39 lần so với các ổ cứng không gặp lỗi. Các chuyên gia khuyến cáo bạn nên thay ổ cứng mới nếu quét SMART mà gặp lỗi.

Ảnh hưởng

Tác động nhiều nhất của hai nghiên cứu này là các nhà sản xuất sẽ không đưa ra các con số về MTTF nữa. Qua khảo sát trực tuyến, các chỉ số MTTF cho ổ cứng thông thường đã xuất hiện ít dần.

Còn những khách hàng doanh nghiệp có thể sẽ suy nghĩ lại khi có được khảo sát của Carnegie Mellon vì các ổ cứng giao tiếp cáp quang hoặc SCSI không đáng tin cậy hơn gì so với các loại ổ cứng SATA có giá thấp hơn. Nhưng theo IDC, ổ cứng cáp quang và SCSI vẫn đáng giá nếu xét về tốc độ.

Còn với chúng ta, những bản báo cáo này đơn giản nhấn mạnh lại nhu cầu thực tế. Hãy giữ cho ổ cứng bạn luôn mát và bạn nên sao lưu dữ liệu để tránh gặp tình trạng hỏng hóc, phòng khi ổ cứng của bạn gặp vấn đề thì đó chỉ là điều bất tiện, không phải là thảm họa.

TỈ LỆ HỎNG HÓC

Thực tế khác với những gì nhà sản xuất công bố.
Dựa trên chỉ số MTTF (Mean Time To Failure) của ngành công nghiệp sản xuất ổ cứng, mỗi năm có ít hơn 1% ổ cứng bị hỏng. Nhưng các số liệu điều tra cho thấy ổ cứng có tỉ lệ này cao hơn nhiều.

  Tỉ lệ hỏng hóc hàng năm
Hãng sản xuất công bố (dựa trên MTTF của 1 triệu giờ) 0,88%
Báo cáo của Carnegie Mellon (trung bình) 2% - 4%
Báo cáo của Carnegie Mellon (tối đa) 13%
Báo cáo của Google 3%

Theo định nghĩa, MTTF là tuổi thọ trung bình của một ổ cứng. Một năm có 8760 giờ, vì vậy khả năng một ổ cứng bị hư trong một năm nào đó, hoặc con số ước tính tỉ lệ hỏng hóc hàng năm được tính bằng 8760/MTTF.

Theo PC World VN, Quản Trị Mạng