Bienvenue à

Données et statistiques sur les disques durs

Notre collection unique de données et de rapports sur les disques durs (HDD) et les SSD

Depuis 2013, Backblaze recueille, traite et publie les taux de défaillance annualisé (AFR) et des statistiques connexes sur les disques durs (HDD) et les SSD provenant de nos centres de données. Ce corpus constitue l’ensemble de données Backblaze Drive Stats. Chaque trimestre, nous publions une mise à jour open source, téléchargeable via les liens de la section « Téléchargement de l’ensemble de données Drive Stats » ci-dessous.

Aperçu des Drive Stats du deuxième trimestre 2025

Nombre de disques

317 230

Défaillances de disques

1 061

Jours-disque

28 402 627

Population de disques par fabricant

HGST

Seagate

Toshiba

WDC

Fiabilité des disques: taux de défaillance annualisé (AFR)

Période
Jours-disque
Pannes de disques
AFR
Trimestriel : T2 2025
28 402 627
1 061
1,36 %
Annuel : 2024
101 906 290
4 372
1,57 %
Cumulatif (à vie)
498 078 717
17 707
1,30 %

Podcasts et webinaires liés à Drive Stats

Webinaire

Webinaire

Webinaire (inclut des instructions pour interroger l’ensemble Drive Stats au format table Apache Iceberg)

Webinaire

LinkedIn Live: Backblaze Drive Stats T1 2025

Webinaire

Rapports trimestriels et articles connexes de Drive Stats

Nous publions régulièrement des analyses fondées sur l’ensemble Drive Stats sur le blogue Backblaze: rapports trimestriels « Hard Drive Stats » et SSD, ainsi que des sujets connexes (coût du stockage, « courbe de la baignoire », etc.).

En savoir plus

Want to get Drive Stats updates straight to your inbox? Sign up for the Drive Stats newsletter.

Sign Up for the Newsletter

Aperçu de l’ensemble de données Drive Stats

Comment nous recueillons les données

Chaque jour, dans chaque centre de données Backblaze, nous prenons un instantané de chaque disque actif (métadonnées + statistiques S.M.A.R.T.). L’instantané quotidien correspond à une ligne dans un fichier CSV regroupant tous les disques actifs du jour (nommage : YYYY-MM-DD.csv, p. ex. 2024-03-25.csv).

Comment les données sont organisées

Le schéma Drive Stats inclut les champs Backblaze pour chaque enregistrement de disque ainsi que les attributs S.M.A.R.T. bruts et normalisés rapportés par chaque disque.

Remarque: le schéma peut évoluer d’un trimestre à l’autre. Vérifiez les changements à chaque publication et alignez vos données en conséquence.

Utilisation des données

L’ensemble Drive Stats est open source. Nous demandons simplement que vous :• citiez Backblaze comme source ;• assumiez la responsabilité de votre usage ;• puissiez vendre des œuvres dérivées, mais pas les données brutes elles-mêmes (elles sont gratuites).

  1. vous citez Backblaze comme source si vous utilisez les données,
  2. vous acceptez que vous êtes seul responsable de la façon dont vous utilisez les données,
  3. vous pouvez vendre des œuvres dérivées en fonction des données, mais
  4. vous ne pouvez pas vendre les données elles-mêmes à qui que ce soit, c'est gratuit.

Interroger l’ensemble de données Drive Stats

En plus des CSV compressés ci-dessous, nous maintenons une copie au format Apache Iceberg. Utilisez ces identifiants en lecture seule avec tout outil compatible Iceberg:

ID de clé d’application (AWS Key ID): 0045f0571db506a0000000017

Clé d’application (AWS Secret Key): K004Fs/bgmTk5dgo6GAVm2Waj3Ka+TE

URL du point de terminaison: https://s3.us-west-004.backblazeb2.com

Région: us-west-004

Bucket: drivestats-iceberg

Préfixe de chemin: drivestats

Consultez l’article Iceberg on Backblaze B2 pour des instructions détaillées (Trino, Snowflake, DuckDB).

Téléchargement du jeu de données Drive Stats

Depuis 2016, nous publions l’ensemble de données par trimestre (avant 2016 : annuel — 2013, 2014, 2015). Chaque élément ci-dessous est une archive ZIP contenant les fichiers CSV du trimestre ou de l’année.

Tous
arrow

FAQ

En dehors de vos données de test, quelles mesures puis-je prendre pour réduire au minimum les problèmes de disques durs?

La santé d’un disque dépend de nombreux facteurs (environnement, usage, etc.). Pour réduire les problèmes et maximiser la durabilité: faites des sauvegardes régulières, assurez une bonne ventilation et une température stable, manipulez les disques avec soin pour éviter les chocs, et surveillez les données S.M.A.R.T. pour détecter tôt les signes d’alerte.

Selon les données de Backblaze, quelle est la durée de vie typique des disques durs?

Les données de Backblaze montrent que, même si l’AFR varie selon les modèles et l’âge, une large majorité de disques fonctionnent fiablement pendant plusieurs années (souvent > 4–5 ans avec de faibles taux de panne). L’AFR cumulatif de l’ensemble du parc demeure très bas, signe d’une bonne robustesse globale.

Pourquoi Backblaze rend-il ces données détaillées publiques?

Par souci de transparence et pour défendre l’ouverture du nuage. En ouvrant les données, nous favorisons la confiance, permettons à la communauté d’analyser et de réutiliser l’information, et contribuons à une compréhension plus collaborative de l’infrastructure infonuagique et de la fiabilité des disques.

Comment Backblaze recueille-t-il ces données sur les disques durs?

Nous prenons un instantané quotidien de chaque disque opérationnel dans nos centres de données (métadonnées + statistiques S.M.A.R.T.: heures de fonctionnement, température, secteurs défectueux, etc.).

What kind of drive data does Backblaze collect and share?

Backblaze collects and publishes annualized failure rates (AFR) and related statistics from the hard disk drives (HDDs) and solid state drives (SSD) operating in their data centers. This includes daily snapshots of drive information and S.M.A.R.T. statistics.

Une société cotée en bourse (BLZE)
Backblaze © 2024

La mise en place sécurisée est temporairement indisponible. Veuillez vérifier s'il y a des déploiements en cours. Si aucun n'est en cours, communiquez avec l'équipe fullstack pour obtenir de l'aide. Cliquez sur moi pour rejeter.