Informations sur système de sauvegarde - Stockage - Systèmes & Réseaux Pro
Marsh Posté le 08-01-2008 à 19:12:01
L'eternel pb des sauvegardes.
-Effectivement je pense que les bandes ont une bonne durée de vie mais attention à ne pas les mettre dans le batiment. Certaines bank acceptent des les stocker renseigne toi près de ta boite.
-Pour la redondance, si tu veux une redondance totale il te faudra 2 serveurs et 2 SAN synchronisés, et ça marche qu'avec du FiberChannel (Fibre optique).
-Tu peux aussi avoir des replications logiciels entre deux serveurs distants (un primaire et un de secours), double-take si tu es sous windows est le meilleurs soft pour ça mais payant.
-Pour le RAID si tu sais pas quoi prendre te pose pas trop de question, le RAID5 c'est archi-utilisé et approuvé. Après c'est + un débat scientifique qu'autre chose...
-Pour la robotheque de sauvegarde, je ne peux que donner ma modeste experience. On a un libairie HP MSL5000 qui est de très bonnne facture. Elle tourne depuis 4 ans non-stop, 35 sauvegardes/semaines, le robot nettoie même les lecteurs à ta place. Le tout administré par hp openview dataprotector. D'habitude j'suis pas trop "HP" mais là je dois bien dire que j'en suis super content.
Juste une chose, si c'est vraiment les données qui compte et non la tolérance de panne, tu peux aussi si tu en as la possibilité, faire des sauvegardes sur bande + 1 sauvegarde sur un serveur distant en réseau avec double-take ou un agent dataprotector.
Marsh Posté le 08-01-2008 à 23:01:23
D'accord, merci beaucoup pour ces informations !
Je ne comprend pas très bien, quel est le but d'utiliser des bandes pour des MAJ journalières ? Car là on parle pas de risque de démagnétisation vu que les données seront mises à jour quotidiennement ? Et d'un point de vue risque de device qui casse, en utilisant un raid5 avec quelques disques de spare, quel serait le risque?
Merci d'avance
Marsh Posté le 08-01-2008 à 23:07:18
heureusement que le SAN c'est pas que du FC, tu as l'iscsi qui est bien moins chers mais pas forcément très performant
Marsh Posté le 09-01-2008 à 01:13:05
Hello,
Des disques qui pète ça arrive. Les DD SCSI n'ont rien à voire avec les DD que l'on trouve dans les grandes surfaces mais on est jamais à l'abris d'un incident qui peut vite tourner au cauchemar donc tolérance de panne sur les disque (RAID).
Pour apporter quelques précision sur le RAID:
Le RAID5 est le meilleur compromis prix/tolérance de panne mais on peut vite lui trouver des limites.
- La 1ère est dans un contexte haute disponibilité: Si jamais un disque de ton Array tombe, il va falloir le
changer et reconstruire les données (pas de panique ça se fait tout seul).
Le soucis vient du temps de reconstruction: plusieurs heures... durée pendant laquelle tes données sont inaccessibles.
- La 2eme concerne les temps d'écriture/lecture.
Dans un RAID 5 (je prends le cas de 3 disques) lorsque que tu ecris des données, (en gros car c'est plus au niveau bit) tu ecris une partie sur un disque, une autre partie sur un autre disque et la parité (ce qui te permet de reconstruire ta donnée) sur le dernier disque.
Lors de la lecture/ecriture, tu lis/ecris le 1er disque, puis le 2eme et le 3eme (la parité) avec en plus un calcul pour reconstruire (ou deconstruire si tu écris) ta donnée.
Tu comprends vite que lorsque tu as enormement de requête de la part d'un grand nombre d'utilisateur, comme ça peut l'être sur une DB, les perf s'en ressente très vite et ça peut être flagrand pour l'utilisateur.
Sur une petite DB avec 5 utilisateurs, tu ne te poses pas cette question... sur un entrepot de données d'une grosse boite tu te penches sur le sujet.
Sur un RAID1 (ou 01) tu ecris sur deux disques en même temps (là tu as une petite perte en terme de temps mais rien à voir avec le RAID5) mais lors de la lecture tu lis plus vite.
Pour les sauvegardes:
- En premier lieu il me semble qu'il faudrait avant tout centraliser les données. Avec la contrainte d'un parc OS héterogène.
En gros, comme ça a été dit, le SAN semble le mieux adapté aux vues de la volumetrie (5To).
Après que tu prennes tel ou tel constructeur... il faut juste taper dans les marques reconnues je pense.
Si tu centralises, il faudra de la redondance (au moins sur les données dont on ne peut se passer plus de X min/heure - etude PCA) à moins que vous puissiez rester sans données le temps de restaurer à partir de sauvegardes.
- Sauvegarde sur bande:
1 sauvegarde sur media different des autres sauvegardes (rotation): externalisation possible + facilement, integrité des données vu que chaque sauvegarde est cloisonnée des autres, moins chère que la sauvegarde sur DD pour un même niveau de sécurité (voir partie 411 du tuto sur les sauvegardes).
Inconvenient: temps de restauration.
Le but des sauvegardes journalière sur bande (si c'etait ta question) est le même qu'une sauvegarde journalière quelque soit le media. Mais avec les bandes tu peux externaliser tes sauvegardes (utile si ton site prend feu, si ton site est cambriolé etc etc.)
Quant à ton lien, la VLT c'est de la sauvegarde sur DD.
A savoir que certains logiciels de sauvegarde (comme Arcserve) ont l'option VLT: voir cette solution couplé à un NAS par ex, c'est peut être moins chère... je ne sais pas trop.
Marsh Posté le 09-01-2008 à 08:57:49
Bonjour,
tout d'abord merci beaucoup pour cette explication si complète, je commence enfin à y voir plus clair.
Concernant le temps de reconstruction du raid, je pense que c'est un risque "acceptable" dans notre cas. Mon chef m'a fait comprendre qu'il veut que je fasse le max avec le minimum d'argent (étrange non?) pour que les données soient sauves. Après qu'il soit éventuellement nécessaire d'aller manger entre temps pour que tout se remette en place, je pense qu'il s'en fou.
Concernant la sauvegarde sur bande, je comprend aussi maintenant l'utilité, et je lui proposerai donc la solution.
2 questions me viennent encore à l'esprit :
- J'ai vu que tous les sites proposent des disques dur sata ou sas pour leurs array, les sata ayant un rapport volume de stockage / prix bien plus gros. Est-ce que vous pensez que dans mon cas ça vaudrait la peine? À ce que j'ai pu lire sur le net, les sas seraient plus rapides et tomberaient moins en panne, est-ce vrai?
- J'ai regardé sur plusieurs sites de marques "connues" et pratiquement à chaque fois (a peu près partout sauf chez dell ) j'ai trouvé des systèmes se vantent d'être cablés FC et donc avoir une bande passante importante. Étant donné que dans mon cas le réseau c'est un LAN 1Gbit, ce genre de truc ne me servira a rien, auriez vous des noms de SAN pouvant me convenir?
Encore merci à vous
Edit : Concernant le système d'exploitation tournant, je suis familier avec les systèmes unix (Linux principalement, mais solaris serait aussi de l'ordre du concevable), donc si possible je voudrais utiliser cet OS sur les machines.
Marsh Posté le 09-01-2008 à 09:20:04
Heu quand le raid se reconstruit y a pas de problème pour bosser... heureusement d'ailleurs sinon l'intérêt serait moindre.
Marsh Posté le 09-01-2008 à 09:23:23
Oui mais les données sont inaccessibles pendant un moment non?
Donc si un utilisateur a besoin de certaines données à ce moment là il devra attendre que la reconstruction soit finie. Ce qui n'est pas critique dans mon cas tant que ça tourne autour d'un délai d'une demi journée
Marsh Posté le 09-01-2008 à 10:27:53
ReplyMarsh Posté le 09-01-2008 à 10:41:25
esox_ch a écrit : D'accord, merci beaucoup pour ces informations ! |
Désolé, je comprends pas ta question au sujet des bandes et des mises à jours journalières.
Marsh Posté le 09-01-2008 à 12:09:19
edouardj a écrit : ben non les données sont accessibles. |
Ah, j'avais cru comprendre que pendant la reconstruction du raid elles ne l'étaient pas .... Bein tant mieux du coups
lecharcutierdelinux a écrit : |
Je demandais de confirmer que j'avais bien compris. Dans mon cas le serveur serait vu par les utilisateurs comme un simple serveur de fichiers en somme, ce qui (corrigez moi si je me trompe) a avantage à être fait avec des disques durs. Ensuite les bandes seraient utilisées pour backuper les HDD de ce serveur histoire que si pendant la journée malheur arrivait (serveur qui crash plusieurs HDD en même temps, hack du serveur, ...) on ait un backup à l'abbris car non connecté au reseau et gardé dans un autre endroit physique. Là les bandes seraient plus pratiques car plus compactes et (à lire ce que akabis avait écrit sur un de ses topics d'aide) moins chères.
Je dois recommancer à apprendre mes devoirs ou je suis sur la bonne voie ?
Marsh Posté le 09-01-2008 à 13:16:07
edouardj a écrit : Heu quand le raid se reconstruit y a pas de problème pour bosser... heureusement d'ailleurs sinon l'intérêt serait moindre. |
exact, j'ai dit une connerie (grosse fatigue). Au temps pour moi.
- En lecture le RAID5 gagne en perf (par rapport à un seul disque) car on lit sur plusieurs disques en même temps.
Par contre en écriture, comme je l'indiquais, on a le temps de calcul de parité.
- Lors de la reconstruction (ou avec un disque en moins) tu perds fortement en lecture et non pas une indispo car en effet il n'y aurait aucun interet.
(j'ai relu vite fait le reste, je ne crois pas en avoir dit d'autre)
... j'arrete mes posts à heure tardive
Marsh Posté le 09-01-2008 à 13:30:26
esox_ch a écrit : |
Un système de sauvegarde sur bande c'est: un logiciel de sauvegarde et un lecteur (ou autoloader).
Les logiciels ont tous des agents que tu peux installer sur autant de serveurs que tu veux et qui peuvent être backupé via le Lan.
Ton serveur de sauvegarde (qui sera celui ou est installé le logiciel et où est connecté ton lecteur) est forcement sur le reseau... tu sauvegardes comment sinon?
Ce sont les bandes que tu sors de ton parc.
... en fait j'ai pas bien compris ce que tu as écrit.
esox_ch a écrit : |
L'histoire du "moins chère" n'est pas l'argument qui doit te faire choisir tel ou tel solution.
Mais vu que c'est l'argument qu'utilise le plus les pro sauvegarde sur DD, je demontrais le contraire.
Les bandes sont interressante, comme je le disais, car:
- un media different par sauvegarde: si la source de ta sauvegarde est corrompu (un virus par ex), tu trouvera toujours une bande antérieur (suivant tes roulements) avec des données saines. Sur DD, vu que tes sauvegardes sont toutes sur le même media, en cas de corruption tout risque d'être corrompu.
- la possibilité d'externaliser tes sauvegardes facilement: une sauvegarde ne doit jamais rester sur le même site que les données en prod. En cas de sinistre (vol, incendie...) tu aura toujours de quoi remonter tes données.
- concervé correctement à l'abris des difference de T°, des sources electromagnetiques... une bande est moins sensible qu'un DD qui peut avoir une partie (ou toutes) de ses données illisibles à partir d'un certain temps.
Maintenant dans certains contexte, genre la haute dispo, la sauvegarde sur DD est ce qu'il y a de mieux (mais couplé à un systeme de backup sur bande= ceinture+bretelles).
Marsh Posté le 09-01-2008 à 14:10:40
akabis a écrit : |
Oui c'est ce que j'ai voulu dire : Les bandes ne restent pas physiquement connectées au réseau 24h/24 mais seulement au moment du backup, ensuite on les mets à l'abbris ailleurs.
Merci à vous tous, je vais regarder un peu à droite et à gauche pour des NAS + système de backup de bandes, une fois que j'aurai mes candidats je reviendrai vous demander votre avis.
Encore merci à vous tous
Marsh Posté le 09-01-2008 à 14:55:32
Au passage, est-ce que vous auriez des livres / sites de références que je pourrais lire?
Chez O'reilly j'ai trouvé le livre SAN&NAS ( http://www.oreilly.com/catalog/sansnas/index.html#top ) mais avant de l'acheter j'aimerais votre avis.
Tout ça parce que je me rend compte que la tâche qu'on m'a confié dépasse de pas mal mes connaissances (Comme je l'ai dit, je n'ai jamais eu à faire à ce genre de choses) et du coups il me faut me mettre à niveau.
Merci
Marsh Posté le 08-01-2008 à 17:21:21
Bonjour,
L'institut de recherche dans lequel je travail m'a demandé de mettre en place un système de sauvegarde de données "centralisé" (actuellement c'est le chaos complet, chacun y a va de son petit disque dur/CDROM et bien entendu il y a des ratées et les utilisateurs perdent leurs données), le but serait de mettre en place des logiciels de sauvegarde (style rsync pour les systèmes Unix, TimeMachine pour les inconditionnels de Mac,...) s'occupant de ça quand les chercheurs sont au lit.
J'ai fait quelques recherches sur le net pour me renseigner sur ce qui se fait mais étant donné que c'est la première fois que je m'attaque à ce genre de problème j'ai un peu de peine à y voir clair.
Nos besoins sont :
5 To d'espace disque utilisable (le mieux serait une solution évolutive qui nous permettrait de passer au double d'ici 1-2 ans). Les sauvegardes seraient effectuées (pour l'essentiel) chaque nuit (il n'y a donc pas besoin de mettre en place des snapshots tout au long de la journée) via réseau câblé 1Go, rien ne servirait donc d'avoir des serveurs câblés fibres optiques. Concernant la nature de la redondance, disons que ce qui est vital c'est que les données soient sauves, après mon chef veux avoir 2 propositions :
- Redondance à tous les niveaux (2 structures distinctes)
- Redondance de données seulement (juste le RAID en gros)
J'ai vu plusieurs débats sur les pour et contre de systèmes à stockage sur bande / HDD, mais je suis pas sur d'avoir compris les conclusions qui en découlent :
Les bandes sembleraient garantir une persistance des données plus longues (En gros si je range des bandes et des HDD dans une armoire pendant 5 ans, il y a des chances que les données sur les HDD soient perdues alors que pas celles des bandes?) mais en revanche elles imposent une maintenance régulière (cassette de nettoyage) et ne peuvent pas être mises à jour via rsync. N'ayant jamais utilisé un système à bandes je serais plus porté sur l'idée d'utiliser des HDD, mais rien ne m'empêche de me documenter si le gain apporté par celles-ci serait important.
De plus j'ai lu plusieurs discussions sur l'utilisation des différents RAID et ai vu pratiquement à chaque fois des gens dire que le raid1 serait "le meilleur". Cependant sur un topic sur ce forum (écrit par akabis) j'ai lu que le RAID5 serait plus conseillé pour des données alors que le RAID1 serait plutôt pour des bases de données ... Est-ce que vous pourriez m'expliquer ce point aussi?
Pour finir, un amis m'a conseillé cette solution chez sun : http://ch.sun.com/catalog/index_fr [...] andcontext
Qu'en pensez vous?
Je vous remercie d'avance pour vos réponses, n'hésitez pas à taper fort si j'ai sorti des conneries
Esox
---------------
Si la vérité est découverte par quelqu'un d'autre,elle perd toujours un peu d'attrait