Dossier Hosting : garanties de service sur papier et dans la pratique

Un problème technique arrivé à l'un des principaux centres de données commerciaux de Belgique a subitement rappelé à l'ensemble du marché de l'hébergement l'existence de toutes sortes de scénarios de secours et de clauses pénales. De nombreux fournisseurs d'hébergement ont dû, justement le 1er avril, informer leurs clients de la raison pour laquelle tous leurs services avaient été indisponibles pendant plus de huit heures d'affilée. Tout sauf un poisson d'avril, et le testcase idéal pour les clauses en petits caractères dans les contrats.

post-image-3

Quand vous négociez un contrat d'hébergement, toutes sortes d'aspects sont abordés. En tant que client, vous ne voulez cependant qu'une seule chose: que vos serveurs continuent de tourner quoi qu'il arrive, jour et nuit, sans interruption. Dans la pratique, il est pourtant impossible d'exclure entièrement les calamités. La question simple du client se voit par conséquent proposer une réponse extrêmement complexe. Combien de garanties voulez-vous? Combien êtes-vous prêt à payer à cet effet? Et quelle est la valeur pratique de toutes ces garanties de service sur le papier?

Entre-temps, nous avons compris que certaines formules d'hébergement économiques d'outre-mer n'offraient pas le même niveau de service que les fournisseurs belges de qualité. Et que le bricolage implique des risques sérieux – tant au niveau de la dispersion des risques que des coûts supplémentaires et de l'investissement d'un coûteux temps de travail aux dépens de vos tâches de base. Il apparaît toutefois que de nettes différences existent aussi entre les fournisseurs belges ‘de qualité'. C'est le prix qui est le plus frappant sur ce plan.
Quelle est la différence? Jusqu'où va la qualité du service? Et comment quantifier ces légères différences? L'ensemble débouche en fin de compte sur un débat assez subjectif sur l'adéquation culturelle avec le fournisseur de services, sa réputation sur le marché…

Neuf, neuf, neuf?

Au fil des ans, un consensus s'est cependant dégagé sur une façon d'établir de manière quantitative des niveaux de service. Dans la pratique, il s'agit de la disponibilité, généralement mesurée en nombre de minutes de panne. Avoir un seul interlocuteur semble avantageux, parce que vous pouvez alors convenir d'un SLA global, faute de quoi vous risquez de rencontrer une fois un problème de connectivité, d'être confronté à un autre moment à un disque dur défectueux, etc. L'approche totale a fait en sorte que les hébergeurs ont non seulement appliqué un meilleur contrôle, mais ont aussi dédoublé les lignes et le matériel, prévu des stocks de réserve…

Les hébergeurs de qualité garantissent ainsi que vous ne souffriez que quelques heures d'indisponibilité par mois. Ils ont principalement investi dans des connaissances et des procédures pour limiter l'impact en cas de pannes prévisibles. Avec des hotswaps en RAID, un stock de réserve et des spécialistes sur place, il est possible de remplacer un disque dur défectueux sans une seule seconde d'indisponibilité. Et ainsi de suite.

Avec des mesures complémentaires, le niveau de fiabilité peut être porté à 99,9% (43 minutes d'indisponibilité possible par mois) ou, dans des circonstances extrêmes, jusqu'aux légendaires ‘cinq neuf' (99,999% ou quelque 5 minutes d'indisponibilité par an).
“La garantie de service de base dans nos contrats d'entrée de gamme s'élève 99,5%”, explique Egbert Veldhuis, marketing manager chez Terremark, le fournisseur haut de gamme de Miami et nouveau propriétaire du récemment racheté Dedigate. Un calcul rapide indique que cela correspond à 3 heures et 42 minutes d'indisponibilité possible par mois. “Attention, chez Terremark, le compteur est remis chaque mois à zéro. Nous ne calculons donc pas de temps d'indisponibilité cumulé par an, qui ferait en sorte que vous vous retrouviez à un moment donné avec plus de 40 heures d'indisponibilité.”

David Geens de Nucleus compte même 99,97% comme garantie de base, soit environ 2h30 d'indisponibilité par an. “Une garantie encore plus élevée est possible, mais moyennant un sérieux surcoût. Il faut alors se tourner automatiquement vers une solution avec plusieurs centres de données. Même les grands centres de données commerciaux rencontrent tôt ou tard un problème”, reconnaît-il.

Clauses pénales

Un malheur n'arrive jamais seul, selon le proverbe. Et cela a récemment été le cas dans l'un des principaux – et des plus réputés – centres de données du pays. Il a été question d'une ‘cascade' de problèmes, qui ont finalement provoqué un échec des procédures de secours. Bon nombre d'hébergeurs belges ont ainsi vu leur infrastructure indisponible elle aussi.
Pour les clients finaux, les hébergeurs sont dans ce genre de cas l'interlocuteur unique, qui ne respecte pas son engagement en matière de disponibilité. En tout état de cause, le dommage est souvent bien plus grand que ce qui figure dans les clauses pénales. “Un SLA ne peut jamais compenser ce que vous perdez réellement. Quand cela tourne mal, la compensation propose nettement moins que la perte réelle”, constate Jonas Dhaenens, CEO de Combell, qui a fait lui aussi partie des victimes.

“Ce genre de cas est le cauchemar de chacun dans le secteur”, confirme David Geens de Nucleus, qui a, quant à lui, été épargné par la catastrophe. “Nous avons aussi des SLA avec nos sous-traitants, mais les clauses pénales sont en l'occurrence moins strictes dans la pratique. Les services des centres de données sont en quelque sorte une matière première que nous transformons en produit fini. En cas de problèmes sérieux, nous devons donner nettement plus de compensations que ce que nous recevons”, indique David Geens.

Bon nombre de centres de données limitent leur responsabilité à une réduction sur la facture mensuelle. En cas de gros problèmes, l'indemnité peut représenter plusieurs mois. En tant qu'hébergeur, cela vous fait une belle jambe si vos clients s'en sont allés entre-temps parce qu'ils étaient mécontents, ou si leurs réclamations sont encore bien plus élevées. “Nos clients savent parfaitement ce que d'éventuelles indisponibilités leur coûtent réellement – pour une place de marché américaine, cela atteint même jusqu'à 600 dollars par seconde”, explique Egbert Veldhuis de Terremark. “Il n'y a d'ailleurs jamais de discussion sur les restitutions. Si nous ne respectons pas le SLA mensuel, toute la période est alors gratuite. Si nous sommes en défaut trois fois, le client a même le droit de rompre le contrat sans autre forme de procès.”

Dommage indirect

Les centres de données commerciaux limitent néanmoins leurs clauses pénales au montant que l'hébergeur ou client final paie, et éventuellement au dommage causé aux serveurs et autres équipements. Le dommage indirect – comme la perte de client et de réputation – n'est généralement pas couvert. “Le dommage indirect est très spéculatif. La démontrabilité pose problème”, estime Marc Crauwels, administrateur délégué d'InfoSupport. En raison du caractère critique des activités, InfoSupport est néanmoins couvert jusqu'au maximum de l'assurance en responsabilité civile. Néanmoins, quand un seul incident a un impact pour plusieurs clients, l'assurance ne paie qu'une seule fois.

“Nous essayons de parer à tous les scénarios catastrophes possibles avec une combinaison d'assurance incendie, de responsabilité civile, etc. Le manque de connaissances auprès des assureurs sur notre activité spécifique constitue un réel problème”, précise David Geens.
C'est Combell qui va le plus loin à ce niveau pour le moment, grâce à des polices spécifiques auprès d'assureurs américains qui acceptent de couvrir ce genre de risques. “Nous avons l'assurance la plus étendue qui existe actuellement sur le marché, de sorte que nous pouvons faire face à des réclamations très élevées – jusqu'à plusieurs millions d'euros”, explique Jonas Dhaenens. “Cela nous coûte énormément d'argent, et nous n'offrons donc cette garantie que dans des SLA très lourds, personnalisés pour des entreprises spécifiques.” Contrairement aux assureurs européens, les polices américaines couvrent des dommages indirects comme le manque à gagner.

Transparence

En plus du dommage que vous subissez en tant qu'hébergeur via les compensations financières s'ajoute encore la crise de confiance. Un scénario de secours doit dès lors être prévu pour remettre en service le parc de serveurs aussi rapidement que possible. Mais une bonne communication de crise est tout aussi importante dans ces moments-là. Un flot d'appels téléphoniques peut en effet rendre les choses encore plus difficiles à un moment de stress intense.

“La première tâche consiste à remettre tout en ligne. Mais une bonne communication de crise évite de nombreux problèmes par la suite”, confirme David Geens de Nucleus. “Nous avons dès lors écrit une série de procédures d'urgence. En cas de graves problèmes, nous adaptons par exemple immédiatement notre propre page Web et le central téléphonique. Cette communication doit être courte, puissante et concise. La priorité doit en effet être donnée à la résolution du problème.”

“La transparence vis-à-vis du client est extrêmement importante”, estime également Jonas Dhaenens. “Nous avons aussi vu directement l'opportunité de convaincre de nombreux clients à passer à une infrastructure encore plus sûre. Pour mieux répondre à leurs besoins, nous développons actuellement un réseau de centres de données multiples.”

Mesures physiques

En fin de compte, aucun client n'est vraiment intéressé par des compensations, mais bien par un service fiable. Le facteur hasard est très relatif quand vous prenez les bonnes mesures techniques. “Contrôlez quels ‘single points' peuvent poser problème et élaborez vos SLA en tenant compte de ces éléments. Un hébergeur qui donne davantage de garanties sans s'attaquer à l'infrastructure raconte des bêtises”, affirme Jonas Dhaenens. “Il y a effectivement encore énormément de ‘SLA marketing' en circulation”, confirme Egbert Veldhuis.

Eviter les pannes est une chose. Mais intervenir très rapidement en cas d'incident constitue un point au moins aussi important. “C'est la raison pour laquelle nos ingénieurs sont sur place 24 heures sur 24 et 7 jours sur 7”, souligne-t-il. Les opérations sont également aussi standardisées et automatisées que possible. “En cas d'incidents, il faut pouvoir faire appel rapidement à des serveurs non utilisés. C'est pourquoi nous avons constamment environ 10% de serveurs prêts à intervenir, en stand-by. Si vous devez encore retirer de sa boîte le nouveau serveur, vous n'avez aucune chance de tenir votre SLA”, prévient Egbert Veldhuis de Terremark.

Pour des garanties vraiment élevées, vous devez inévitablement recourir à une configuration avec deux centres de données séparés. Il s'agit toutefois d'une solution toujours très coûteuse, qui n'est proposée qu'aux tous gros clients. “Parmi les hébergeurs belges, l'idée de proposer des services de fail-over automatique entre eux fait son chemin”, indique Marc Crauwels. De cette manière, une garantie supérieure deviendrait plus abordable. Mais en fait de compte, la commutation comporte toujours un risque. “Le pire cauchemar, c'est que le fail-over ne fonctionne pas dans un environnement de double centre de données”, avoue Egbert Veldhuis.

Label de qualité

Une dernière difficulté pour les hébergeurs belges réside dans le manque de connaissances de certains clients. Ils ne comprennent pas toujours d'où proviennent les fortes différences de prix, et ils se sentent floués en cas de problème avec un fournisseur moins coûteux. “C'est la raison pour laquelle nous préparons pour le moment un label de qualité, en collaboration avec cinq hébergeurs belges. Cela doit permettre aux clients de comparer des pommes avec des pommes”, conclut Marc Crauwels d'InfoSupport.

Back to top button
Close
Close