Comment choisir un datacenter ? (DC 2/3)

Cet article fait partie d’une série sur l’écosystème d’un datacenter :

Le choix d’un datacenter

Le choix d’un datacenter se fait par l’observation d’un certain nombre de critères clef. Ce choix est important et doit être mûrement réfléchi car il est ensuite difficile de changer de prestataire sans devoir provoquer une interruption de service (demandée par le déplacement physique des machines).

70b3416a-9fe1-11df-baf4-bf1500fcf659

Les critères sont les suivants :

La classification du datacenter

Les datacenters sont répartis en quatre catégories, communément appelés Tiers. Ces catégories regroupent un certain nombre de garanties sur le type de matériel déployé par le datacenter ainsi que sur le niveau de redondance appliqué :

  • Tier I : Le datacenter est composé d’un seul circuit électrique pour l’énergie et pour la distribution de refroidissement, sans composants redondants, offre un taux de disponibilité de 99,671%.
  • Tier II : Le datacenter est composé d’un seul circuit électrique pour l’énergie et pour la distribution de refroidissement, avec des composants redondants, offre un taux de disponibilité de 99,741%.
  • Tier III : Le datacenter est composé de plusieurs circuits électriques pour l’énergie et pour la distribution de refroidissement, mais seulement un circuit est actif, a des composants redondants, offre un taux de disponibilité de 99,982%.
  • Tier IV : Le datacenter est composé de plusieurs circuits électriques pour l’énergie et pour la distribution de refroidissement, a des composants redondants, actifs et supporte la tolérance de panne, offre un taux de disponibilité de 99,995%.

Certains datacenters mettent en avant des demi-tiers. Ce sont des arguments commerciaux uniquement destinés à se démarquer de la concurrence.

Seuls deux datacenters sont réellement Tier IV aujourd’hui en région parisienne : le site de Condorcet de TelecityGroup, et le site PAR5 d’Interxion.

Le tiering est un critère global d’appréciation qui introduit à ce qui suit et qui ne doit pas être le seul critère de choix. Cela reste une simplification grossière qui doit être détaillée.

La situation du datacenter

Le datacenter doit se trouver à un endroit pratique, généralement proche du lieu d’administration, pour pouvoir se déplacer facilement sur place afin de configurer certaines machines. En effet, toutes ne sont pas administrables à distance. La localisation proche d’un point de transit urbain est appréciable (station de RER proche par exemple).

Il peut être important aussi d’avoir choisi un datacenter proche de ses clients, afin de limiter les temps d’accès (on se réfère généralement au pays, parfois au continent).

La présence d’un commissariat de police à proximité peut s’avérer rassurante. Certains datacenters mettent en avant l’utilisation d’anciens sites militaires.

Le taux de remplissage du datacenter

Certains datacenters sont quasiment pleins. Il faut alors se poser une question : si on pense devoir grandir dans le futur. C’est notre cas à L.systems, nous pensons avoir besoin d’une autre baie au minimum dans un ou deux ans. Il faut alors savoir si cela sera effectivement possible ou non.

Par exemple, OVH n’a quasiment plus de place disponible. Quand je les ai contactés, il leur restait moins de 5 baies. N’ayant aucun plan de construction de nouveau datacenter pour pallier à ce manque, ils ont donc été éliminés dans mon cas d’office.

Il faut aussi faire attention à la connectivité entre les baies dans le futur. Par exemple, chez Iliad, leur datacenter sera plein d’ici 4 mois. Cependant, ils ouvrent un deuxième datacenter à 15km (si je me souviens bien). Mes besoins en connectivité sont très importants (au moins 40 Gbps entre mes deux baies) : avoir une baie dans un centre et la deuxième dans un autre sera juste impossible. Le transfert d’un centre à l’autre posant un problème, cela a été un critère pesant dans ma décision.

L’apport en électricité

Elle provient souvent de plusieurs sources différentes, venant de centrales différentes sur des liens entièrement dissociés. Des anciens sites militaires sont parfois utilisés car étant sur les mêmes lignes EDF que les hôpitaux, donc les dernières à être coupées en cas de catastrophe majeure (catastrophe naturelle importante, attentat nucléaire, fin du monde…).

En cas de panne de courant par le fournisseur (EDF chez nous), des générateurs (très bruyants, on a testé !) doivent prendre le relais. Le nombre de générateurs est un élément important, ainsi que la quantité de fuel disponible sur site. Un contrat doit être établi avec une société pétrolifère (BP, Total…) pour remplir continuellement cette cuve tant que pourrait durer la coupure afin d’assurer la continuité de service.

Ces générateurs prennent du temps à démarrer, il faut donc utiliser des onduleurs pour maintenir l’état de marche en attendant. Ce laps de temps est de l’ordre de plusieurs minutes. Le nombre d’onduleurs est aussi un critère à surveiller.

Ces onduleurs doivent ainsi fournir suffisamment d’énergie à tout le datacenter. Ils ont donc à disposition un très grand nombre de batteries (généralement des salles entières pleines de batteries !), critère à surveiller aussi.

Les circuits apportant l’énergie au matériel sont souvent tous redondés, entièrement dissociés et de grande qualité. Cette chaine électrique d’urgence doit être testée régulièrement, si possible tous les mois. Il faut principalement faire attention aux démarreurs des générateurs car ce sont généralement eux qui sont fautifs en cas d’échec de la reprise d’activité : ils doivent correctement détecter la panne ce qui est loin d’être une évidence dans la pratique. Dans certains cas, plusieurs types de démarreurs sont utilisés conjointement : électriques, au gaz…

A l’heure actuelle, il n’y a plus de lignes EDF haute tension et de centrales électriques disponibles en région parisienne. Aucun projet de datacenter ne pourra ainsi voir le jour avant au moins 2015 (le dernier à être construit avant sera PAR7 d’Interxion, qui a été annoncé en septembre de cette année).

La climatisation

Le bâtiment doit être conçu pour limiter au mieux les besoins en climatisation. Elle doit être au minimum en N+N, signifiant qu’il doit y avoir autant de systèmes de climatisation autonomes en utilisation qu’en backup. Certains vont jusqu’à fournir une climatisation en N+N+1 ou N+N+2, en rajoutant des blocs de secours supplémentaires.

La présence de systèmes de climatisation écologiques est un plus, comme le free cooling, méthode de rafraichissement utilisant (souvent) l’air extérieur pour refroidir tout ou partie de l’eau du système de climatisation. Ce système est activé notamment en hiver. Il est possible de voir aussi des méthodes de free cooling utilisant l’eau de mer ou de lacs, les courants froids des hautes altitudes, la température extérieure de nuit ou la température des souterrains.

Free-coolers (reconnaissables facilement par leur forme caractéristique en trapèze)

Afin de réduire la surface à climatiser et donc d’optimiser leurs dépenses énergétiques, les datacenters se sont mis à ranger les baies côte à côte et les enfermer avec des portes et un faux plafond pour en faire des « couloirs froids » ou « cold corridors » :

Couloirs froids en datacenter

Des détecteurs sont installés un peu partout (souvent toutes les 3 baies) afin d’adapter précisément la température de chaque couloir indépendamment et de prévenir plus efficacement des incendies.

Certains datacenters vont jusqu’à refroidir non pas un ensemble de baies (sous forme de couloir) mais juste les baies elles-mêmes. Un système de ventilation y est alors intégré et chaque baie est reliée au circuit global de la salle.

La haute densité

Certains serveurs (notamment des baies de stockage à haute densité, comme certaines baies 3PAR) peuvent consommer énormément d’énergie. On les appelle « serveurs haute densité ». Leurs besoins en énergie oblige à les brancher sur des circuits électriques spéciaux, dans des salles spécialement étudiées pour. Elles sont généralement plus hautes de plafond, les baies sont plus espacées, le circuit de climatisation est surdimensionné et l’énergie arrive uniquement par le faux plancher.

La haute densité n’est pas proposée par tous les datacenters car elle nécessite un besoin en énergie important, généralement source d’investissements conséquents pour le datacenter. EDF soit aussi pouvoir fournir suffisamment d’énergie en ce point.

La sécurité

La sécurité est un élément important à ne pas négliger. Il doit y avoir obligatoirement un contrôle d’accès sérieux des locaux. Celui-ci s’effectue généralement par badge, auquel est souvent adjoint un système biométrique, de la méthode la plus à la moins préférable : par reconnaissance du réseau veineux, par reconnaissance de l’iris, par empreintes digitales.

Certains datacenters sont uniquement surveillés depuis un central de télésurveillance et une permanence sur place n’est pas toujours assurée (Vérité ! On a vu ! Et on a été immédiatement refroidis !).

Il peut être possible de demander dans certains datacenters une salle privée ou un couloir privé, avec son propre contrôle d’accès. On peut aussi demander l’installation de caméras IP supplémentaires pour un contrôle personnel.

Les mesures anti-incendie

Les mesures anti-incendie sont à vérifier. Le système en place est souvent à base de gaz inerte. On le reconnait facilement aux grosses bombonnes entreposées dans les salles. Si un départ d’incendie a lieu, des sirènes résonnent (très très fort) et des panneaux lumineux indiquent la sortie afin que la salle soit évacuée immédiatement. Celle-ci est scellée moins de 5 minutes plus tard. Le gaz est alors relâché et remplace l’oxygène de la salle, étouffant le feu par la même occasion.

Un système à base de gouttelettes d’eau peut être aussi rencontré. Il a la particularité de ne pas présenter les mêmes dangers que le gaz et les microgouttelettes d’eau ne sont à priori pas dangereuses pour le matériel.

Les détecteurs sont généralement multiples : détection de fumée classique, détection laser, détection par changement de température…

Ces systèmes doivent être redondés et fréquemment contrôlés et testés.

L’historique des incidents

Le datacenter doit avoir le moins possible d’antécédents d’incidents, et s’il en a eu, il faut faire particulièrement attention au déroulement de ceux-ci, aux conséquences engendrées et aux dédommagements aux clients.

Souvent, les datacenters ne communiquent pas sur ces incidents (Iliad avec sa perte de climatisation il y a quelques mois). Il faut donc se renseigner comme on peut et choisir en conséquence.

Les garanties réelles apportées (les SLA)

Certains points des SLA sont à examiner particulièrement. Ainsi, les garanties de disponibilité de l’électricité et de la climatisation sont à observer avec attention. La température maximale de la baie (ou de la chambre froide) aussi. Chaque datacenter a des critères qui lui sont propres. Il faut donc lire entre les lignes et faire attention à ce que tout soit en adéquation avec ses besoins.

En cas d’incident, le client est rétribué à hauteur des dommages. Ceci varie énormément entre datacenters. Certains remboursent les heures d’indisponibilité, parfois remboursent l’abonnement du mois. D’autres, plus sérieux, ont des contrats d’assurance couvrant la perte de chiffre d’affaire de leurs clients.

Les SLA sont généralement indiqués sous forme de pourcentage : 99%, 99.9%… Ces pourcentages, au premier abord sécurisants, sont pourtant trompeurs :

  • 99 % : indisponible moins de 3,65 jours par an
  • 99,9 % : indisponible moins de 8,75 heures par an
  • 99,99 % : indisponible moins de 52 minutes par an
  • 99,999 % : indisponible moins de 5,2 minutes par an
  • 99,9999 % : indisponible moins de 54,8 secondes par an
  • 99,99999 % : indisponible moins de 3,1 secondes par an

L’indisponibilité peut cependant parfois être au mois. 99% d’un mois n’est pas équivalent à 99% d’une année.

Certains datacenters peuvent vous garantir un SLA qu’ils ne peuvent techniquement pas honorer. Ils ont donc des contrats d’assurance qui leurs permettent d’augmenter leurs SLA.

Il faut faire attention car le risque de panne est plus grand qu’indiqué, cependant la rétribution sera plus facilement obtenue. C’est le cas d’Interxion, qui affiche 99.999 % de disponibilité électrique (plus que ce que peut fournir EDF). Pour pallier à cela, ils ont une assurance couvrant la perte de chiffre d’affaire de leurs clients, critère très sécurisant.

Les interconnexions et les fournisseurs de transit

Un certain nombre de fournisseurs de transit desservent les datacenters. Généralement, plus un datacenter est gros, plus il a d’opérateurs en desserte. Il faut donc faire attention à ce que le ou les opérateurs de transit choisis soient bien présents dans le datacenter.

Certains gros datacenters hébergent des points d’appairage (points de peering). Ces points sont très pratiques car ils permettent aux acteurs sur place de s’interconnecter très facilement. Il s’agit d’un élément qui peut être déterminant sur le choix d’un datacenter à la place d’un autre.

Le PUE (Power Usage Effectiveness)

Le PUE (ou Power usage effectiveness) est un ratio déterminant l’efficacité énergétique d’un datacenter. C’est un des éléments de l’informatique éco-responsable (green IT).

Idéalement, l’énergie serait consommée uniquement par les serveurs déployés par le centre, conduisant à une valeur de PUE idéale de 1,0. Cependant le centre comportera toujours d’autres équipements électriques, et donc le ratio par rapport à l’énergie qu’il consomme sera toujours plus élevé que 1.

Malgré que la plupart des datacenters actuels aient un PUE proche de 2, il est possible de trouver des datacenters français avec un PUE de 1,3. Le record actuel est d’1,1.

Les certifications du datacenter

Certaines entreprises accordent une grande importance aux certifications (par exemple les banques). Ces certifications sont parfois des éléments primordiaux dans le choix d’un datacenter. On retrouve parfois les certifications suivantes :

  • ISO27001:2005 (gestion de la sécurité) : Cette norme détaille les conditions de conception, de mise en œuvre, d’exploitation, de contrôle, de révision, de maintenance et d’amélioration d’un système dédié à la gestion de la sécurité des informations, sous l’angle des risques métiers propres à une entreprise. Elle garantit le respect des meilleures pratiques de contrôle de la sécurité afin de protéger les informations.
  • ISO 9001:2008 (gestion de la qualité) : Cette certification témoigne de l’existence d’un système de gestion de la qualité efficace, ayant satisfait aux tests rigoureux d’un audit indépendant.
  • OHSAS 18001 (management de la santé et de la sécurité au travail) : Cette certification est octroyée aux entreprises démontrant leur capacité à gérer les risques professionnels, à réduire les risques et à créer un environnement de travail sécurisé. Par exemple, tous les employés de TélécityGroup sont formés aux premiers soins, quelques soient leur travail ou leur métier.

Parce que le green-IT est un enjeu grandissant et que les datacenters sont directement concernés (et souvent pointés du doigt), ceux-ci aiment aussi mettre en avant les normes environnementales et les certifications qu’ils ont obtenu sur ces sujets. On retrouve notamment :

  • ISO 14001 (gestion environnementale) : Cette certification est octroyée aux entreprises démontrant leur capacité à gérer les problématiques environnementales. Elle met en relief l’engagement permanent du datacenter à la fois à maximiser l’efficacité énergétique de ses datacenters et à développer de nouveaux équipements innovants.
  • Carbon Trust Standard : Le premier label au monde attribué aux entreprises qui mesurent, gèrent et réduisent leurs émissions de gaz à effet de serre dans l’ensemble de leurs activités.
  • Membre du Green Grid : Le Green Grid est un consortium mondial qui promeut auprès des entreprises de tous secteurs les pratiques, métriques et technologies améliorant l’efficacité énergétique globale de leurs datacenters.
  • Corporate Status : défini par le Code de conduite européen des centres de données, il s’agit d’une nouvelle initiative de l’Union Européenne visant à mesurer les performances énergétiques des datacenters et à diffuser les bonnes pratiques.
  • Les classements RSE : Pour « Responsabilité sociale et environnementale » ou « Responsabilité sociale des entreprises », le RSE est la contribution des entreprises aux enjeux du développement durable.

Au final, que faire ?

Visiter ! Il est impossible de se faire une idée d’un datacenter sans y aller et le visiter.

Rien de vaut les explications en pleine visite, de voir les équipements par soi-même, les noms des clients sur place, le remplissage du datacenter (s’il est déjà plein ou si des salles entières sont encore disponibles), s’il est en travaux ou non, si la sécurité a l’air d’être effective en pratique (ce qui est en fait loin d’être toujours le cas !) …

Il faut idéalement visiter au moins une dizaines de sites avant de se prononcer, car chaque datacenter est fondamentalement différent d’un autre.

Notre choix

Il est inutile que je relate les visites qui ne nous ont pas marquées. Les plus intéressantes ont été les suivantes :

  • Iliad : Très beau datacenter. Géré par des gens d’Epitech (du bocal). Ce sont de vrais geeks comme on les aime, et ils jouent bien sur cette carte ! Le problème de place défini plus haut, leur manque de communication suite à leur panne, leurs tarifs et notre connaissance de la fiabilité des « bocaliens » les ont écartés de notre choix. C’est ça de sortir d’Epita ! :)
  • Telecity Condorcet : Le plus beau datacenter que nous ayons vu. Vraiment un bijou. A visiter ne serait-ce que pour la curiosité et pour s’en mettre plein la vue. Ils offrent tout : ils ont le maximum de certifications, ils sont Tier IV, coté électricité ils sont nickel, des SLA excellentes. La note humoristique viendra de leur serre tropicale qu’ils mettent en avant pour dire qu’ils sont green :mrgreen:
  • Interxion PAR6 : Un datacenter qui ne paye pas de mine, en banlieue sud (pour changer), correct et surtout aux tarifs très très compétitifs pour cette qualité. Nous avons beaucoup hésité.
  • Interxion PAR5 : L’autre datacenter Tier IV français. Très légèrement en retrait par rapport à Condorcet sur le plan technique du fait de son âge plus avancé, il compense par des meilleures SLA et une meilleure localisation (ils sont à la sortie du RER, contre un commissariat !). leurs tarifs sont similaires aussi, légèrement inférieurs. Enfin, ils hébergent le point de peering FranceIX.

Nous avons ainsi choisi PAR5 :

  • Ils sont au top côté technique, comme Condorcet
  • Ils ont les meilleures SLA (dont le remboursement des pertes de chiffre d’affaire)
  • Ils sont très bien situés
  • Ils hébergent FranceIX (on le verra dans la suite, c’est devenu un point crucial pour nous)
  • Leurs tarifs sont chouettes (avec la réduction des frais d’installation due à la connexion sur FranceIX et avec les offres de Noël)

Nous verrons dans le prochain article comment se connecter à Internet (DC 3/3).

Commentaires

Sebastien dit :

Euh il y a aussi le Datacenter d’ASPSERVEUR, Tier IV, très haute densité, 3800 m2 et 2 X 8 MégaWatts.