Microsoft Exchange Server 2010: Haute Disponibilité

Microsoft Exchange Server 2010: Haute Disponibilité

Haute Disponibilit : DAG 08/02/2011 Matthieu PARFUS Consultant Senior II Microsoft Consulting Services 2 Microsoft Services: Un accompagnement global de nos clients Architecture & Planning Conseil et Projets Support Planification Dploiement et adoption Optimisation et Opration Support Premier Premier Support Consulting Services

Services Consulting Enterprise Strategy Strategy Enterprise Evaluation Dveloppement Planification Stabilisation Dploiement Division Services France 2010 Support Oprations Division Services Monde 2010 180 Consultants

125 Technical Account Managers 190 Ingnieurs Support 17 Responsables de Mission 41 Partenaires rfrencs www.microsoft.fr/services 3 3 82 pays couverts 18 000 employs 35 000 partenaires 44 langues parles par nos ingnieurs Notre positionnement est dintervenir sur les projets critiques et les technologies rcentes Criticit du projet Notre engagement auprs de nos partenaires est :

De leur assurer un transfert dexpertise, De leur apporter notre support sur les dernires technologies, De leur donner accs aux meilleures pratiques de mise en uvre et de support. Partenaires Maturit de la technologie Nos clients et partenaires sont particulirement satisfaits par Le niveau dengagement des consultants : 94% La gestion de lquipe de projet : 92% Les comptences techniques des consultants : 91% La relation avec les quipes du client : 90% 4 4 Agenda

Principes Pr-requis et limites Dimensionnement Paramtres MBX membre dun DAG Fonctionnement rplication Quorum et FileShareWitness Active Manager Slection de la meilleure copie Datacenter Activation Coordination (DAC) Rsilience de site Nouveauts du SP1 5 Principes du DAG DAG : groupe de serveurs ayant le rle Mailbox (MBX) Les bases de donnes peuvent disposer dune ou plusieurs copies entre les MBX du DAG (une active, les autres passives)

Transmission de log de transaction au travers du rseau (logshipping), et commit sur les DB Passives Haute Dispo DAG associe au CAS Array (Ferme de CAS) Primary Active Manager (PAM) : Mcanisme dactivation automatique de la meilleure copie Complexit apporte par : DAG tendu sur plusieurs sites gographique => SplitBrain / mcanisme de redmarrage Commit retard (lagged copy) 6 Pr-requis et limites (1) Intgration AD : MBX prsents sur un ou plusieurs sites AD / VLAN Plusieurs DAG peuvent tre prsents dans un site AD Tous les nuds doivent appartenir au mme domaine 1 CAS Array par site AD (8 CAS max si NLB) Nom du DAG < 16 caractres MBX ne doit pas tre avoir de rle DC/GC 7

Pr-requis et limites (2) Service Failover Cluster : Valide la prsence ou labsence des nuds (heartbeat) 16 nuds maximum par DAG Information dtt stocke dans ruche cluster (utilis par le PAM) Implique Windows Server 2008 Entreprise ou 2008 R2 Entreprise) Activation du DAG ne ncessite pas de r-installer Exchange (installation incrmentale) Utilisation rduite du failover cluster Plus de modle de ressources / groupe pour Exchange / partage de stockage Plus de dll exres.dll Uniquement : Nom, IP, Quorum (si nb de nuds pair) Les nuds et les rseaux doivent tre grs au travers de lEMC et non des outils cluster 8 Pr-requis et limites (3) DB

Maximum (Active, Passive ou Dossiers Publics confondus) : Exchange Server Standard = 5 DB maximum Exchange Server Entreprise = 100 DB maximum Nom unique de la DB dans lorganisation (globalisation) Taille DB : Supporte = 16 To Maximum recommand sans Haute Dispo = 100 Go Maximum recommand avec plusieurs copies dans un DAG = 2 To Log CheckpointDepth Target : Stand Alone = 20 Mo DB active qui a plusieurs copies = 100 Mo 9 Pr-requis et limites (4)

Mutualisation des rles CAS et HT peuvent tre installs sur un MBX membre dun DAG Failover Cluster : NLB nest pas support CAS membre dun DAG => Hardware Load Balancer HT : le rle nest pas utilis pour les communications mise par nud (sauf si dernier HT disponible dans le site) Datacenter Activation Coordination Mode (DAC) : 3 MBX minimum et 2 sites AD distincts (RTM) Virtualisation : Solutions de Haute Dispo Virtu (LiveMigration et VMWare HA) non supportes avec les membres dun DAG et host qui hberge le FSW NIC : 1 supporte 2 minimum recommandes, NIC ddie : Rplication MAPI, dialogue HT/CAS/GC MBX MultiVLAN : /!\ associer les Subnets ; Rseau MAPI et Rplication ne doivent pas se voir ; netsh au10lieu de route add

Dimensionnement Exchange 2010 Mailbox Server Role Requirements Calculator + Exchange Processor Query Tool Nombre de nuds Nombre de cores CAS / HT / GC Dimensionnement des LUN DAG multi-sites Trafic rseau Compression activable sur le mme VLAN voir entre VLAN diffrent uniquement Nombre/Type de disques et redondance associe 11 Paramtre MBX dun DAG Set-MailboxServer autoDatabaseMountDial : BestAvailability = 12 (default) GoodAvailability = 6 Lossless = 0 DatabaseCopyAutoActivationPolicy Blocked : activation impossible sur le serveur IntraSiteOnly : activation possible seulement si

le MBX est dans le mme site que le MBX dorigine Unrestricted : pas de restriction MaximumActiveDatabases : DB maximum qui peuvent tre actives sur un MBX 12 Fonctionnement Replication Continue mode Fichier rplication Changement depuis Exchange 2007 : TCP Socket au lieu du SMB Plus de pull : la copie passive notifie la copie active des fichiers rcuprer (TCP notification), la copie active pousse alors les fichiers (TCP socket) Une copie passive peut tre source lors dun reseed DB Dossier publics peut tre prsente sur un MBX membre dun DAG, mais la rplication doit toujours sappuyer sur les replicas de dossiers Rplication gre par lInformation Store (plus par le service Replication) => informations dj dans le cache, acclre lactivation de la DB 13

Fonctionnement Fichier de log = 1 Mo rplication Rplication peut tre compresse / encrypte : Entre toutes les machines Entre VLAN Pour du seeding CopyQueueLength = Nb Log en attente dtre copies et inspectes ReplayQueueLength = Nb Log en attente de commit Set-mailboxdatabasecopy: -ReplayLagTime = dlai avant commit (14 j max) - TruncationLagTime = dlai du purge des logs aprs commit (14 j max) -ActivationPreference = Utiliser lors du calcul de la meilleure copie activer, et dans la redistribution des DB 14 Quorum et Intgrit :

FileShareWitness Tous les nuds doivent disposer des mmes informations de configuration Service Cluster ne dmarre pas si le nud ne dispose pas des dernires informations Calcul de majorit dans le DAG Nombre de nuds pairs : quorum => File Share Majority Ressource Quorum FileShareWitness : vite les phnomnes de split-brain. Verrou est positionn sur le fichier witness.log par un nud (SMB), il possde alors une double voix lors des lections. Les autres nuds qui peuvent le contacter sont additionns dans le calcul /!\ FileShareWitness ne possde pas de copie du Quorum Nombre de nuds impairs : Quorum => Majorit de nuds Nombre de nuds insuffisants pour obtenir la majorit => le service sarrte Recommandation Crer un DAG avec un FileShareWitness mme si nombre de nuds 15

Active Manager Primary Active Manager (PAM) Un des nuds du DAG Il dcide quelle copie doit tre active et passive dans le DAG Il reoit les modifications de topologie, dtat des nuds et il ragit une panne Il est toujours le nud qui possde la ressource Quorum du cluster Group Il faut dplacer le rle PAM avant deffectuer une maintenance sur le serveur En cas de panne, un autre nud capture le rle PAM Standby Active Manager Il dtecte les pannes sur les bases locales ou lInformation Store Il demande au PAM en cas de panne deffectuer une bascule de DB Il transmet linformation du nud qui possde la base active aux autre rles nots comme Active Manager Client Il reoit les informations de supervision du service de rplication ou du moteur ESE (problme dI/O) Le SAM est prsent sur tous les nuds (y compris sur celui hberge le PAM) Standalone Active Manager

Rle MBX non membre dun DAG 16 Slection de la meilleure copie Best Copy Selection (BCS) Dtection du meilleur nud pour activer la copie (jusqu 10 critres sont utiliss) Attempt to Copy Last Log (ACLL) : Tentative de copie de toutes les dernires log manquante depuis la DB Active PAM demande au nud qui hberge la meilleure copie de la monter Pas de perte de logs / lossless failover => pas de perte dinformation Perte de logs => le MBX contacte les HT pour obtenir des messages conservs en tampon (Transport Dumpster) Raison pour que la meilleure copie ne monte pas : Nombre de logs perdues > autodabasemountdial Nombre de DB active >= MaximumActiveDatabases

Copie suspendue dactivation (DatabaseCopyAutoActivationPolicy) => PAM demande alors la meilleure copie suivante de monter, etc. 17 Slection de la meilleure Algorithme (RTM) copie 1re tape : DB ligible Statut = healthy, disconnectedAndHealthy, disconnectedandresynchronizing, seedingsource 2ime tape : Tri 1er niveau : Copy Queue Length / LastLogInspected => la plus grande log inspecte est mise en premier. 2ime niveau : ActivationPreference => le plus faible est mis en premier 18 Slection de la meilleure Algorithme (RTM) copie

3ime tape : Validation de ltat de la copie 19 Slection de la meilleure copie Database Copy Activation Preference Copy Queue Length Replay Queue Length Content Index State

Database State Activation Blocked Srv2\DB1 2 4 0 Healthy Healthy No Srv3\DB1 3 2

2 Healthy Disconnecte dAndHealthy No Srv4\DB1 4 10 0 Crawling Healthy No 1re tape : Toutes les copies sont healthy ou disconnectedandhealthy 2ime tape tri : Srv3, Srv2, Srv4 Srv3 Srv2

Srv4 Phase CopyQueue ReplayQueue ContentIndex 3ime tape : X X X Phase1 Phase2 Phase3 Phase4 Phase5 Phase6 Phase7 Phase8 Phase9 Phase10 < 10 logs < 50 logs Healthy < 10 logs < 50 logs

Crawling ========== < 50 logs Healthy ========== < 50 logs Crawling ========== < 50 logs ========== < 10 logs ========== Healthy < 10 logs ========== Crawling ========== ========== Healthy ========== ========== Crawling Any database not activation suspended ACCL : si log manquantes < autodabasemountdial => mounted + Transport Dumpster sinon, essai avec la copie du 20 Srv2, etc. Slection de la meilleure copie

Database Copy Activation Preference Copy Queue Length Replay Queue Length Content Index State Database State Activation Blocked Srv2\DB2 2 2

0 Healthy Healthy No Srv3\DB2 3 2 2 Healthy Disconnecte dAndHealthy No Srv4\DB2 4

10 0 Crawling Healthy No 1re tape : Toutes les copies sont healthy ou disconnectedandhealthy 2ime tape tri : Srv2, Srv3, Srv4 (copyqueuelength = ; activation preference <>) Srv2 Srv3 Srv4 Phase CopyQueue ReplayQueue ContentIndex X X Phase1 < 10 logs < 50 logs Healthy 3ime tape : Phase2 < 10 logs < 50 logs Crawling

X Phase3 Phase4 Phase5 Phase6 Phase7 Phase8 Phase9 Phase10 ========== < 50 logs Healthy ========== < 50 logs Crawling ========== < 50 logs ========== < 10 logs ========== Healthy < 10 logs ========== Crawling ========== ========== Healthy ========== ========== Crawling Any database not activation suspended

ACCL : si log manquantes < autodabasemountdial => mounted + Transport Dumpster 21 Datacenter Activation Evite certains cas de split-brain : Coordination Datacenter 1 : MBX1, MBX2 Datacenter 2 : MBX3 Panne de courant sur Datacenter 1 => Activation Datacenter 2 => DB montes sur MBX3 Retour du courant sur Datacenter 1, mais pas de rseau Sans DAC, MBX1 et MBX2 pensent avoir la majorit et montent les DB alors quelles sont actives sur MBX3 Avec DAC, majorit retrouve => DB ne remontent pas automatiquement 22 Datacenter Activation Un bit positionn en mmoire

Coordination En mode DAC : Active Manager dmarre => bit = 0 (ne pas monter les DB automatiquement) Il tente de contacter les autres MBX Si un MBX a un bit = 1 ou si tous les MBX sont joignables => le bit passe 1 RTM : 3 nuds et 2 sites AD minimum 23 Rsilience de site DAG tendu sur un site AD ? 24 Rsilience de site DAG tendu sur un site AD ?

Bascule automatique : Implique HLB cross-Datacenter Ajoute une complexit rseau Redondance de point dentre rseau si VLAN tendu Dialogue CAS / HUB GC / MBX cross Datacenter Pas support de positionner un Firewall entre CAS et MBX Bascule complte dun site en cas de perte de connectivit rseau => Modle viter si utilisateurs prsents dans chacun des sites Gestion des URL souvent plus simple 25 Rsilience de site DAG tendu sur deux sites AD ? 26 Rsilience de site DAG tendu sur deux sites AD ?

Bascule automatique : Complexe en cas de perte complte de Datacenter (HLB cross Datacenter, redirection MAPI/HTTP) Toujours du trafic entre Datacenter HUB HUB CAS MBX (dpend du CAS Array configur sur la DB, et de la valeur du profil Outlook) Gestion des URL souvent plus compliqu OWA/ECP : internalURL => FQDN du CAS pour Kerberos Deux DAG croiss en mode A/P vitent de couper les utilisateurs lorsquils sont prsents sur les 2 sites Utilisation dun AlternateFileShareWitness sur lautre site Recommandation : changement dadresses IP des CAS Array / URL => amliore lexprience utilisateurs (TTL prendre en compte) 27 SP1: DAC Maintenant sont supports : DAG 2 noeuds (utilisation dun FileShareWitness) DAG tendu sur plusieurs sites gographiques mais dans le mme site AD 28

SP1: Rplication continue mode blo Mise jour crite dans le buffer de log : de la DB active de chacune des copies passives Buffer de log plein => chaque copie construit, vrifie, et gnre un nouveau fichier de log Panne de la copie active =>copies passives disposent des dernires informations Pas de verrou sur la copie active => pas dimpact pour lexprience utilisateur Rduit le temps de propagation des changements Au dmarrage, la rplication est en mode fichier Replication jour en mode fichier (copy queue length = 0) => Activation du mode bloc Passage automatique dun mode un autre (process log copier ) 29 SP1: Rplication continue

mode bloc Savoir que le mode bloc est activ pour la copie : Compteur de performance : MSExchange Replication \ Continuous replication block mode Active = 1 Get-Counter -ComputerName Counter "\MSExchange Replication(*)\Continuous replication - block mode Active" Get-WMIObject -ComputerName Win32_PerfRawData_MSExchangeReplication_MSExch angeReplication | Where-Object {$_.ContinuousReplicationBlockModeActive -eq "1"} | Where-Object {$_.name -ne "_total"} | format-table Name,ContinuousReplicationBlockModeActive 30 SP1: Outils de supervision

Checkdatabaseredundancy.ps1 : Valide que toutes les DB sont redondes et quau moins 2 copies sont saines Intgration avec System Center Operation Manager 2007 Trs utile en cas dutilisation de JBOD StartDagServerMaintenance.ps1 : Positionne un membre du DAG en maintenance Dplace les DB actives vers dautres membres et empche lactivation de DB Dplace vers un autre membre le rle PAM et lempche de revenir StopDagServerMaintenance.ps1 pour terminer la mise en maintenance CollectOverMetrics.ps1 : Permet dobtenir des informations sur les bascules planifies ou non Fournit des informations sur le mode de rplication (mode bloc) CollectReplicationMetrics.ps1 : 31 URL

Exchange 2010 Mailbox Server Role Requirements Calculator : Description : http://msexchangeteam.com/archive/2009/11/09/453117.aspx Mise jour : http://msexchangeteam.com/archive/2010/01/22/453859.aspx Tlchargement : http://msexchangeteam.com/files/12/attachments/entry453145.aspx Exchange Processor Query Tool : Description : http://msexchangeteam.com/archive/2010/10/27/456738.aspx Tlchargement : http://msexchangeteam.com/files/12/attachments/entry456737.aspx Understanding Active Manager / Best copy selection process http:// technet.microsoft.com/en-us/library/dd776123.aspx Datacenter Switch/Failover http://technet.microsoft.com/en-us/library/dd298067.aspx Hardware Virtualization : http://technet.microsoft.com/en-us/library/aa996719.aspx http://technet.microsoft.com/en-us/library/dd298121.aspx http://technet.microsoft.com/en-us/library/ee832795.aspx 32

Supervision Get-MailboxDatabaseCopyStatus 33 MSDN et TechNet : lessentiel des ressources techniques porte de clic Portail administration et infrastructure pour informaticiens Portail de ressources technique pour dveloppeurs http://msdn.com http://technet.com 34

Recently Viewed Presentations

  • 2010 Dual Enrollment Liaison Workshop - Rio Salado College

    2010 Dual Enrollment Liaison Workshop - Rio Salado College

    2010 Dual Enrollment Liaison Workshop * If quick-admitted to obtain Student ID for placement testing, obtain MEID by following "Forgot Your MEID' instructions. * Resource center for information pertaining to: classes enrolled, tuition balance, grades, placement test scores, transcript requests,...
  • Inter-American Convention for the Protection and Conservation of

    Inter-American Convention for the Protection and Conservation of

    Objective To promote the protection, conservation and recovery of sea turtle populations and those habitats on which they depend, on the basis of the best available data and taking into consideration the environmental, socioeconomic and cultural characteristics of the Parties.
  • PROJECT RISK MANAGEMENT Ammar Bukhari WHAT IS A

    PROJECT RISK MANAGEMENT Ammar Bukhari WHAT IS A

    C. Contract disputes that generate claims for increased payments. D. Slippage of the planned post-implementation review meeting. Answer A. Explanation Cost increases (choice B) and contract disputes (choice C) will not necessarily interfere with schedule. Notice the words "post-implementation" in...
  • Profile - Polk County School District

    Profile - Polk County School District

    F.W. de Klerk is so glad we avoided war at the jail October 28, 1962 Friends F.W. de I AM VERY GLAD ME AND MR MANDELA HAD TEA TOGETHER! [September 9, 1962 Nelson Frank Marilyn F.W. de Klerk Headed back...
  • ARC/INFO Topology

    ARC/INFO Topology

    Topology in GIS generally defined as the spatial relationships between adjacent or neighboring features implemented through data structure Components Connectivity: Arcs are connected to others (at nodes). This identifies possible routes and networks, such as rivers and roads..
  • Tesi n°17 - WordPress.com

    Tesi n°17 - WordPress.com

    l'aria col da capo, anch'essa perfettamente connaturata al bisogno di inverosimiglianza che è proprio del periodo storico. Da un punto di vista musicale essa . è tripartita. I . primi 4 versi, intercalati da un ritornello (R) strumentale sono intonati...
  • Adventures in Alice Programming - Duke University

    Adventures in Alice Programming - Duke University

    The Program at Duke University Summer 2008 Workshops for high school and middle school teachers to learn Alice (3 weeks) One week summer camp opportunities for high school and middle school students Durham Public schools and schools near Durham Academic...
  • SMPAC - Arizona Department of Education

    SMPAC - Arizona Department of Education

    Assist the school and migrant staff in the implementation of programs /Asistir a la escuela y al personal del programa Migrante en la implementación de programas. Promote a better relationship between the child's home and school / Promover una mejor...