Cerca


stampa pdf

Guida all'utilizzo della Modalità Rescue



La Modalità Rescue è una modalità diagnostica di avvio tramite un Netboot di rete. Viene utilizzata quando il tuo server non è raggiungibile, per effettuare controlli hardware e software.

La modalità Rescue Pro è utilizzata per i server Linux e permette di accedere tramite connessione SSH alla macchina e anche di verificarne l'hardware.
Il vantaggio di questo tipo di accesso è che non è necessario contattare il supporto per pianificare un intervento, perchè ti permette di eseguire controlli e test quando lo desideri, ad esempio nel momento di minor utilizzo del server.

Software & Amministrazione
Operazioni disponibili

  • lanciare un fsck / e2fsck;
  • consultare e analzzare i logs del server;
  • correggere problemi di tipo software;
  • ricostruire / verificare il RAID;
  • salvare dei dati.
Hardware
Operazioni disponibili

  • memtest per controllare la memoria (RAM);
  • cpuburn per verificare il processore (CPU);
  • fsck per controllare il sistema degli archivi;
  • state per controllare il disco;
  • explorer per i vostri archivi.


Se uno dei test fallisce oppure rileva errori, è sufficiente accedere al tuo manager, sezione Supporto e quindi Dichiarare un incidente .
Il sistema ti avviserà quindi col seguente disclaimer
Per gestire un incidente, OVH effettuerà una diagnostica. Se questa rivela che l'incidente è a carico di OVH, la risoluzione dell'incidente rientrerà nel quadro di garanzia del vostro servizio. In caso contrario, la diagnostica, che potrà essere accompagnata da un preventivo di risoluzione, vi sarà fatturata 20€ IVA esclusa (24.00€ IVA compresa) (1)

(1): Se OVH è in grado di risolvere l'incidente durante la diagnostica, questa e l'intervento vi saranno fatturati per 20.0€ IVA esclusa (24.00€ IVA compresa).

che dovrà essere accettato per poter avviare la registrazione del ticket stesso.
Dovrai quindi selezionare dai vari menu il servizio interessato (eventualmente un sottoservizio correlato) e il problema rilevato, infine cliccare su Continuare la registrazione del vostro ticket.
Nella parte inferiore di questa schermata sarà anche possibile allegare file.
Potrai inserire qui il risultato dei tuoi test, ad esempio: Server bloccato durante l'operazione CPU burn.
Sarai quindi avvisato della programmazione e dell'esecuzione di un intervento (ad esempio) di sostituzione dell'hardware danneggiato.

Attenzione: non devi mai utilizzare l'interfaccia web e SSH allo stesso tempo. Non devi MAI lanciare il controllo dei dischi sull'interfaccia web e montare in SSH le partizioni, questo potrebbe causare la perdita dei tuoi dati!!


Attivare la modalità Rescue

Per attivare questa modalità devi accedere al tuo manager V3, cliccare sul nome del server, quindi su Servizi , poi su Netboot . Qui seleziona dal menu a tendina la voce Rescue pro.

Riavvia quindi il server, se possibile da modalità software (da SSH: /sbin/reboot), oppure effettua il reboot hardware da manager tramite l'opzione Riavviare .
Riceverai quindi una email che conterrà il link e la password per accedere al server in modalità rescue.

Se ricevi l'email, ma non hai eseguito tu l'operazione, è possible che i nostri tecnici siano intervenuti sul server senza identificare alcun problema hardware, e lo abbiano riavviato in modalità rescue per evitare rischi di perdite di dati e permetterti di procedere alle necessarie verifiche software.


Verifica Hardware

Una volta che il server è stato riavviato in modalità rescue pro, riceverai una mail contenente un link e una password per collegarti alla pagina di gestione dei test hardware. Ecco un'anteprima di questa interfaccia:



Elenco dei controlli
  • Hard Drives: permette di vedere i dischi installati.
  • Processors: esegue il controllo della CPU. Questo test potrebbe non restituire alcun feedback. Potresti invece ottenere un arresto, un riavvio del server oppure il test non viene portato a termine e rimane in esecuzione per più di un'ora. E' segno di un problema, quindi contatta immediatamente il supporto.
  • Stato partizioni: verifica il disco.
  • File System Partizioni: verifica il file system. Spesso il file system risulta danneggiato se un disco è rotto. Nota che è sufficiente reinstallare il Sistema Operativo perchè tutto funzioni correttamente. Soprattutto nel caso in cui il server utilizza la directory lost+found.
  • Esplora Partizioni: Ti permette di esplorare i file. Non potrai modificarli, ma potrai comunque salvarli.
    Importante: è possibile anche leggere i log della macchina senza dversi collegare in SSH.
  • Memoria: verifica la RAM. Un test della memoria occupa molta CPU. Se questo test si blocca o il sistema crolla è probabile che la CPU abbia problemi di raffreddamento o sia completamente guasta. Se la RAM è difettosa, alla fine del test riceverai un report che contiene gli errori.

Non tutti i problemi possono essere identificati tramite questa interfaccia, ad esempio dei riavvii irregolari etc. Non esitare a fare il test e a consultare quindi l'assistenza tecnica, che può aiutarti ad analizzare il server.

Attenzione:
Normalmente, raggiunto all'incirca il 64% del test della RAM, viene visualizzato il seguente errore:
your server hasn't reacted for a least 20 seconds. It is probably down. You can try to refresh the page if the server crashed while doing a cpu test. it is possible that the cpu is faulty.

Puoi cliccare su ok perché questo errore viene visualizzato quanto il test è in esecuzione da molto tempo.


Rescue in SSH

Collegamento
Collegati al server tramite SSH come fai normalmente. Devi solo ricordare di utilizzare la password ricevuta nell'email di accesso alla modalità rescue.
angie@amazone:~$ ssh root@213.186.xx.yy
The authenticity of host '213.186.xx.yy (213.186.xx.yy)' can't be established.
RSA key fingerprint is 02:11:f2:db:ad:42:86:de:f3:10:9a:fa:41:2d:09:77.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added '213.186.xx.yy' (RSA) to the list of known hosts.
Password:
rescue:~#

Ora sei collegato al tuo server, ma i tuoi file non sono accessibili. E' necessario montare il filesystem.

Montare il disco
Normalmente, la partizione radice (/) è /dev/Xda1, mentre /dev/Xda2 corrisponde alla partizione /home.
Al posto della X va inserito il nome corretto della partizione: sda o mda se il sistema è in RAID.
I dispositivi saranno di tipo:
  • /dev/sd per SCSI, SATA, Raid Hard;
  • /dev/hd per i dischi IDE;
  • /dev/md per i RAID Software;
  • /dev/rd/c0d0p per i raid Mylex;
  • /dev/ad4s1 per i sistemi Freebsd.

Puoi anche utilizzare le denominazioni devfs. Se non sei a conoscenza del tipo di disco in uso, né quale sia la tabella delle partizioni utilizzata dal server, puoi utilizzare i comandi fdisk oppure sfdisk. Ecco un esempio di utilizzo del comando fdisk e del risultato ottenuto:
rescue:~# fdisk -l

Disk /dev/hda 40.0 GB, 40020664320 bytes
255 heads, 63 sectors/track, 4865 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/hda1 * 1 1305 10482381 83 Linux
/dev/hda2 1306 4800 28073587+ 83 Linux
/dev/hda3 4801 4865 522112+ 82 Linux swap / Solaris

Disk /dev/sda 8254 MB, 8254390272 bytes
16 heads, 32 sectors/track, 31488 cylinders
Units = cylinders of 512 * 512 = 262144 bytes

Device Boot Start End Blocks Id System
/dev/sda1 1 31488 8060912 c W95 FAT32 (LBA)


In questo caso, il server è equipaggiato con due dischi.
Puoi notare che /dev/hda riporta un simbolo asterisco *, che indica come la partizione di boot si trovi su quel disco. Il secondo disco riporta invece la chiave usb.
Per montare la / del server è sufficente lanciare il comando:
rescue:~# mount /dev/hda1 /mnt/

Normalmente la partizione /home si trova su /dev/hda2. Deve essere montata dopo la /, tramite il comando mount /dev/hda2 /mnt/home .
La /home non può anche non trovarsi su /dev/hda2 ed è possibile che i tuoi dati si trovino nella directory /var, come succede con sistemi che utilizzano il pannello Plesk ad esempio. Per essere sicuro della configurazione utilizzata, puoi montare la / e lanciare il comando cat /mnt/etc/fstab.
Questo file contiene le partizioni del server, quando questo viene avviato su hard disk.
Ecco un esempio:
rescue:# cat /mnt/etc/fstab
#     
/dev/hda1 / ext3 errors=remount-ro 0 1
/dev/hda2 /var ext3 defaults,usrquota,grpquota 1 2
/dev/hda3 swap swap defaults 0 0
/dev/devpts /dev/pts devpts gid=5,mode=620 0 0
/dev/shm /dev/shm tmpfs defaults 0 0
/dev/proc /proc proc defaults 0 0
/dev/sys /sys sysfs defaults 0 0

La partizione /dev/hda2 è dunque in questo caso /var e non /home.
Per montarla, è necessario eseguire questo comando: mount /dev/hda2 /mnt/var .


RPS
Per gli RPS che utilizzano il collegamento NFS, è sufficente digitare in rescue il comando: mount -a.
L'NFS viene montato automaticamente.


Chroot
Ora è possibile modificare i file utilizzando ad esempio il percorso /mnt/var/...., oppure ancora /mnt/etc/lilo.conf, ma per poter effettuare determinate operazioni è necessario avere l'accesso root al sistema installato sull'hard disk.
Questa operazione non è direttamente possibile dalla root della modalità rescue.
Per queste operazioni è necessario utilizzare il comando chroot:

rescue:~# chroot /mnt/
rescue:/#


Una volta ottenuto il risultato del chroot, il sistema ci darà accesso alla directory / del server.
Ore è possibile eseguire operazioni sul sistema.


Disattivare la modalità Rescue

Una volta effettuate le modifiche e i controlli necessari, dovremo collegarci nuovamente al manager per ripristinare il boot abituale dalla sezione NetBoot?.
Selezionato il kernel adatto e confermata la nostra selezione, è sufficiente effettuare un riavvio software della macchina.

rescue:~# /sbin/reboot
Broadcast message from root (pts/0) (Tue Apr 12 15:56:17 2005):
The system is going down for reboot NOW!



Conclusione

Se hai rispettato alcune semplici basi di amministrazione del server, come indicato nella guida Utilizzo del Server, potrai facilmente riottenere il controllo della tua macchina e ridurre il periodo di indisponibilità.