r1 - 09 Nov 2008 - 21:45:56 - MarcoAndreFerreiraDiasYou are here: TWiki >  Main Web > LogBook > EntryDescriptionNo65

Desligar e Ligar a Farm.

Description

Desligar

1)Desligue o gatekeeper (na osg-ce) para que a farm não receba mais jobs:

/etc/init.d/xinetd stop
2)desligue os pools do dcache (spraid01 e spraid02)
/opt/d-cache/bin/dcache stop
3)Desligue o PhEDEx na osg-se
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug stop
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod stop
exit
4)Desligue o dCache e o pnfs na osg-se , como root
/opt/d-cache/bin/dcache stop
/etc/init.d/pnfs stop
Feito isso você pode desligar a spraid01, spraid02 e osg-se.
 shutdown -h now
5)Desligue o condor nos nodes, a partir da osg-ce como root:
clcmd /etc/init.d/condor stop
6)desligue os nodes
clcmd shutdown -h now
7)desligue a osg-ce
shutdown -h now

Ligando a farm

1) ligue a osg-ce e verifique se todos os serviços subiram corretamente. Restarte os problematicos. 2)Ligue a osg-se. Verifique se os serviços subiram corretamente (postgresql, pnfs, frontier-squid). Após estes passos é necessário desligar a versão antiga do script de inicialização do dcache :
/etc/init.d/dcache-core stop
verifique se existe algum processo java relacionado ao dcache rodando usando ps -faux. Feito isso e após verificar se a máquina montou o /OSG da ce:
/opt/d-cache/bin/dcache start
3) ligue a spraid01 e spraid02. Verifique se elas montaram corretamente o /OSG. Após isso, desligue o dcache que subiu com o script antigo:
/etc/init.d/dcache-pool stop
/etc/init.d/dcache-core stop
verifique usando o ps se existe algum processo java rodando. Inicie o dcache
/opt/d-cache/bin/dcache start
4)ligue os nodes de processamento, verifique se todos estão montando o /OSG corretamente . Ligue o condor
clcmd /etc/init.d/condor start
5)volte a osg-se. Ligue o PhEDEx? :
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug start
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod start
exit
6)faça o tuning de rede to do: modificar isso
ifconfig eth0 txqueuelen 10000
ifconfig eth1 txqueuelen 10000
repita esse último passo na spraid01 e spraid02 7)tudo correndo bem, ligue o gatekeeper (verifique se ele não está ligado antes!)
/etc/init.d/xinetd start

Fulano em dd/mm/aaaa

Coloca o que fez.

Ciclano em dd/mm/aaaa

Mais comentarios

-- MarcoAndreFerreiraDias - 09 Nov 2008

Edit | WYSIWYG | Attach | Printable | Raw View | Backlinks: Web, All Webs | History: r1 | More topic actions
 
Home
This site is powered by the TWiki collaboration platformCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback