Desligar e Ligar a Farm.

Description

Desligar

1)Desligue o gatekeeper (na osg-ce) para que a farm não receba mais jobs:

/etc/init.d/xinetd stop
2)desligue os pools do dcache (spraid01 e spraid02)
/opt/d-cache/bin/dcache stop
3)Desligue o PhEDEx na osg-se
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug stop
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod stop
exit
4)Desligue o dCache e o pnfs na osg-se , como root
/opt/d-cache/bin/dcache stop
/etc/init.d/pnfs stop
Feito isso você pode desligar a spraid01, spraid02 e osg-se.
 shutdown -h now
5)Desligue o condor nos nodes, a partir da osg-ce como root:
clcmd /etc/init.d/condor stop
6)desligue os nodes
clcmd shutdown -h now
7)desligue a access
shutdown -h now
8)desligue a osg-ce
shutdown -h now

Ligando a farm

1) ligue a osg-ce e verifique se todos os serviços subiram corretamente. Restarte os problematicos, como o /etc/init.d/ntp. 2)Ligue a osg-se. Verifique se os serviços subiram corretamente e após verificar se a máquina montou o /OSG da ce, aumente o número de arquivos abertos que a maquina pode ter e reinicie os servicos:
ulimit -n 32000
/etc/init.d/postgresql restart
/opt/pnfs/bin/pnfs start
/opt/d-cache/bin/dcache start
se você tiver algum problema com o java ao inicializar, tente reiniciar a sequencia acima novamente. 3) ligue a spraid01 e spraid02. Verifique se elas montaram corretamente o /OSG . Inicie o dcache
ulimit -n 3200
/opt/d-cache/bin/dcache start
4)ligue os nodes de processamento, verifique se todos estão montando o /OSG corretamente . Ligue o condor
clcmd /etc/init.d/condor start
5)ligue a access . Certifique-se que o /home_osgce e o /OSG estão montados. Inicie o condor nesta maquina com /etc/init.d/condor start . Certifique-se, com um ps -afx, se o httpd esta rodando, pois ele é necessário para os servicos do pingER . Caso não,
/etc/init.d/httpd restart
Confirmado isso retorne a osg-ce e monte o /hdacs
mount /hdacs
clcmd mount /hdacs

6)Volte a osg-se. Ligue o PhEDEx:

su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug start
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod start
exit
7)faça o tuning de rede to do: modificar isso
ifconfig eth0 txqueuelen 10000
ifconfig eth1 txqueuelen 10000
repita esse último passo na spraid01, osg-se e spraid02 7)tudo correndo bem, ligue o gatekeeper (verifique se ele não está ligado antes!)
/etc/init.d/xinetd start

Fulano em dd/mm/aaaa

Coloca o que fez.

Ciclano em dd/mm/aaaa

Mais comentarios

-- MarcoAndreFerreiraDias - 09 Nov 2008


This topic: Main > WebHome > LogBook > EntryDescriptionNo65
Topic revision: r2 - 2009-11-11 - MarcoAndreFerreiraDias
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback

antalya escort bursa escort eskisehir escort istanbul escort izmir escort