Desligar e Ligar a Farm.
Description
Desligar
1)Desligue o gatekeeper (na osg-ce) para que a farm não receba mais jobs:
/etc/init.d/xinetd stop
2)desligue os pools do dcache (spraid01 e spraid02)
/opt/d-cache/bin/dcache stop
3)Desligue o PhEDEx na osg-se
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug stop
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod stop
exit
4)Desligue o dCache e o pnfs na osg-se , como root
/opt/d-cache/bin/dcache stop
/etc/init.d/pnfs stop
Feito isso você pode desligar a spraid01, spraid02 e osg-se.
shutdown -h now
5)Desligue o condor nos nodes, a partir da osg-ce como root:
clcmd /etc/init.d/condor stop
6)desligue os nodes
clcmd shutdown -h now
7)desligue a access
shutdown -h now
8)desligue a osg-ce
shutdown -h now
Ligando a farm
1) ligue a osg-ce e verifique se todos os serviços subiram corretamente. Restarte os problematicos, como o
/etc/init.d/ntp
.
2)Ligue a osg-se. Verifique se os serviços subiram corretamente e
após verificar se a máquina montou o /OSG da ce, aumente o número de arquivos abertos que a maquina pode ter e reinicie os servicos:
ulimit -n 32000
/etc/init.d/postgresql restart
/opt/pnfs/bin/pnfs start
/opt/d-cache/bin/dcache start
se você tiver algum problema com o java ao inicializar, tente reiniciar a sequencia acima novamente.
3) ligue a spraid01 e spraid02. Verifique se elas montaram corretamente o
/OSG
. Inicie o dcache
ulimit -n 3200
/opt/d-cache/bin/dcache start
4)ligue os nodes de processamento, verifique se todos estão montando o /OSG corretamente . Ligue o condor
clcmd /etc/init.d/condor start
5)ligue a
access
. Certifique-se que o
/home_osgce
e o
/OSG
estão montados. Inicie o
condor
nesta maquina com
/etc/init.d/condor start
. Certifique-se, com um
ps -afx
, se o
httpd
esta rodando, pois ele é necessário para os servicos do
pingER
. Caso não,
/etc/init.d/httpd restart
Confirmado isso retorne a
osg-ce
e monte o
/hdacs
mount /hdacs
clcmd mount /hdacs
6)Volte a osg-se. Ligue o
PhEDEx:
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug start
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod start
exit
7)faça o tuning de rede
to do: modificar isso
ifconfig eth0 txqueuelen 10000
ifconfig eth1 txqueuelen 10000
repita esse último passo na spraid01, osg-se e spraid02
7)tudo correndo bem, ligue o gatekeeper (verifique se ele não está ligado antes!)
/etc/init.d/xinetd start
Fulano em dd/mm/aaaa
Coloca o que fez.
Ciclano em dd/mm/aaaa
Mais comentarios
--
MarcoAndreFerreiraDias - 09 Nov 2008