ジョブキューイング

ジョブを投入したら何故か即座に死んでエラーログもなんにも残さない…。

おかしいな?手元じゃちゃんと動いているんだがな…と見ていると、次にアサインするノードはこれ、と決め打ちになってる。

なんだ?そのノード死にかけなのか?とログインしてみたら…既に投入されてたジョブが大量にメモリ喰ってて、俺のプロセスが out of memory で kill されてただけだった……

莫迦キューイングだな……


……で、どうすんだ?そのノードにアサインされないCPU数で投入するしかないのかな?他のノードが空くのを待っても、ここに割り振ろうとするままだろうし


20:10:28 - 04.08.10 - kuroyagi - その他雑記 - 3594x