ジョブを投入したら何故か即座に死んでエラーログもなんにも残さない…。
おかしいな?手元じゃちゃんと動いているんだがな…と見ていると、次にアサインするノードはこれ、と決め打ちになってる。
なんだ?そのノード死にかけなのか?とログインしてみたら…既に投入されてたジョブが大量にメモリ喰ってて、俺のプロセスが out of memory で kill されてただけだった……
莫迦キューイングだな……
……で、どうすんだ?そのノードにアサインされないCPU数で投入するしかないのかな?他のノードが空くのを待っても、ここに割り振ろうとするままだろうし