2020年10月1日の障害ということで、何か半期のバッチ処理でもあるのかと思ったら
DISKの障害で2号機に切り替わらなかったとのこと。
DIKS障害というのはシンガポールの金融庁でもリスクだと思っていて、TRMと呼ばれる技術的なガイドラインにも言及されている。
経緯は2010年のDBSという銀行で発生したDISK障害が経緯になっていると聞いたことがある。(こちらはIBMのメインフレームのディスクであったそうな)
富士通のディスクもそれなりのものであったはずで、でもやっぱり障害っておきる。障害なんだけど検知されない障害。。。障害が中途半端に起きていて、故障と判断するロジックは通り異常は検知できないけど、実際は読み書きできない、、、みたいな。
今回の障害がそうだったか不明だが、コンピュータの世界では、これが難しい。
今コロナで流行りのVDIも、基盤的には使えていてもユーザーは使えないことがよくある。
システム側も基盤が正常か?しか見ていないので、ユーザーが使えるか?を監視はできていない。
監視の仕組みも、視点を変えてサービスが使えるか?で見ていくことも求められるのかなあ・・・。それも、使っているシステム・ユーザーが検知するよりも早く。。。
その後設定の問題と発表がありました。設定って・・・。SEが設定するようなものか?それとも内部の機能なのか?設定するものならばマニュアルのこれと言ってほしい。それから、xxのケースでは切り替わりませんが、いいですよね?的な警告も出ていいんじゃないかなあ??なんでそんな細かいオプションあるんだろう。