【1】困っていることや起きている問題
sv4051を利用しています。本日の障害情報(view_id=2042)では「各1分程度」とされていますが、実際にはAM4時以降、現在まで7時間以上にわたりCPU・メモリが100%に張り付いたまま復旧していません。
ApacheのエラーログではPHP-FPMのタイムアウトエラーが約2,800件、FastCGIヘッダ読み取り失敗が107件発生しており、サイトが正常に表示できない状態が続いています。ECサイトを運営しているため、売上に直接影響が出ています。
障害情報の「各1分程度」という記載を信じて復旧を待っていたため、こちらの対応判断も遅れました。ここ数ヶ月sv4051では障害が多く、そのたびに障害情報と実態が合っていないと感じています。この情報のズレが一番困っています。
【2】何をしようとしていたときに起きましたか
特別な操作はしていません。本日AM2時頃からサイトの表示が遅くなり、その後タイムアウトが頻発するようになりました。転送量はピーク時でも0.12GB/hと少なく、アクセス急増が原因ではありません。
【3】試したこと
・リソースモニターでCPU・メモリの使用状況を確認 → 4時以降100%張り付き
・Apacheエラーログを取得・分析 → PHP-FPMタイムアウト約2,800件を確認
・障害情報(view_id=2042)を確認 → 「各1分程度」の記載で、実態と乖離
・サポートへ別途問い合わせ済み
※共用サーバーのため、PHP-FPMの再起動等はこちらでは対応できません。
【4】利用環境
・収容サーバー: sv4051
・サイト: WordPress(テーマ: オリジナル)
【5】スクリーンショット
リソースモニターのスクショを添付します。2時を境にCPU・メモリともに100%に跳ね上がり、そのまま下がっていないのが確認できます。
同じサーバー帯(sv4041〜sv4060)の方、現在の状況はいかがでしょうか?
