В логах — I/O ошибки, виртуальные машины — не запускаются И самое страшное — два диска разом перестали монтироваться.
JBD2: I/O error when updating journal superblock EXT4-fs error: Detected aborted journal Remounting filesystem read-only
systemd-journald[328]: Failed to write entry... Input/output error
→ Это не падение сервера, а ошибка записи из-за сбоя на уровне диска.
lsblk
Диски видны, но не смонтированы.
smartctl -a /dev/sdc smartctl -a /dev/sdd
Оба диска — физически здоровы (SMART: PASSED).
dmesg | grep -i "error\|io"
Ошибки вроде device offline error и JBD2: I/O error — признаки повреждения файловой системы, а не железа.
pvesm remove pbx171server
→ Убирает ошибки подключения к недоступному бэкап-серверу.
sudo mkdir -p /mnt/pve/ssd sudo mkdir -p /mnt/pve/data
sudo mount /dev/sdc1 /mnt/pve/ssd sudo mount /dev/sdd1 /mnt/pve/data
→ Безопасно! Данные не стираются.
ls /mnt/pve/ssd/ ls /mnt/pve/data/
→ Все данные на месте!
sudo reboot
После перезагрузки всё примонтировалось автоматически. Полёт нормальный.
lsblk sudo blkid /dev/sdc1 sudo blkid /dev/sdd1
sudo smartctl -a /dev/sdc sudo smartctl -a /dev/sdd
sudo fsck.ext4 -n /dev/sdc1 sudo fsck.ext4 -n /dev/sdd1
sudo mount -o ro /dev/sdc1 /mnt/pve/ssd # только чтение sudo mount /dev/sdd1 /mnt/pve/data # чтение/запись
systemctl status pve-cluster systemctl status pvestatd
pvesm remove имя_хранилища
Я не потерял данные. Я не был взломан. Я просто столкнулся с редким, но решаемым сбоем.
Спасение сервера — это не волшебство, а системный подход:
— Диагностика →
— Поиск причины →
— Безопасное решение →
— Профилактика.
Если ты дошёл до конца — ты уже готов к любому сбою.
Держись, и пусть твой сервер всегда будет в полёте! 💪
14 октября 2025 года на сервере Proxmox произошёл сбой: все локальные хранилища (на SATA-дисках) отмонтировались, хотя системный NVMe-диск продолжал работать, и сам хост не падал. После перезагрузки всё восстановилось. Разбираем, как диагностировать подобные инциденты.
ataX.00: failed command: FLUSH CACHE EXTI/O error в QEMU/KVM: Failed to flush the L2 table cache: Input/output errorEXT4-fs warning: error -5 reading directory blockSATA link upsudo journalctl -b -1 -k | grep -i -E "ata|reset|error|link|flush"
dmesg | grep "ata9"
# Или:
lsblk -d -o NAME,MODEL,SERIAL
for disk in /dev/sd?; do
echo "=== $disk ==="
sudo smartctl -a $disk | grep -E "Model|Serial|Power_On_Hours|Temperature_Celsius|Reallocated|Pending|UDMA_CRC"
done
grep -i "FLUSH" /var/log/syslog
Если в логах есть:
ata9: link is slow to respond, please be patient (ready=0) → потеря связи с диском на физическом уровне.SATA link up 1.5 Gbps → диск переподключился (обычно после сбоя питания или зависания контроллера).device offline error, dev sdb → ядро не может прочитать/записать на диск.error -5 в ext4 → это EIO (Input/output error), следствие аппаратного сбоя.Если SMART чистый, но сбой затронул несколько дисков одновременно — причина НЕ в самих накопителях. Возможные источники:
smartd, логирование dmesg, алерты на I/O errors.Даже если после перезагрузки всё «заработало» — проблема остаётся. Такие сбои почти всегда повторяются и могут привести к полной потере данных. Не игнорируйте их!
Блог только запустил, все статьи генерирую через нейросеть т.к. лень, возможны ошибки. Просто чтобы вы знали и не запускали ядерный реактор по моим статьям ))
Если у вас есть вопросы, или Нашли неточность? пишите в коментах — вместе поправим и сделаем статью более качественной. Я лично объясню нюансы из практики.
Комментарии
Пока нет комментариев. Будьте первым!