Erreurs ACPI qui saturent l'espace disque

Demande d'aide : c'est ici.
Répondre
tintamarre
Messages : 1
Inscription : 19 nov. 2021, 15:23
Status : Hors-ligne

Bonjour,

Je gère dans mon entreprise, des afficheurs dynamiques (des mini-PCs Intel NUC qui diffusent des informations via un client Xibo-Player sur des écrans).
Nous avons décidé de migrer nos afficheurs de Windows 10 vers Linux Debian 10 à cause d'instabilités sous Windaube et car nous sommes attachés au monde libre.
Mais finalement nous n'avons pas gagné en stabilité et c'est même pire:

Les NUCs sont programmés avec cron pour hiberner la nuit grâce à rtcwake et c'est entre-autres la cause de mon problème.
En effet, les mini-PCs génèrent des erreurs ACPI en boucle quand ils sortent d'hibernation, ce qui crée des logs de plusieurs dizaines/centaines de Go, sature le disque et rend inutilisable l'afficheur.

Voici un extrait des logs:

Code : Tout sélectionner

root@afficheur:/var/log# head -n 6 syslog
kernel: [18626.421742] ACPI BIOS Error (bug): Could not resolve [\_GPE._L66._SB.ITBI], AE_NOT_FOUND (20180810/psargs-330)
kernel: [18626.421744] ACPI Error: Method parse/execution failed \_GPE._L66, AE_NOT_FOUND (20180810/psparse-516)
kernel: [18626.421746] ACPI Error: AE_NOT_FOUND, while evaluating GPE method [_L66] (20180810/evgpe-515)
kernel: [18626.421893] ACPI BIOS Error (bug): Could not resolve [\_GPE._L66._SB.ITBI], AE_NOT_FOUND (20180810/psargs-330)
kernel: [18626.421895] ACPI Error: Method parse/execution failed \_GPE._L66, AE_NOT_FOUND (20180810/psparse-516)
kernel: [18626.421897] ACPI Error: AE_NOT_FOUND, while evaluating GPE method [_L66] (20180810/evgpe-515)
Je n'ai pas réussi à trouver quelqu'un ayant le même cas que moi, d'autant plus que ces erreurs sont aléatoires.

L'erreur peut apparaitre sur plusieurs afficheurs de modèles différents mais n'apparaît pas sur tous les PCs d'un même modèle:
Les PCs en question sont des Intel NUC8i3BEK2, quasiment identiques niveau système car clonés avec CloneZilla, mais seulement quelques-uns ont été touchés.

J'ai déjà mis à jours à la dernière version les BIOS de ces PCs, mais l'erreur est revenue au démarrage d'un PC puis disparait après un redémarrage forcé..

Pour l'instant, j'ai retiré la tâche cron qui programme rtcwake mais ce n'est pas très écologique de laisser allumer ces PCs h24.
J'ai aussi programmé logrotate toutes les 10 minutes et restreint la taille des logs à 1Go mais je ne parviens pas à régler la cause du problème.

Auriez-vous donc des pistes ? Revenir à Windows :lol: ? Migrer vers une distrib compatible avec ces matériels ? Report le bug à Debian ?

Je reste à votre disposition pour toute demande d'infos complémentaires.
Merci par avance pour votre aide,
tintamarre
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 5865
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Bonjour, en mesure d'urgence tu peux mettre une tache cron qui supprimes les archives des logs pour éviter de tout bloquer.
Si j'ai bien compris, tout fonctionne correctement malgré l'erreur remontée.
Sinon les BIOS buggués, ça existe. Du moment que ça fonctionne avec W, ils ne sont pas corrigés.
J'ai lu qu'on pouvais modifier le niveau de logs remonté en modifiant libata.noacpi=1 dans les paramétres de GRUB.
Je te laisse creuser cette piste
PascalHambourg
Contributeur
Contributeur
Messages : 930
Inscription : 05 août 2016, 20:25
Status : Hors-ligne

piratebab a écrit : 22 nov. 2021, 16:31 en mesure d'urgence
L'urgence semble toute relative car j'ai répondu au même sujet dans un autre forum il y a trois jours en proposant un contournement et je n'ai pas eu de retour.
piratebab a écrit : 22 nov. 2021, 16:31 J'ai lu qu'on pouvais modifier le niveau de logs remonté en modifiant libata.noacpi=1
Ce paramètre du module libata (base des pilotes PATA/SATA) n'a rien à voir avec le niveau de log ; il désactive l'utilisation de l'ACPI pour la détection, la mise en veille et le réveil des périphériques PATA/SATA, avec pour effet de bord de supprimer les messages d'erreurs ACPI liées au PATA/SATA. J'ai eu le cas sur une carte mère, mais les messages d'erreur ACPI contenaient "SAT0", "SAT1"... en fonction du nombre de disques.
Répondre