Vera Lite : Plantage sévère

VeraDeadlock
Description du plantage

Ma Vera Lite a subitement planté alors qu’elle fonctionnait normalement (je n’étais pas en train d’intervenir dessus). Voici les derniers messages d’erreur du log :

01	05/15/14 12:06:37.009	Failed to get lock(0xa3e20c) Variable: ../ZWave/ZWaveJobHandler.h:372 last used UserData.cpp:463  first used UserData.cpp:463  thread: 0x2c315680 (>579995)  handler 0x424934 bOkToFail 0 <0x2c915680>
01	05/15/14 12:06:37.019	Deadlock problem. going to reload and quit <0x2c915680>
01	05/15/14 12:06:44.231	Main WatchDogRoutine: blocked - terminating 1 <0x2d92f680>

J’ai immédiatement tenté de la redémarrer en la débranchant puis en la rebranchant, et là, plus rien : plus d’interface web, plus de ssh, aucune réponse au ping.
Les voyants de la Vera sont entrés dans la séquence cyclique suivante :

  1. Le voyant bleu clignote environ 40 secondes
  2. Le voyant vert s’allume quelques secondes
  3. Les quatre voyants s’éteignent puis s’allument puis s’éteignent
  4. Retour au 1
Remise en service de la Vera

J’ai contacté le support technique de la Vera qui m’a indiqué la marche à suivre pour remettre la box en fonction.

  • Connecter un câble ethernet entre un ordinateur (sous Linux dans mon cas) et la Vera Lite
  • Configurer la connexion de l’ordinateur en IP statique avec les paramètres suivant :
    Adresse IP=192.168.1.2 ; Masque de réseau=255.255.255.0 ; Passerelle=192.168.1.1
  • Brancher l’alimentation de la Vera Lite
  • Au moment où la led bleu s’allume, appuyer sur le bouton Reset avec un trombone puis le relâcher
  • Ouvrir un terminal et taper telnet 192.168.1.1
  • Dans la fenêtre telnet, exécuter les commandes suivantes :
    flash_eraseall -j /dev/mtd7
    sync
    echo b > /proc/sysrq-trigger
  • Configurer la connexion de l’ordinateur en IP statique avec les paramètres suivant :
    Adresse IP=192.168.81.2 ; Masque de réseau=255.255.255.0 ; Passerelle=192.168.81.1
  • Vérifier que l’interface de la Vera Lite est accessible depuis l’adresse 192.168.81.1 une fois que toutes les leds sont allumées de manière fixe
  • Remettre la Vera Lite sur le réseau
  • Se connecter à l’interface de gestion et s’authentifier auprès des serveurs de Vera depuis ACCOUNT → My Contact Info
  • Recharger une sauvegarde automatique valide des paramètres depuis SETUP → Backup

J’ai ainsi retrouvé une Vera Lite fonctionnelle sans perdre aucune configuration. Il m’a simplement fallu refaire l’association du module thermostat SCS317 avec le module récepteur SSR303.

Qu’en retenir ?

La Vera Lite peut planter, et un dispositif de type ping watch dog peut ne pas s’avérer efficace pour la faire redémarrer. Il faut en tenir compte, notamment si elle est utilisée pour assurer la sécurité de la maison (alarme, surveillance)… Il faut aussi penser à sauvegarder ses paramètres ou configurer une sauvegarde automatique sur les serveurs de Vera.

Tentative d’analyse (27-05-2014)

La Vera Lite a planté une seconde fois. Comme la connexion ssh  était encore valide, j’ai tenté d’enquêter un minimum pour comprendre avant de la redémarrer (ce coup ci, un simple débranchement/rebranchement a suffit). Une fois connecté en ssh, je n’ai pas trouvé de fichier de log (/var/log/cmh/LuaUPnP.log), par contre, il y avait un fichier que je n’avais jamais vu, /var/log/cmh/FailedRotate.log, qui contenait des logs que je n’ai pas su interpréter mais surtout dont les premières lignes correspondaient au résultat d’une commande top :

Mem: 46656K used, 15824K free, 0K shrd, 0K buff, 24080K cached
CPU:   0% usr   9% sys   0% nic  90% idle   0% io   0% irq   0% sirq
Load average: 4.00 4.01 4.05 1/53 4217
  PID  PPID USER     STAT   VSZ %MEM %CPU COMMAND
 4217  4033 root     R     1680   3%   9% top -b -n 1
...

La ligne Load average: 4.00 4.01 4.05 montre un système totalement surchargé au moment où cette commande top a été exécutée.

Les deux fois, d’après mon mécanisme de log externe (depuis le NAS), j’ai constaté que le plantage est survenu alors que la box capturait des images des caméras IP afin de les envoyer par courriel (plusieurs courriels avec trois captures pour chacun). La piste de plantages consécutifs à une surcharge de la Vera Lite semble se confirmer.

Résolution du problème ? (27-05-2014)

Maintenant, je consulte la charge de la Vera Lite, grâce à la commande uptime, avant de faire des traitements qui risquent de la surcharger. Si la charge est trop importante, ces traitements sont ignorés. Pour le moment, plus de plantage depuis la mise en place de cette précaution.

Informations et sources
Cette entrée a été publiée dans Domotique, Contrôleurs and taguée , . Placez un signet sur le permalien.

One Response to Vera Lite : Plantage sévère

  1. Dominique Desmet

    J’ai rencontré ce problème ce week-end et je désespérai d’avoir a) une explication, b) une solution.
    Merci donc pour la pertinence et la clarté de vos explications.

    Cordialement

    Reply

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *