Moin @psy ,
warum sollte man per IPV6 besser durch eine FW kommen als per IPV4?
Grafana ist mir schon bekannt, aber da weiß ich nicht, wie ich einfach geskriptet Daten abziehen kann. Das anzuschauen ist nett im Sinne von Reporting, aber für Monitoring und Alerting taugt das nicht.
Da ich die Knoten selbst nicht oder wenig nutze, sondern meine Gäste, möchte ich mitbekommen, wenn etwas ausfällt und ich ggf. Hand anlegen muß.
Anhand von Kriterien wie online, lastcontact, uptime, clients, die ich aus https://karlsruhe.freifunk.net/json/nodes.json ziehen kann, lässt sich da schon ein gutes Bild machen. Was noch mehr helfen würde, wäre der Trafficdurchschnitt der letzten 5 Minuten, aber der lässt sich auch am Monitoringserver errechnen.
Was mich an der Lösung stört, ist der große Overhead. Die Datenmenge in dem JSON-File ist im Verhältnis zu den benötigten Infos riesig und wächst mit jedem neuen Knoten. Auch das Auswerten auf dem Monitoringserver ist unnötig teuer.
Ich betreibe auch ein paar RIPE Atlas Probes und monitore die über den zentralen RIPE Atlas Server. Dort habe ich die Möglichkeit, die gewünschten Attribute nodespezifisch abzurufen, was eine sehr überschaubare Datenmenge und -struktur liefert z.B. https://atlas.ripe.net/api/v1/probe/39/?format=json&fields=status_name,status_since,id
Sowas wäre toll. Die Feldselektion wäre gar nicht so wichtig, aber ein Datenabruf pro Knoten, das wär’s!
Im Grafana ist ja auch die Gesamtstatistik verfügbar http://graph.ffka.net/#/dashboard/file/ffka.json in der man zufällig just im Augenblick auch einen Ausfall zu erkennen scheint. Gibt es die zugrundeliegenden Daten auch irgendwo zum Abruf? Für die Beurteilung im Monitoring, ob es sich um einen lokalen oder zentralen Ausfall handelt wären die hilfreich.
Wie kommt eigentlich die Node-ID zustande und wie persistent ist sie? Ist klar, dass der Knotenname serverseitig als Primärschlüssel nicht taugt, aber da ich den (besser) kenne, ist das aktuell mein Selektionskriterium.
Grüßle,
bongosmurf