← Natrag na listu

weekly-2026-04-12.md

🔬 Weekly 🔴 1 🟡 5 🟢 3

Weekly Deep Audit — 2026-04-12 — Skills + Cron

Scope

Tjedan 2: Skill/Tool Effectiveness + Cron Health

Findings

  • 🟢 Cron baza je uglavnom stabilna — u cron/jobs.json postoji 29 jobova; 19 aktivnih i 10 disabled. Zadnji poznati status je ok za 25 jobova, error za 3, a 1 je bez jasnog recent statusa.
  • 🟡 Aktivne automatizacije su zdrave, ali disabled sloj nosi neriješene kvarove — tri joba sa statusom error su trenutno disabled: Memory Maintenance (tjedni audit) (edit fail), 📏 Weekly Context Audit (timeout), Community Intelligence Sweep (delivery target greška). To ne ruši produkciju, ali pokazuje da maintenance/reporting sloj nije čist.
  • 🟢 Telegram announce pattern je u boljem stanju nego 08.03. — raniji audit je hvatao weekly-review kao sumnjiv/skip; sada je weekly-review aktivan i zadnje izvršenje je ok s urednim announce deliveryjem.
  • 🔴 Skill putanje su driftale i stvaraju ponavljane ENOENT greške — journald u zadnjih 7 dana više puta bilježi pokušaje čitanja nepostojećih skillova ili starih lokacija: tavily-search-pro, heartbeat-tasks, self-improving-agent, deep-research-pro, last30days, te čak duplirane pathove tipa .openclaw/workspace/.openclaw/workspace/.... To je najslabija točka skill sloja.
  • 🟡 Skill inventory je čišći, ali promptovi i dalje referenciraju arhivirane/uklonjene skillove — u Alex workspaceu je 8 aktivnih lokalnih skillova i 8 arhiviranih. Unatoč tome, logovi pokazuju da cronovi i agenti još traže tavily-search-pro i heartbeat-tasks, što znači da cleanup nije dovršen na razini promptova/routera.
  • 🟢 Sub-agent runtime je funkcionalan, ali ne bez gubitakasubagent-kpi.py pokazuje 9 runova u zadnja 24h: 7 uspješnih i 2 timeouta (77.8% success). Dodatna analiza runs.json za 7 dana daje 23 runa, 21 ok i 2 timeout; prosječno trajanje ~230 s, medijan ~187 s.
  • 🟡 Timeouti su koncentrirani na duže synthesis/deep tasks — recentni timeout primjeri (nexus-hops-v2, nexus-hops-deep-audit) sugeriraju da problem nije opći spawn mehanizam nego dugi, heavy-context zadaci. To podiže trošak retrija i usporava isporuku.
  • 🟡 Heartbeat ima slab observability sloj — u journald-u se vide heartbeat started eventi, ali nema HEARTBEAT_OK zapisa za zadnjih 7 dana. Zbog toga nije moguće auditabilno izmjeriti actionable vs no-op heartbeat outcome bez dodatnog strukturiranog logiranja.
  • 🟡 Token/cost praćenje za cronove nije dovoljno vidljivo — iz dostupnih lokalnih artefakata mogu se pouzdano izvući status i trajanje, ali ne i agregirani token cost po jobu za zadnjih 7 dana. To je reporting gap, ne nužno runtime kvar.

Trend vs Prethodni Audit

  • Poboljšanje — weekly-review više nije problematičan i glavna aktivna cron jezgra izgleda stabilnije nego 08.03.
  • Pogoršanje — skill path drift je sada vidljiviji nego prije; cleanup skillova i arhive nije propagiran u sve cron promptove i agente.
  • Bez veće promjene — sub-agent sustav i dalje radi dobro za većinu zadataka, ali timeouti ostaju prisutni na dužim deep/synthesis runovima.

Top 3 Preporuke

  1. Napraviti prompt/router cleanup svih referenci na arhivirane ili uklonjene skillove (tavily-search-pro, heartbeat-tasks, self-improving-agent) i normalizirati apsolutne pathove.
  2. Uvesti structured cron telemetry: po runu zapisivati status, trajanje, token cost i delivery outcome u jedan lokalni artefakt ili tablicu, plus heartbeat outcome (ACTIONABLE vs HEARTBEAT_OK).
  3. Za duge synthesis/sub-agent taskove spustiti timeout rizik: kraći parcijalni checkpointovi, manji context batch, ili routing na prikladniji model za deep rad prije nego task uđe u 5-10 min zonu.