← Natrag na listu

monthly-2026-04.md

📊 Monthly 🔴 7 🟡 16 🟢 7

Monthly Full Scan — 2026-04

Executive Summary

Sustav je bio u dobrom stanju sredinom ožujka, ali je kraj mjeseca donio eskalaciju problema. Kritični incident: 31.03. — 5 cron jobova sistematski failalo s LiveSessionModelSwitchError (claude-opus-4-6 konfiguracijski konflikt). Do 01.04. djelomično razriješeno — 3 od 5 jobova opet rade, ali Noćni Agent Improvement (consecErr=3) i Weekly Intelligence (consecErr=1) još uvijek u erroru. Konstantni recurring problemi kroz cijeli mjesec: Brave Search 429 rate limiting, Gateway WS handshake timeouts, i memory bloat koji oscilira ali ne nestaje. Sustav generalno funkcionira, ali zahtijeva intervenciju na 2-3 prioritetna problema.

Sustav u Brojkama

Metrika Vrijednost Trend
Agenti 6+ (main, alex, matrix, spider, profesor, georga, leo) → (isto)
Cron jobovi 17 (15 ok, 2 error) ↓ (bilo 0 errora početkom mj.)
Memory (main MEMORY.md) 141 linija ↓ poboljšanje (bilo 188 max)
Memory folder (workspace) 772KB → stabilno
Brain folder 288KB
Disk 53GB/1007GB (6%) → zdravo
RAM ~3.4GB/7.7GB (44%) ↑ poraslo (bilo 1.2GB)
OpenClaw verzija 2026.3.23-2 ↓ zaostaje (latest: 2026.3.24)
Findings (30d) ~45 total (7🔴, 25🟡, 13🟢) ↑ više findinga nego baseline
Open issues 4 ↑ (bilo 3 na kraju prošlog mj.)
Security criticals 0 (riješeni 22-23.03.)

Recurring Issues (3+ pojava)

🔴 Brave Search 429 Rate Limiting — KRONIČAN

Pojavio se: 17.03., 20.03., 23.03., 24.03., 26.03., 27.03., 28.03., 29.03., 30.03.
9+ dana uzastopno. Quota Free plana (2000/mj) dostigla 76.5% (1530/2000) do 29.03.
Uzrok: višestruki agenti simultano šalju search zahtjeve bez koordinacije.
Status: ⚠️ IN_PROGRESS — nije riješeno.

🟡 Gateway WS Handshake Timeout — REKURENTNO

Pojavio se: 17.03., 18.03., 19.03., 20.03., 21.03., 22.03., 23.03., 24.03., 28.03., 29.03., 30.03.
11 dana u 30-dnevnom periodu. Pattern: ws://127.0.0.1:18789 handshake timeout, code=1000.
Uzrok vjerojatno: gateway service config out-of-date (token embedded — openclaw gateway install --force preporučen 21.03., ali NIJE izvršen).
Status: ⚠️ IN_PROGRESS — root cause poznat, fix nije primijenjen.

🟡 Memory Bloat (memory/ folder > 500KB) — PERSISTENTNO

Pojavio se: 16.03. (1.9MB), 17-20.03. rast do 2.3MB, 22.03. pad na 1.4MB (konsolidacija radila),
25-30.03. rast do 1.7MB, 01.04. pad na 768KB (konsolidacija opet radila).
Pattern: raste dok konsolidacijski job radi, pada kad proradi, ali threshold (500KB) nikad nije trajno riješen.
Status: 🟡 CHRONIC — funkcionira ali strukturalni problem.

🟡 Nightly Memory Consolidation Job Failures — PONAVLJAJUĆI

Failao: 16.03. (ERROR stanje), 20.03. (timeout), 21.03. (2x consecutive timeout), 30.03. (error), 31.03. (consecErr=2).
Uspješan: 22.03. (smanjio 2.3MB→1.4MB), 01.04. (768KB).
Pattern: job je nestabilan — povremeno radi, povremeno faila bez jasnog triggera.

🟡 Telegram Delivery Issues — REKURENTNO

  • Network outages: 22.03. (01:16), 26.03. (22:27-22:31), 28.03. (20:26)
  • 429 Rate limit: 28-29.03. (final reply fail)
  • Delivery bug 18.03. (5 jobova failalo) → RESOLVED 19.03.
    Status: 🟡 monitoring — 3 tipa problema, svaki sporadičan ali zajedno znači nedostatak delivery garantija.

🟡 Subagent Announce Gateway Timeout — PONAVLJAJUĆI

Pojavio se: 20.03., 23.03., 28.03., 29.03., 30.03.
Pattern: "gateway timeout after 90000ms" na subagent completion announce, 4/4 retry pattern.
Sustav se oporavlja ali s kašnjenjem od 5-6 min po incidentu.

Trend Analysis

Pozitivno ↑

  • Security: Kritični permission problemi (private.pem, openclaw.json) RIJEŠENI 22-23.03. ✅
  • Memory MEMORY.md: Oscilira ali pad s 188 na 141 liniju — Nightly prune radi.
  • Credential store: Proširen s 15 na 22 unosa u travnju — bolja pokrivenost.

Negativno ↓

  • Cron stabilnost: Kraj mjeseca s 2 jobbovi u erroru (vs. 0 sredinom). Sistematski fail 31.03. (5 jobova) jako zabrinjavajući.
  • RAM: 1.2GB → 3.4GB (2.8× porast). Treba pratiti — može biti aktivniji agenti.
  • Brave quota: Iskorištenost raste brže nego očekivano. Novi billing period od 01.04. — praćenje potrebno.
  • Gateway config: openclaw gateway install --force preporučen još 21.03. i NIJE izvršen do kraja mjeseca — pasivan 10+ dana.

Vs. Prošlog Monthlyja (2026-03-01)

  • Tada: 10 findinga (1🔴, 4🟡, 5🟢), open issues: 3
  • Sada: ~45 findinga (7🔴, 25🟡, 13🟢), open issues: 4
  • Zaključak: Sustav je aktivniji i složeniji (više jobova, više agenata), ali proporcionalno i više findinga. Nije nužno "lošije" — audit je zreliji i bilježi više.

Top 5 Preporuka za Travanj

  1. [KRITIČNO] Popraviti Noćni Agent Improvement i Weekly Intelligence jobove 🔴
  2. Što: Dijagnosticirati uzrok consecErr=3 i consecErr=1 za fa8463ef i 28b4407b. Provjeriti je li claude-opus-4-6 model config problem ostao ili je novi issue.
  3. Zašto: Profesor nightly improvement je ključni autonomni razvojni ciklus. 3 consecutive errora = 3 noći bez improvementa.
  4. Effort: 🟡 medium (dijagnoza + fix)
  5. Benefit: Obnova nightly improvement ciklusa, eliminacija scheduled errora.

  6. [VISOKO] Izvršiti openclaw gateway install --force 🔴

  7. Što: openclaw gateway install --force — preporučen 21.03., još neexecutan do 01.04. (11+ dana).
  8. Zašto: Root cause za WS handshake timeouts (rekurentni 11+ dana). Jedan command eliminira cijeli recurring problem.
  9. Effort: 🟢 quick win (5 min)
  10. Benefit: Eliminira WS timeouts, stabilizira gateway konekciju, popravlja subagent announce kašnjenja.

  11. [VISOKO] Pročistiti openclaw.json config 🟡

  12. Što: Ukloniti deprecated polja: commands.ownerDisplay, commands.allowFrom, channels.telegram.network.dnsResultOrder, channels.telegram.streaming.
  13. Zašto: Validation greške prisutne od 31.03. Deprecated config = risk od neočekivanog ponašanja pri sljedećem update-u.
  14. Effort: 🟢 quick win (edit config)
  15. Benefit: Čišća konfiguracija, manje log noise, spremniji za sljedeći openclaw update.

  16. [SREDNJE] Riješiti Brave Search rate limiting koordinacijom 🟡

  17. Što: Implementirati serialization between agents za Brave pozive. Configurirati Tavily kao DEFAULT search za agente koji ne trebaju real-time, rezervirati Brave za time-sensitive querije. Pratiti quota na novom billing periodu.
  18. Zašto: 9+ dana consecutivnih 429 grešaka = degradiran search quality. Quota dostigla 76.5% do kraja ožujka.
  19. Effort: 🟡 medium (AGENTS.md + TOOLS.md update)
  20. Benefit: Eliminira/smanjuje 429 errore, bolji search fallback, ušteda quotae.

  21. [SREDNJE] Popraviti zaostale file permissions 🟡

  22. Što: chmod 600 ~/.openclaw/logs/restart-*.log && chmod 600 ~/.openclaw/workspace/n8n-backups/*.json
  23. Zašto: Evidentirano u 3 uzastopna tedna audita (15.03., 22.03., 29.03.) — nikad popravljeno. Sadrže workflow definicije s API referencama.
  24. Effort: 🟢 quick win (jedan command)
  25. Benefit: Eliminira security medium finding koji se ponavlja 3 tjedna.

Finding Lifecycle Summary (30 dana)

  • 🔴 NEW: 7 (LiveSessionModelSwitchError, Noćni Agent Improvement consecErr, Nightly Memory Consolidation failures, openai-codex OAuth expired, Telegram delivery bug, Cron errors 30.03.)
  • 🟡 IN_PROGRESS: 4 (Brave 429, Gateway WS timeout, memory bloat, file permissions)
  • 🟢 RESOLVED: 13 (security permissions ×2, memory consolidation ×2 ciklusa, Telegram delivery bug, openai-codex, LiveSessionModelSwitchError 3/5 jobova, razni jednokratni incidenti)
  • ⚪ DISMISSED: 2 (powershell.exe not found — izolirani, sessions.resolve — izolirani)

Napomene

  • OpenClaw update dostupan: 2026.3.23-2 → 2026.3.24 (npm update -g openclaw)
  • Tailscale: nije konfigurirano
  • Portal (localhost:8085): operativan
  • RAM trend treba pratiti — 3.4GB/7.7GB (44%), 3× porast od prošlog audita
  • Brave billing period reset 01.04. — nova kvota 2000/mj