monthly-2026-04.md
Monthly Full Scan — 2026-04
Executive Summary
Sustav je bio u dobrom stanju sredinom ožujka, ali je kraj mjeseca donio eskalaciju problema. Kritični incident: 31.03. — 5 cron jobova sistematski failalo s LiveSessionModelSwitchError (claude-opus-4-6 konfiguracijski konflikt). Do 01.04. djelomično razriješeno — 3 od 5 jobova opet rade, ali Noćni Agent Improvement (consecErr=3) i Weekly Intelligence (consecErr=1) još uvijek u erroru. Konstantni recurring problemi kroz cijeli mjesec: Brave Search 429 rate limiting, Gateway WS handshake timeouts, i memory bloat koji oscilira ali ne nestaje. Sustav generalno funkcionira, ali zahtijeva intervenciju na 2-3 prioritetna problema.
Sustav u Brojkama
| Metrika | Vrijednost | Trend |
|---|---|---|
| Agenti | 6+ (main, alex, matrix, spider, profesor, georga, leo) | → (isto) |
| Cron jobovi | 17 (15 ok, 2 error) | ↓ (bilo 0 errora početkom mj.) |
| Memory (main MEMORY.md) | 141 linija | ↓ poboljšanje (bilo 188 max) |
| Memory folder (workspace) | 772KB | → stabilno |
| Brain folder | 288KB | — |
| Disk | 53GB/1007GB (6%) | → zdravo |
| RAM | ~3.4GB/7.7GB (44%) | ↑ poraslo (bilo 1.2GB) |
| OpenClaw verzija | 2026.3.23-2 | ↓ zaostaje (latest: 2026.3.24) |
| Findings (30d) | ~45 total (7🔴, 25🟡, 13🟢) | ↑ više findinga nego baseline |
| Open issues | 4 | ↑ (bilo 3 na kraju prošlog mj.) |
| Security criticals | 0 (riješeni 22-23.03.) | ✅ |
Recurring Issues (3+ pojava)
🔴 Brave Search 429 Rate Limiting — KRONIČAN
Pojavio se: 17.03., 20.03., 23.03., 24.03., 26.03., 27.03., 28.03., 29.03., 30.03.
9+ dana uzastopno. Quota Free plana (2000/mj) dostigla 76.5% (1530/2000) do 29.03.
Uzrok: višestruki agenti simultano šalju search zahtjeve bez koordinacije.
Status: ⚠️ IN_PROGRESS — nije riješeno.
🟡 Gateway WS Handshake Timeout — REKURENTNO
Pojavio se: 17.03., 18.03., 19.03., 20.03., 21.03., 22.03., 23.03., 24.03., 28.03., 29.03., 30.03.
11 dana u 30-dnevnom periodu. Pattern: ws://127.0.0.1:18789 handshake timeout, code=1000.
Uzrok vjerojatno: gateway service config out-of-date (token embedded — openclaw gateway install --force preporučen 21.03., ali NIJE izvršen).
Status: ⚠️ IN_PROGRESS — root cause poznat, fix nije primijenjen.
🟡 Memory Bloat (memory/ folder > 500KB) — PERSISTENTNO
Pojavio se: 16.03. (1.9MB), 17-20.03. rast do 2.3MB, 22.03. pad na 1.4MB (konsolidacija radila),
25-30.03. rast do 1.7MB, 01.04. pad na 768KB (konsolidacija opet radila).
Pattern: raste dok konsolidacijski job radi, pada kad proradi, ali threshold (500KB) nikad nije trajno riješen.
Status: 🟡 CHRONIC — funkcionira ali strukturalni problem.
🟡 Nightly Memory Consolidation Job Failures — PONAVLJAJUĆI
Failao: 16.03. (ERROR stanje), 20.03. (timeout), 21.03. (2x consecutive timeout), 30.03. (error), 31.03. (consecErr=2).
Uspješan: 22.03. (smanjio 2.3MB→1.4MB), 01.04. (768KB).
Pattern: job je nestabilan — povremeno radi, povremeno faila bez jasnog triggera.
🟡 Telegram Delivery Issues — REKURENTNO
- Network outages: 22.03. (01:16), 26.03. (22:27-22:31), 28.03. (20:26)
- 429 Rate limit: 28-29.03. (final reply fail)
- Delivery bug 18.03. (5 jobova failalo) → RESOLVED 19.03.
Status: 🟡 monitoring — 3 tipa problema, svaki sporadičan ali zajedno znači nedostatak delivery garantija.
🟡 Subagent Announce Gateway Timeout — PONAVLJAJUĆI
Pojavio se: 20.03., 23.03., 28.03., 29.03., 30.03.
Pattern: "gateway timeout after 90000ms" na subagent completion announce, 4/4 retry pattern.
Sustav se oporavlja ali s kašnjenjem od 5-6 min po incidentu.
Trend Analysis
Pozitivno ↑
- Security: Kritični permission problemi (private.pem, openclaw.json) RIJEŠENI 22-23.03. ✅
- Memory MEMORY.md: Oscilira ali pad s 188 na 141 liniju — Nightly prune radi.
- Credential store: Proširen s 15 na 22 unosa u travnju — bolja pokrivenost.
Negativno ↓
- Cron stabilnost: Kraj mjeseca s 2 jobbovi u erroru (vs. 0 sredinom). Sistematski fail 31.03. (5 jobova) jako zabrinjavajući.
- RAM: 1.2GB → 3.4GB (2.8× porast). Treba pratiti — može biti aktivniji agenti.
- Brave quota: Iskorištenost raste brže nego očekivano. Novi billing period od 01.04. — praćenje potrebno.
- Gateway config:
openclaw gateway install --forcepreporučen još 21.03. i NIJE izvršen do kraja mjeseca — pasivan 10+ dana.
Vs. Prošlog Monthlyja (2026-03-01)
- Tada: 10 findinga (1🔴, 4🟡, 5🟢), open issues: 3
- Sada: ~45 findinga (7🔴, 25🟡, 13🟢), open issues: 4
- Zaključak: Sustav je aktivniji i složeniji (više jobova, više agenata), ali proporcionalno i više findinga. Nije nužno "lošije" — audit je zreliji i bilježi više.
Top 5 Preporuka za Travanj
- [KRITIČNO] Popraviti Noćni Agent Improvement i Weekly Intelligence jobove 🔴
- Što: Dijagnosticirati uzrok
consecErr=3iconsecErr=1za fa8463ef i 28b4407b. Provjeriti je li claude-opus-4-6 model config problem ostao ili je novi issue. - Zašto: Profesor nightly improvement je ključni autonomni razvojni ciklus. 3 consecutive errora = 3 noći bez improvementa.
- Effort: 🟡 medium (dijagnoza + fix)
-
Benefit: Obnova nightly improvement ciklusa, eliminacija scheduled errora.
-
[VISOKO] Izvršiti
openclaw gateway install --force🔴 - Što:
openclaw gateway install --force— preporučen 21.03., još neexecutan do 01.04. (11+ dana). - Zašto: Root cause za WS handshake timeouts (rekurentni 11+ dana). Jedan command eliminira cijeli recurring problem.
- Effort: 🟢 quick win (5 min)
-
Benefit: Eliminira WS timeouts, stabilizira gateway konekciju, popravlja subagent announce kašnjenja.
-
[VISOKO] Pročistiti openclaw.json config 🟡
- Što: Ukloniti deprecated polja:
commands.ownerDisplay,commands.allowFrom,channels.telegram.network.dnsResultOrder,channels.telegram.streaming. - Zašto: Validation greške prisutne od 31.03. Deprecated config = risk od neočekivanog ponašanja pri sljedećem update-u.
- Effort: 🟢 quick win (edit config)
-
Benefit: Čišća konfiguracija, manje log noise, spremniji za sljedeći openclaw update.
-
[SREDNJE] Riješiti Brave Search rate limiting koordinacijom 🟡
- Što: Implementirati serialization between agents za Brave pozive. Configurirati Tavily kao DEFAULT search za agente koji ne trebaju real-time, rezervirati Brave za time-sensitive querije. Pratiti quota na novom billing periodu.
- Zašto: 9+ dana consecutivnih 429 grešaka = degradiran search quality. Quota dostigla 76.5% do kraja ožujka.
- Effort: 🟡 medium (AGENTS.md + TOOLS.md update)
-
Benefit: Eliminira/smanjuje 429 errore, bolji search fallback, ušteda quotae.
-
[SREDNJE] Popraviti zaostale file permissions 🟡
- Što:
chmod 600 ~/.openclaw/logs/restart-*.log && chmod 600 ~/.openclaw/workspace/n8n-backups/*.json - Zašto: Evidentirano u 3 uzastopna tedna audita (15.03., 22.03., 29.03.) — nikad popravljeno. Sadrže workflow definicije s API referencama.
- Effort: 🟢 quick win (jedan command)
- Benefit: Eliminira security medium finding koji se ponavlja 3 tjedna.
Finding Lifecycle Summary (30 dana)
- 🔴 NEW: 7 (LiveSessionModelSwitchError, Noćni Agent Improvement consecErr, Nightly Memory Consolidation failures, openai-codex OAuth expired, Telegram delivery bug, Cron errors 30.03.)
- 🟡 IN_PROGRESS: 4 (Brave 429, Gateway WS timeout, memory bloat, file permissions)
- 🟢 RESOLVED: 13 (security permissions ×2, memory consolidation ×2 ciklusa, Telegram delivery bug, openai-codex, LiveSessionModelSwitchError 3/5 jobova, razni jednokratni incidenti)
- ⚪ DISMISSED: 2 (powershell.exe not found — izolirani, sessions.resolve — izolirani)
Napomene
- OpenClaw update dostupan: 2026.3.23-2 → 2026.3.24 (
npm update -g openclaw) - Tailscale: nije konfigurirano
- Portal (localhost:8085): operativan
- RAM trend treba pratiti — 3.4GB/7.7GB (44%), 3× porast od prošlog audita
- Brave billing period reset 01.04. — nova kvota 2000/mj