Source code for finamt.agents.llm_caller

"""
finamt.agents.llm_caller
~~~~~~~~~~~~~~~~~~~~~~~~~~~
Local LLM caller used by all 4 extraction agents.
Handles debug output and JSON parsing with fallback.
Inference is delegated to llm_backend (mlx-lm on Apple Silicon, transformers elsewhere).
"""

from __future__ import annotations

import json
import re
from pathlib import Path

from ..utils import clean_json_response
from . import llm_backend
from .config import AgentModelConfig


def _regex_fallback(raw: str, expected_keys: list[str]) -> dict:
    """
    Last-resort per-key regex extraction when json.loads fails entirely.
    Handles:  "key": "value"  |  "key": 123.4  |  "key": null  |  "key": true/false
    """
    result: dict = {}
    for key in expected_keys:
        pattern = (
            rf'"{re.escape(key)}"\s*:\s*("(?:[^"\\]|\\.)*"|-?\d+(?:\.\d+)?|null|true|false|\[.*?\])'
        )
        m = re.search(pattern, raw, re.DOTALL)
        if m:
            try:
                result[key] = json.loads(m.group(1))
            except Exception:
                result[key] = m.group(1).strip('"')
    return result



[docs]
def call_llm(
    prompt: str,
    cfg: AgentModelConfig,
    agent_name: str,
    expected_keys: list[str],
    debug_dir: Path | None = None,
) -> dict | None:
    """
    Send prompt to the local LLM backend, parse JSON response, return dict or None.

    Saves to debug_dir:
      {agent_name}_prompt.txt
      {agent_name}_raw.txt
      {agent_name}_parsed.json
    """
    if debug_dir is not None:
        debug_dir.mkdir(parents=True, exist_ok=True)
        (debug_dir / f"{agent_name}_prompt.txt").write_text(prompt, encoding="utf-8")

    raw = ""
    for attempt in range(1, cfg.max_retries + 1):
        try:
            raw = llm_backend.generate(
                prompt,
                cfg.model,
                temperature=cfg.temperature,
                top_p=cfg.top_p,
                max_tokens=cfg.num_ctx,
            )
            if raw:
                break
        except Exception:
            if attempt == cfg.max_retries:
                raw = ""

    if debug_dir is not None:
        (debug_dir / f"{agent_name}_raw.txt").write_text(
            raw or f"FAILED after {cfg.max_retries} attempts", encoding="utf-8"
        )

    if not raw:
        return None

    # ── Parse ──────────────────────────────────────────────────────────────
    parsed: dict | None = None

    # 1. Standard path via clean_json_response
    try:
        parsed = json.loads(clean_json_response(raw))
    except (json.JSONDecodeError, ValueError):
        pass

    # 2. Regex fallback — extract each key individually
    if not parsed:
        parsed = _regex_fallback(raw, expected_keys)

    if not parsed:
        if debug_dir is not None:
            (debug_dir / f"{agent_name}_parsed.json").write_text(
                '{"_error": "parse_failed"}', encoding="utf-8"
            )
        return None

    if debug_dir is not None:
        (debug_dir / f"{agent_name}_parsed.json").write_text(
            json.dumps(parsed, indent=2, ensure_ascii=False), encoding="utf-8"
        )

    return parsed