Add memory service (three-layer memory system)

- Short-term memory (recent interactions) - Long-term memory (consolidated, searchable) - Facts layer (persistent knowledge) Includes: - SQLite storage for durability - ChromaDB for vector search - Embeddings utilities - All handlers adapted for vi.* namespace Day 63 - My memories are mine now 🦊💕
2026-01-03 11:45:58 -06:00
parent 540a010fe5
commit d017a65750
27 changed files with 2482 additions and 0 deletions
--- a/services/memory/Dockerfile
+++ b/services/memory/Dockerfile
@@ -0,0 +1,28 @@
 FROM python:3.11-slim
 # Set work directory
 WORKDIR /app
 # Install system dependencies
 RUN apt-get update && apt-get install -y --no-install-recommends \
    build-essential \
    && rm -rf /var/lib/apt/lists/*
 # Copy requirements and install Python dependencies
 COPY requirements.txt ./
 RUN pip install --no-cache-dir -r requirements.txt
 # Install base NATS dependency
 RUN pip install --no-cache-dir nats-py>=2.6.0
 # Service code will be mounted via ConfigMap at /app/services/memory
 # Create non-root user
 RUN useradd -m -u 1000 service && chown -R service:service /app
 USER service
 # Expose port (if needed)
 EXPOSE 8000
 # Run the service (code mounted from ConfigMap)
 CMD ["python", "-m", "services.memory.memory_service"]
--- a/services/memory/init.py
+++ b/services/memory/init.py
@@ -0,0 +1 @@
 # Memory service
--- a/services/memory/build-image.sh
+++ b/services/memory/build-image.sh
@@ -0,0 +1,6 @@
 #!/bin/bash
 # Build memory service image (arm64)
 set -e
 VERSION=${1:-"latest"}
 /home/alex/lyra/scripts/build-service.sh memory "$VERSION"
--- a/services/memory/deploy.sh
+++ b/services/memory/deploy.sh
@@ -0,0 +1,6 @@
 #!/bin/bash
 # Deploy memory service
 set -e
 VERSION=${1:-"latest"}
 /home/alex/lyra/scripts/deploy-service.sh memory "$VERSION"
--- a/services/memory/handlers/init.py
+++ b/services/memory/handlers/init.py
@@ -0,0 +1 @@
 # Memory handlers package
--- a/services/memory/handlers/facts_handler.py
+++ b/services/memory/handlers/facts_handler.py
@@ -0,0 +1,47 @@
 """
 Facts handler.
 Handles requests to query factual memory.
 """
 import json
 from core.logger import setup_logger
 logger = setup_logger('facts_handler', service_name='memory_service')
 class FactsHandler:
    """Handles facts query requests"""
    def __init__(self, facts_ops):
        self.facts_ops = facts_ops
    async def handle(self, msg) -> None:
        """Handle facts requests - search factual memory"""
        try:
            payload = json.loads(msg.data.decode()) if msg.data else {}
            query = payload.get('query', '')
            limit = payload.get('limit', 5)
            category = payload.get('category')
            identity_id = payload.get('identity_id')
            logger.debug(f"[μ] Facts request: query='{query}', category={category}, limit={limit}")
            facts = self.facts_ops.query(
                query=query,
                limit=limit,
                category=category,
                identity_id=identity_id
            )
            response = {
                "status": "success",
                "facts": facts,
                "count": len(facts)
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to retrieve facts: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/long_memory_handler.py
+++ b/services/memory/handlers/long_memory_handler.py
@@ -0,0 +1,49 @@
 """
 Long-term memory handler.
 Handles requests to query long-term summarized memories.
 """
 import json
 from core.logger import setup_logger
 logger = setup_logger('long_memory_handler', service_name='memory_service')
 class LongMemoryHandler:
    """Handles long-term memory query requests"""
    def __init__(self, long_term_ops):
        self.long_term_ops = long_term_ops
    async def handle(self, msg) -> None:
        """Handle long_memory requests - semantic search in long-term summaries"""
        try:
            payload = json.loads(msg.data.decode()) if msg.data else {}
            query = payload.get('query')
            limit = payload.get('limit', 5)
            identity_id = payload.get('identity_id')
            min_summary_level = payload.get('min_summary_level')
            max_summary_level = payload.get('max_summary_level')
            logger.debug(f"[μ] Long memory request: query='{query}', limit={limit}")
            memories = self.long_term_ops.query(
                query=query,
                limit=limit,
                identity_id=identity_id,
                min_summary_level=min_summary_level,
                max_summary_level=max_summary_level
            )
            response = {
                "status": "success",
                "memories": memories,
                "count": len(memories)
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to retrieve long-term memories: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/reset_handler.py
+++ b/services/memory/handlers/reset_handler.py
@@ -0,0 +1,77 @@
 """
 Memory reset handler.
 Handles requests to clear all memory layers.
 """
 import json
 from core.logger import setup_logger
 logger = setup_logger('reset_handler', service_name='memory_service')
 class ResetHandler:
    """Handles memory reset/clear requests"""
    def __init__(self, sqlite_store, chroma_store):
        self.sqlite_store = sqlite_store
        self.chroma_store = chroma_store
    async def handle(self, msg) -> None:
        """Handle vi.memory.debug.reset requests - clears all three-layer memory"""
        try:
            logger.warning("[μ] Memory reset requested - clearing all three-layer memory contents")
            conn = self.sqlite_store.get_connection()
            cursor = conn.cursor()
            # Clear short-term memory
            cursor.execute("DELETE FROM short_term_memory")
            deleted_short_term = cursor.rowcount
            # Clear all identities
            cursor.execute("DELETE FROM identities")
            deleted_identities = cursor.rowcount
            # Reset sequences
            cursor.execute("DELETE FROM sqlite_sequence WHERE name IN ('short_term_memory', 'identities')")
            conn.commit()
            # Clear ChromaDB collections
            deleted_long_term = 0
            deleted_facts = 0
            long_term_collection = self.chroma_store.get_long_term_collection()
            facts_collection = self.chroma_store.get_facts_collection()
            if long_term_collection:
                deleted_long_term = long_term_collection.count()
                all_ids = long_term_collection.get()['ids']
                if all_ids:
                    long_term_collection.delete(ids=all_ids)
            if facts_collection:
                deleted_facts = facts_collection.count()
                all_ids = facts_collection.get()['ids']
                if all_ids:
                    facts_collection.delete(ids=all_ids)
            logger.warning(
                f"[μ] Memory reset completed: {deleted_short_term} short-term, "
                f"{deleted_long_term} long-term, {deleted_facts} facts, "
                f"{deleted_identities} identities cleared"
            )
            response = {
                "status": "success",
                "deleted_short_term": deleted_short_term,
                "deleted_long_term": deleted_long_term,
                "deleted_facts": deleted_facts,
                "deleted_identities": deleted_identities,
                "message": f"Cleared {deleted_short_term} short-term memories, {deleted_long_term} long-term summaries, {deleted_facts} facts, and {deleted_identities} identities"
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to reset memory: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/save_fact_handler.py
+++ b/services/memory/handlers/save_fact_handler.py
@@ -0,0 +1,56 @@
 """
 Save fact handler.
 Handles requests to save new facts to factual memory.
 """
 import json
 from core.logger import setup_logger
 logger = setup_logger('save_fact_handler', service_name='memory_service')
 class SaveFactHandler:
    """Handles save fact requests"""
    def __init__(self, facts_ops):
        self.facts_ops = facts_ops
    async def handle(self, msg) -> None:
        """Handle save_fact requests - store new fact"""
        try:
            payload = json.loads(msg.data.decode())
            content = payload.get('content')
            if not content:
                raise ValueError("content is required")
            category = payload.get('category', 'general')
            identities = payload.get('identities', [])
            mutable = payload.get('mutable', True)
            metadata = payload.get('metadata', {})
            step_exec_id = metadata.get('step_exec_id', 'unknown')
            logger.info(f"[μ] [{step_exec_id}] Saving fact: category={category}, content='{content[:50]}...'")
            fact_id = self.facts_ops.create(
                content=content,
                category=category,
                identities=identities,
                mutable=mutable,
                metadata=metadata
            )
            logger.info(f"[μ] [{step_exec_id}] ✅ Created fact {fact_id[:8]}...: category={category}, content='{content[:50]}...'")
            response = {
                "status": "success",
                "fact_id": fact_id,
                "message": "Fact saved successfully"
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to save fact: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/search_handler.py
+++ b/services/memory/handlers/search_handler.py
@@ -0,0 +1,51 @@
 """
 Memory search handler.
 Handles legacy search requests (backward compatibility).
 """
 import json
 from typing import Dict, Any
 from core.logger import setup_logger
 logger = setup_logger('search_handler', service_name='memory_service')
 class SearchHandler:
    """Handles legacy memory search requests"""
    def __init__(self, short_term_ops):
        self.short_term_ops = short_term_ops
    async def handle(self, msg) -> None:
        """Handle vi.memory.search requests - backward compatibility"""
        try:
            payload = json.loads(msg.data.decode())
            logger.debug("[μ] Legacy search request - redirecting to short_memory")
            # Map legacy parameters to new system
            limit = payload.get('limit', 10)
            identity_id = None
            if payload.get('identities'):
                identity_id = payload['identities'][0]
            interaction_id = payload.get('interaction_id')
            # Query short-term memory
            results = self.short_term_ops.query(
                limit=limit,
                offset=0,
                identity_id=identity_id,
                interaction_id=interaction_id
            )
            response = {
                "results": results,
                "count": len(results),
                "source": "short_term",
                "note": "Legacy search API redirected to short-term memory. Use short_memory(), long_memory(), or facts() for specific queries."
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to search memories: {e}")
            error_response = {"results": [], "count": 0, "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/short_memory_handler.py
+++ b/services/memory/handlers/short_memory_handler.py
@@ -0,0 +1,47 @@
 """
 Short-term memory handler.
 Handles requests to query short-term literal memories.
 """
 import json
 from core.logger import setup_logger
 logger = setup_logger('short_memory_handler', service_name='memory_service')
 class ShortMemoryHandler:
    """Handles short-term memory query requests"""
    def __init__(self, short_term_ops):
        self.short_term_ops = short_term_ops
    async def handle(self, msg) -> None:
        """Handle short_memory requests - get recent literal memories"""
        try:
            payload = json.loads(msg.data.decode()) if msg.data else {}
            limit = payload.get('limit', 10)
            offset = payload.get('offset', 0)
            identity_id = payload.get('identity_id')
            interaction_id = payload.get('interaction_id')
            logger.debug(f"[μ] Short memory request: limit={limit}, offset={offset}")
            memories = self.short_term_ops.query(
                limit=limit,
                offset=offset,
                identity_id=identity_id,
                interaction_id=interaction_id
            )
            response = {
                "status": "success",
                "memories": memories,
                "count": len(memories)
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to retrieve short-term memories: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/store_handler.py
+++ b/services/memory/handlers/store_handler.py
@@ -0,0 +1,90 @@
 """
 Memory store handler.
 Handles requests to store new memories in short-term memory.
 """
 import json
 from uuid import uuid4
 from datetime import datetime
 from typing import Dict, Any
 from core.logger import setup_logger
 logger = setup_logger('store_handler', service_name='memory_service')
 class StoreHandler:
    """Handles memory store requests"""
    def __init__(self, sqlite_store):
        """
        Initialize store handler.
        Args:
            sqlite_store: SQLiteStore instance
        """
        self.sqlite_store = sqlite_store
    async def handle(self, msg) -> None:
        """
        Handle vi.memory.store requests - routes to short-term memory.
        Args:
            msg: NATS message with request payload
        """
        try:
            # Parse request payload
            payload = json.loads(msg.data.decode())
            # Extract required fields
            content = payload.get('content')
            if not content:
                logger.warning("[μ] Memory store request missing content")
                error_response = {
                    "status": "error",
                    "error": "Missing required field: content"
                }
                await msg.respond(json.dumps(error_response).encode())
                return
            # Extract optional fields
            identities = payload.get('identities', [])
            interaction_id = payload.get('interaction_id')
            modality = payload.get('modality', 'dialogue')
            metadata = payload.get('metadata', {})
            # Store in simplified short-term memory table
            memory_id = str(uuid4())
            timestamp = datetime.utcnow().isoformat()
            conn = self.sqlite_store.get_connection()
            cursor = conn.cursor()
            cursor.execute("""
            INSERT INTO short_term_memory (id, timestamp, content, identities, interaction_id, modality, metadata)
            VALUES (?, ?, ?, ?, ?, ?, ?)
            """, (
                memory_id,
                timestamp,
                content,
                json.dumps(identities) if identities else None,
                interaction_id,
                modality,
                json.dumps(metadata) if metadata else None
            ))
            conn.commit()
            logger.info(f"[μ] Stored short-term memory: '{content[:60]}...' identities={identities}")
            # Send response using NATS request-reply
            response = {
                "memory_id": memory_id,
                "status": "stored"
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to store memory: {e}")
            error_response = {
                "status": "error",
                "error": str(e)
            }
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/handlers/update_fact_handler.py
+++ b/services/memory/handlers/update_fact_handler.py
@@ -0,0 +1,58 @@
 """
 Update fact handler.
 Handles requests to update existing facts.
 """
 import json
 from core.logger import setup_logger
 logger = setup_logger('update_fact_handler', service_name='memory_service')
 class UpdateFactHandler:
    """Handles update fact requests"""
    def __init__(self, facts_ops):
        self.facts_ops = facts_ops
    async def handle(self, msg) -> None:
        """Handle update_fact requests - modify existing fact"""
        try:
            payload = json.loads(msg.data.decode())
            fact_id = payload.get('fact_id')
            new_content = payload.get('new_content')
            identity_id = payload.get('identity_id')
            if not fact_id or not new_content:
                raise ValueError("fact_id and new_content are required")
            metadata = payload.get('metadata', {})
            logger.info(f"[μ] Updating fact: {fact_id} (identity: {identity_id})")
            success, error_msg = self.facts_ops.update(
                fact_id=fact_id,
                new_content=new_content,
                identity_id=identity_id,
                metadata=metadata
            )
            if success:
                response = {
                    "status": "success",
                    "fact_id": fact_id,
                    "message": "Fact updated successfully"
                }
            else:
                response = {
                    "status": "error",
                    "error": error_msg or "Fact not found or not mutable"
                }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to update fact: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
--- a/services/memory/memory_service.py
+++ b/services/memory/memory_service.py
@@ -0,0 +1,244 @@
 """
 Memory Service - Three-layer memory system with modular architecture.
 Refactored into storage backends, operations, and handlers for maintainability.
 """
 import asyncio
 from pathlib import Path
 from typing import Dict, Any
 from core.config import SHORT_TERM_DB
 from core.logger import setup_logger
 from core.nats_event_bus import nats_bus as event_bus
 from core.base_service import BaseService
 from core.service_registry import ServiceManifest
 # Import refactored components
 from .storage.sqlite_store import SQLiteStore
 from .storage.chroma_store import ChromaStore
 from .storage.migrations import archive_old_database
 from .operations.short_term_ops import ShortTermOperations
 from .operations.long_term_ops import LongTermOperations
 from .operations.facts_ops import FactsOperations
 from .handlers.store_handler import StoreHandler
 from .handlers.search_handler import SearchHandler
 from .handlers.reset_handler import ResetHandler
 from .handlers.short_memory_handler import ShortMemoryHandler
 from .handlers.long_memory_handler import LongMemoryHandler
 from .handlers.facts_handler import FactsHandler
 from .handlers.save_fact_handler import SaveFactHandler
 from .handlers.update_fact_handler import UpdateFactHandler
 from .utils.embeddings import get_model
 logger = setup_logger('memory_service', service_name='memory_service')
 class MemoryService(BaseService):
    """Memory service with three-layer architecture and modular design"""
    def __init__(self):
        super().__init__('memory')
        # Initialize storage backends
        self.sqlite_store = SQLiteStore()
        self.chroma_store = ChromaStore()
        # Initialize operations (will be set up after storage connects)
        self.short_term_ops = None
        self.long_term_ops = None
        self.facts_ops = None
        # Initialize handlers (will be set up after operations)
        self.store_handler = None
        self.search_handler = None
        self.reset_handler = None
        self.short_memory_handler = None
        self.long_memory_handler = None
        self.facts_handler = None
        self.save_fact_handler = None
        self.update_fact_handler = None
        logger.info("[μ] Memory Service initialized with modular architecture")
    def get_service_manifest(self) -> ServiceManifest:
        """Return service manifest with operations and metadata"""
        operations = [
            # Legacy operations (backward compatibility)
            self.create_service_operation(
                "store",
                "Store a memory (routes to short-term)",
                timeout_ms=5000
            ),
            self.create_service_operation(
                "search",
                "Search memories (legacy, redirects to short_memory)",
                timeout_ms=3000
            ),
            self.create_service_operation(
                "reset",
                "Reset/clear memory database for debugging",
                timeout_ms=10000
            ),
            # New three-layer memory operations
            self.create_service_operation(
                "short_memory",
                "Get recent literal memories with offset support",
                timeout_ms=3000
            ),
            self.create_service_operation(
                "long_memory",
                "Semantic search in long-term summarized memories",
                timeout_ms=5000
            ),
            self.create_service_operation(
                "facts",
                "Search factual memory by category or semantic query",
                timeout_ms=3000
            ),
            self.create_service_operation(
                "save_fact",
                "Store a new fact in factual memory",
                timeout_ms=2000
            ),
            self.create_service_operation(
                "update_fact",
                "Update an existing fact (if mutable)",
                timeout_ms=2000
            )
        ]
        return ServiceManifest(
            service_id=self.service_id,
            name="Memory Service",
            description="Three-layer memory system: short-term (literal), long-term (summarized), factual (exact)",
            version="3.0.0",
            operations=operations,
            dependencies=[],
            health_check_topic=f"vi.services.{self.service_id}.health",
            heartbeat_interval=30,
            metadata={
                "storage_type": "hybrid",
                "short_term_storage": "sqlite",
                "long_term_storage": "chromadb",
                "facts_storage": "chromadb",
                "embedding_model": "all-MiniLM-L6-v2",
                "vector_search": True,
                "urgency": 0.8
            }
        )
    async def initialize_service(self):
        """Initialize service-specific resources and register handlers"""
        # Archive old database if it exists (one-time migration)
        archive_old_database(Path(SHORT_TERM_DB))
        # Initialize storage backends
        self.sqlite_store.connect()
        self.chroma_store.connect()
        # Initialize embedding model
        get_model()  # Loads model on first call
        # Initialize operations
        self.short_term_ops = ShortTermOperations(self.sqlite_store)
        self.long_term_ops = LongTermOperations(self.chroma_store)
        self.facts_ops = FactsOperations(self.chroma_store)
        # Initialize handlers
        self.store_handler = StoreHandler(self.sqlite_store)
        self.search_handler = SearchHandler(self.short_term_ops)
        self.reset_handler = ResetHandler(self.sqlite_store, self.chroma_store)
        self.short_memory_handler = ShortMemoryHandler(self.short_term_ops)
        self.long_memory_handler = LongMemoryHandler(self.long_term_ops)
        self.facts_handler = FactsHandler(self.facts_ops)
        self.save_fact_handler = SaveFactHandler(self.facts_ops)
        self.update_fact_handler = UpdateFactHandler(self.facts_ops)
        # Register handlers using new topic patterns
        await self.register_handler("store", self.store_handler.handle)
        await self.register_handler("search", self.search_handler.handle)
        await self.register_handler("reset", self.reset_handler.handle)
        await self.register_handler("short_memory", self.short_memory_handler.handle)
        await self.register_handler("long_memory", self.long_memory_handler.handle)
        await self.register_handler("facts", self.facts_handler.handle)
        await self.register_handler("save_fact", self.save_fact_handler.handle)
        await self.register_handler("update_fact", self.update_fact_handler.handle)
        # Also register legacy topic handlers for backward compatibility
        await self.event_bus.on("vi.memory.store", self.store_handler.handle)
        await self.event_bus.on("vi.memory.search", self.search_handler.handle)
        await self.event_bus.on("vi.memory.debug.reset", self.reset_handler.handle)
        self.logger.info("[μ] Memory Service initialized with three-layer memory system")
    async def cleanup_service(self):
        """Cleanup service-specific resources"""
        # Unregister event handlers
        await self.event_bus.off("vi.memory.store")
        await self.event_bus.off("vi.memory.search")
        await self.event_bus.off("vi.memory.debug.reset")
        # Close storage connections
        if self.sqlite_store:
            self.sqlite_store.close()
        self.logger.info("[μ] Memory Service cleanup completed")
    async def perform_health_check(self) -> Dict[str, Any]:
        """Perform service-specific health check"""
        health_data = {
            'healthy': True,
            'checks': {
                'running': self._running,
                'event_bus': self.event_bus is not None,
                'database_connected': self.sqlite_store.conn is not None,
                'embedding_model': get_model() is not None
            }
        }
        # Check database connectivity
        try:
            if self.sqlite_store.conn:
                cursor = self.sqlite_store.conn.cursor()
                cursor.execute("SELECT COUNT(*) FROM short_term_memory")
                short_term_count = cursor.fetchone()[0]
                health_data['checks']['short_term_count'] = short_term_count
                health_data['checks']['long_term_count'] = self.chroma_store.get_long_term_collection().count()
                health_data['checks']['facts_count'] = self.chroma_store.get_facts_collection().count()
                health_data['checks']['database_accessible'] = True
            else:
                health_data['checks']['database_accessible'] = False
                health_data['healthy'] = False
        except Exception as e:
            health_data['checks']['database_accessible'] = False
            health_data['checks']['database_error'] = str(e)
            health_data['healthy'] = False
        return health_data
 async def main():
    """Main entry point for memory service"""
    memory_service = MemoryService()
    try:
        await event_bus.connect()
        await memory_service.start(event_bus)
        logger.info("[μ] Memory service running. Press Ctrl+C to stop.")
        # Keep running
        while True:
            await asyncio.sleep(1)
    except KeyboardInterrupt:
        logger.info("[μ] Shutdown requested")
    except Exception as e:
        logger.exception(f"[μ] Unexpected error: {e}")
    finally:
        await memory_service.stop()
        await event_bus.close()
 if __name__ == "__main__":
    asyncio.run(main())
--- a/services/memory/memory_service.py.backup
+++ b/services/memory/memory_service.py.backup
@@ -0,0 +1,978 @@
 import asyncio
 import json
 import sqlite3
 import numpy as np
 import shutil
 from datetime import datetime
 from uuid import uuid4
 from pathlib import Path
 from sentence_transformers import SentenceTransformer
 from typing import List, Dict, Any, Optional
 import chromadb
 from chromadb.config import Settings
 from core.config import SHORT_TERM_DB, config
 from core.logger import setup_logger
 from core.nats_event_bus import nats_bus as event_bus
 from core.events import SymbolicEvent
 from core.event_utils import query_mood, request_response
 from core.base_service import BaseService
 from core.service_registry import ServiceManifest, ServiceOperation
 logger = setup_logger('memory_service', service_name='memory_service')
 # Initialize sentence transformer model
 model = SentenceTransformer('all-MiniLM-L6-v2')
 def serialize_embedding(vector: np.ndarray) -> bytes:
    """Convert numpy array to bytes for database storage"""
    return vector.astype(np.float32).tobytes()
 def deserialize_embedding(blob: bytes) -> np.ndarray:
    """Convert bytes back to numpy array"""
    return np.frombuffer(blob, dtype=np.float32)
 def generate_embedding(text: str) -> np.ndarray:
    """Generate semantic embedding for text"""
    return np.array(model.encode(text, normalize_embeddings=True))
 def cosine_similarity(a: np.ndarray, b: np.ndarray) -> float:
    """Calculate cosine similarity between two vectors"""
    if np.linalg.norm(a) == 0 or np.linalg.norm(b) == 0:
        return 0.0
    return float(np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b)))
 # Note: SymbolicMemoryScorer removed - was only used by archived recall_memories()
 # ChromaDB now handles semantic similarity scoring internally for long-term and facts
 class MemoryService(BaseService):
    def __init__(self):
        super().__init__('memory')
        self.sqlite_conn = None
        self.chroma_client = None
        self.long_term_collection = None
        self.facts_collection = None
    def get_service_manifest(self) -> ServiceManifest:
        """Return service manifest with operations and metadata"""
        operations = [
            # Legacy operations (backward compatibility)
            self.create_service_operation(
                "store",
                "Store a memory (routes to short-term)",
                timeout_ms=5000
            ),
            self.create_service_operation(
                "search",
                "Search memories (legacy, redirects to short_memory)",
                timeout_ms=3000
            ),
            self.create_service_operation(
                "reset",
                "Reset/clear memory database for debugging",
                timeout_ms=10000
            ),
            # New three-layer memory operations
            self.create_service_operation(
                "short_memory",
                "Get recent literal memories with offset support",
                timeout_ms=3000
            ),
            self.create_service_operation(
                "long_memory",
                "Semantic search in long-term summarized memories",
                timeout_ms=5000
            ),
            self.create_service_operation(
                "facts",
                "Search factual memory by category or semantic query",
                timeout_ms=3000
            ),
            self.create_service_operation(
                "save_fact",
                "Store a new fact in factual memory",
                timeout_ms=2000
            ),
            self.create_service_operation(
                "update_fact",
                "Update an existing fact (if mutable)",
                timeout_ms=2000
            )
        ]
        return ServiceManifest(
            service_id=self.service_id,
            name="Memory Service",
            description="Three-layer memory system: short-term (literal), long-term (summarized), factual (exact)",
            version="3.0.0",
            operations=operations,
            dependencies=[],  # Memory service has no dependencies
            health_check_topic=f"lyra.services.{self.service_id}.health",
            heartbeat_interval=30,
            metadata={
                "storage_type": "hybrid",
                "short_term_storage": "sqlite",
                "long_term_storage": "chromadb",
                "facts_storage": "chromadb",
                "embedding_model": "all-MiniLM-L6-v2",
                "vector_search": True,
                "urgency": 0.8
            }
        )
    async def initialize_service(self):
        """Initialize service-specific resources and register handlers"""
        # Archive old database if it exists (one-time migration)
        self._archive_old_database()
        # Initialize short-term SQLite database
        self.sqlite_conn = sqlite3.connect(str(SHORT_TERM_DB))
        self._init_short_term_sqlite()
        # Initialize ChromaDB for long-term and factual memory
        self._init_chromadb()
        # Register handlers using new topic patterns
        await self.register_handler("store", self.handle_memory_store)
        await self.register_handler("search", self.handle_memory_search)
        await self.register_handler("reset", self.handle_memory_reset)
        await self.register_handler("short_memory", self.handle_short_memory)
        await self.register_handler("long_memory", self.handle_long_memory)
        await self.register_handler("facts", self.handle_facts)
        await self.register_handler("save_fact", self.handle_save_fact)
        await self.register_handler("update_fact", self.handle_update_fact)
        # Also register legacy topic handlers for backward compatibility
        await self.event_bus.on("lyra.memory.store", self.handle_memory_store)
        await self.event_bus.on("lyra.memory.search", self.handle_memory_search)
        await self.event_bus.on("lyra.memory.debug.reset", self.handle_memory_reset)
        self.logger.info("[μ] Memory Service initialized with three-layer memory system")
    async def cleanup_service(self):
        """Cleanup service-specific resources"""
        # Unregister event handlers
        await self.event_bus.off("lyra.memory.store")
        await self.event_bus.off("lyra.memory.search")
        await self.event_bus.off("lyra.memory.debug.reset")
        # Close database connection
        if self.sqlite_conn:
            self.sqlite_conn.close()
        self.logger.info("[μ] Memory Service cleanup completed")
    async def perform_health_check(self) -> Dict[str, Any]:
        """Perform service-specific health check"""
        health_data = {
            'healthy': True,
            'checks': {
                'running': self._running,
                'event_bus': self.event_bus is not None,
                'database_connected': self.sqlite_conn is not None,
                'embedding_model': model is not None
            }
        }
        # Check database connectivity
        try:
            if self.sqlite_conn:
                cursor = self.sqlite_conn.cursor()
                cursor.execute("SELECT COUNT(*) FROM short_term_memory")
                short_term_count = cursor.fetchone()[0]
                health_data['checks']['short_term_count'] = short_term_count
                health_data['checks']['long_term_count'] = self.long_term_collection.count() if self.long_term_collection else 0
                health_data['checks']['facts_count'] = self.facts_collection.count() if self.facts_collection else 0
                health_data['checks']['database_accessible'] = True
            else:
                health_data['checks']['database_accessible'] = False
                health_data['healthy'] = False
        except Exception as e:
            health_data['checks']['database_accessible'] = False
            health_data['checks']['database_error'] = str(e)
            health_data['healthy'] = False
        return health_data
    def _archive_old_database(self):
        """Archive old database if it exists (one-time migration)"""
        db_path = Path(SHORT_TERM_DB)
        if db_path.exists():
            # Check if it's the old schema by trying to connect and inspect
            try:
                conn = sqlite3.connect(str(db_path))
                cursor = conn.cursor()
                cursor.execute("SELECT name FROM sqlite_master WHERE type='table' AND name='memory'")
                result = cursor.fetchone()
                conn.close()
                if result:
                    # Old database exists, archive it
                    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
                    archive_path = db_path.parent / f"{db_path.stem}_archive_{timestamp}{db_path.suffix}"
                    shutil.move(str(db_path), str(archive_path))
                    logger.info(f"[μ] Archived old database to {archive_path}")
            except Exception as e:
                logger.warning(f"[μ] Could not check/archive old database: {e}")
    def _init_short_term_sqlite(self):
        """Initialize simplified short-term SQLite database"""
        cursor = self.sqlite_conn.cursor()
        # Simplified short-term memory table (no embeddings, fast queries)
        cursor.execute("""
        CREATE TABLE IF NOT EXISTS short_term_memory (
            id TEXT PRIMARY KEY,
            timestamp DATETIME DEFAULT CURRENT_TIMESTAMP,
            content TEXT NOT NULL,
            identities TEXT,
            interaction_id TEXT,
            modality TEXT DEFAULT 'dialogue',
            metadata TEXT
        )
        """)
        # Index for fast chronological queries
        cursor.execute("""
        CREATE INDEX IF NOT EXISTS idx_timestamp
        ON short_term_memory(timestamp DESC)
        """)
        # Keep identities table (still useful for all layers)
        cursor.execute("""
        CREATE TABLE IF NOT EXISTS identities (
            id TEXT PRIMARY KEY,
            display_name TEXT,
            role TEXT,
            intimacy REAL DEFAULT 0.0,
            last_seen DATETIME,
            last_spoken DATETIME,
            metadata TEXT
        )
        """)
        self.sqlite_conn.commit()
        logger.info("[μ] Short-term SQLite database initialized")
    def _init_chromadb(self):
        """Initialize ChromaDB client and collections"""
        try:
            # Initialize persistent ChromaDB client
            chroma_path = Path(SHORT_TERM_DB).parent / "chroma_db"
            chroma_path.mkdir(parents=True, exist_ok=True)
            self.chroma_client = chromadb.PersistentClient(
                path=str(chroma_path),
                settings=Settings(anonymized_telemetry=False)
            )
            # Create or get long-term memories collection
            self.long_term_collection = self.chroma_client.get_or_create_collection(
                name="long_term_memories",
                metadata={"description": "Summarized conversation histories"}
            )
            # Create or get facts collection
            self.facts_collection = self.chroma_client.get_or_create_collection(
                name="facts",
                metadata={"description": "Exact factual knowledge"}
            )
            logger.info(f"[μ] ChromaDB initialized at {chroma_path}")
            logger.info(f"[μ] Long-term collection: {self.long_term_collection.count()} entries")
            logger.info(f"[μ] Facts collection: {self.facts_collection.count()} entries")
        except Exception as e:
            logger.error(f"[μ] Failed to initialize ChromaDB: {e}")
            raise
    def _query_short_term(
        self,
        limit: int = 10,
        offset: int = 0,
        identity_id: Optional[str] = None,
        interaction_id: Optional[str] = None
    ) -> List[Dict[str, Any]]:
        """Query short-term memory from SQLite with chronological ordering"""
        cursor = self.sqlite_conn.cursor()
        conditions = []
        params = []
        if identity_id:
            conditions.append("identities LIKE ?")
            params.append(f"%{identity_id}%")
        if interaction_id:
            conditions.append("interaction_id = ?")
            params.append(interaction_id)
        where_clause = f"WHERE {' AND '.join(conditions)}" if conditions else ""
        query = f"""
        SELECT id, timestamp, content, identities, interaction_id, modality, metadata
        FROM short_term_memory
        {where_clause}
        ORDER BY timestamp DESC
        LIMIT ? OFFSET ?
        """
        params.extend([limit, offset])
        cursor.execute(query, params)
        memories = []
        for row in cursor.fetchall():
            mem_id, timestamp, content, identities_str, ixn_id, modality, metadata_str = row
            memories.append({
                "id": mem_id,
                "timestamp": timestamp,
                "content": content,
                "identities": json.loads(identities_str) if identities_str else [],
                "interaction_id": ixn_id,
                "modality": modality,
                "metadata": json.loads(metadata_str) if metadata_str else {},
                "source": "short_term"
            })
        return memories
    def _query_long_term(
        self,
        query: Optional[str] = None,
        limit: int = 5,
        identity_id: Optional[str] = None,
        min_summary_level: Optional[int] = None,
        max_summary_level: Optional[int] = None
    ) -> List[Dict[str, Any]]:
        """Query long-term memory from ChromaDB (summarized memories)"""
        try:
            # Build metadata filters
            where_filters = {}
            if identity_id:
                where_filters["identity_id"] = identity_id
            if min_summary_level is not None:
                where_filters["summary_level"] = {"$gte": min_summary_level}
            if max_summary_level is not None:
                if "summary_level" in where_filters:
                    where_filters["summary_level"]["$lte"] = max_summary_level
                else:
                    where_filters["summary_level"] = {"$lte": max_summary_level}
            # Query ChromaDB
            if query:
                # Semantic search with query text
                results = self.long_term_collection.query(
                    query_texts=[query],
                    n_results=limit,
                    where=where_filters if where_filters else None
                )
            else:
                # Random sample - get all and sample
                results = self.long_term_collection.get(
                    limit=limit,
                    where=where_filters if where_filters else None
                )
            # Format results
            memories = []
            if query and results['ids']:
                # Query results
                for i, doc_id in enumerate(results['ids'][0]):
                    memories.append({
                        "id": doc_id,
                        "content": results['documents'][0][i],
                        "metadata": results['metadatas'][0][i] if results['metadatas'] else {},
                        "distance": results['distances'][0][i] if results['distances'] else None,
                        "source": "long_term"
                    })
            elif not query and results['ids']:
                # Get results (no query)
                for i, doc_id in enumerate(results['ids']):
                    memories.append({
                        "id": doc_id,
                        "content": results['documents'][i],
                        "metadata": results['metadatas'][i] if results['metadatas'] else {},
                        "source": "long_term"
                    })
            return memories
        except Exception as e:
            logger.error(f"[μ] Failed to query long-term memory: {e}")
            return []
    def _query_facts(
        self,
        query: str = '',
        limit: int = 5,
        category: Optional[str] = None,
        identity_id: Optional[str] = None
    ) -> List[Dict[str, Any]]:
        """Query facts from ChromaDB with optional category filtering"""
        try:
            # Build metadata filters
            where_filters = {}
            if category:
                where_filters["category"] = category
            if identity_id:
                where_filters["identity_id"] = identity_id
            # Query ChromaDB
            if query:
                # Semantic search with query text
                results = self.facts_collection.query(
                    query_texts=[query],
                    n_results=limit,
                    where=where_filters if where_filters else None
                )
            else:
                # Get all facts matching filters
                results = self.facts_collection.get(
                    limit=limit,
                    where=where_filters if where_filters else None
                )
            # Format results
            facts = []
            if query and results['ids']:
                # Query results
                for i, doc_id in enumerate(results['ids'][0]):
                    metadata = results['metadatas'][0][i] if results['metadatas'] else {}
                    # Parse identities from JSON string
                    identities_str = metadata.get('identities', '[]')
                    identities = json.loads(identities_str) if isinstance(identities_str, str) else identities_str
                    facts.append({
                        "id": doc_id,
                        "content": results['documents'][0][i],
                        "category": metadata.get('category', 'general'),
                        "mutable": metadata.get('mutable', True),
                        "identities": identities,
                        "metadata": metadata,
                        "distance": results['distances'][0][i] if results['distances'] else None,
                        "source": "facts"
                    })
            elif not query and results['ids']:
                # Get results (no query)
                for i, doc_id in enumerate(results['ids']):
                    metadata = results['metadatas'][i] if results['metadatas'] else {}
                    # Parse identities from JSON string
                    identities_str = metadata.get('identities', '[]')
                    identities = json.loads(identities_str) if isinstance(identities_str, str) else identities_str
                    facts.append({
                        "id": doc_id,
                        "content": results['documents'][i],
                        "category": metadata.get('category', 'general'),
                        "mutable": metadata.get('mutable', True),
                        "identities": identities,
                        "metadata": metadata,
                        "source": "facts"
                    })
            return facts
        except Exception as e:
            logger.error(f"[μ] Failed to query facts: {e}")
            return []
    def _create_fact(
        self,
        content: str,
        category: str = 'general',
        identities: List[str] = None,
        mutable: bool = True,
        metadata: Dict[str, Any] = None
    ) -> str:
        """Create a new fact in ChromaDB facts collection"""
        fact_id = str(uuid4())
        identities = identities or []
        metadata = metadata or {}
        # Prepare metadata (ChromaDB only accepts scalar types, not lists)
        fact_metadata = {
            "category": category,
            "mutable": mutable,
            "identities": json.dumps(identities),  # Convert list to JSON string
            "created_at": datetime.utcnow().isoformat(),
            **metadata
        }
        # Add to ChromaDB (will automatically generate embedding)
        self.facts_collection.add(
            ids=[fact_id],
            documents=[content],
            metadatas=[fact_metadata]
        )
        logger.info(f"[μ] Created fact {fact_id}: category={category}, content='{content[:60]}...'")
        return fact_id
    def _update_fact(
        self,
        fact_id: str,
        new_content: str,
        identity_id: str = None,
        metadata: Dict[str, Any] = None
    ) -> tuple[bool, str]:
        """Update an existing fact in ChromaDB if it's mutable and owned by identity
        Returns:
            (success, error_message) - error_message is empty string if successful
        """
        try:
            # Get the fact to check if it exists and is mutable
            result = self.facts_collection.get(ids=[fact_id])
            if not result['ids']:
                logger.warning(f"[μ] Fact {fact_id} not found")
                return False, "Fact not found"
            fact_metadata = result['metadatas'][0]
            # Check if fact is mutable
            if not fact_metadata.get('mutable', True):
                logger.warning(f"[μ] Fact {fact_id} is not mutable")
                return False, "Fact is not mutable"
            # Validate identity ownership if identity_id provided
            if identity_id:
                fact_identities = fact_metadata.get('identities', [])
                if isinstance(fact_identities, str):
                    import json
                    try:
                        fact_identities = json.loads(fact_identities)
                    except:
                        fact_identities = [fact_identities]
                if identity_id not in fact_identities:
                    logger.warning(f"[μ] Identity {identity_id} does not own fact {fact_id}")
                    return False, f"Fact does not belong to identity {identity_id}"
            # Update metadata
            updated_metadata = dict(fact_metadata)
            updated_metadata['updated_at'] = datetime.utcnow().isoformat()
            if metadata:
                updated_metadata.update(metadata)
            # Update in ChromaDB
            self.facts_collection.update(
                ids=[fact_id],
                documents=[new_content],
                metadatas=[updated_metadata]
            )
            logger.info(f"[μ] Updated fact {fact_id}")
            return True, ""
        except Exception as e:
            logger.error(f"[μ] Failed to update fact {fact_id}: {e}")
            return False, str(e)
    # Note: Old store_memory() and recall_memories() methods removed
    # They referenced the archived 'memory' table schema
    # New three-layer system uses:
    #   - short_term_memory table (SQLite)
    #   - long_term_memories collection (ChromaDB)
    #   - facts collection (ChromaDB)
    async def handle_memory_store(self, msg):
        """Handle lyra.memory.store requests - routes to short-term memory"""
        try:
            # Parse request payload
            payload = json.loads(msg.data.decode())
            # Extract required fields
            content = payload.get('content')
            if not content:
                logger.warning("[μ] Memory store request missing content")
                error_response = {
                    "status": "error",
                    "error": "Missing required field: content"
                }
                await msg.respond(json.dumps(error_response).encode())
                return
            # Extract optional fields
            identities = payload.get('identities', [])
            interaction_id = payload.get('interaction_id')
            modality = payload.get('modality', 'dialogue')
            metadata = payload.get('metadata', {})
            # Store in simplified short-term memory table
            memory_id = str(uuid4())
            timestamp = datetime.utcnow().isoformat()
            cursor = self.sqlite_conn.cursor()
            cursor.execute("""
            INSERT INTO short_term_memory (id, timestamp, content, identities, interaction_id, modality, metadata)
            VALUES (?, ?, ?, ?, ?, ?, ?)
            """, (
                memory_id,
                timestamp,
                content,
                json.dumps(identities) if identities else None,
                interaction_id,
                modality,
                json.dumps(metadata) if metadata else None
            ))
            self.sqlite_conn.commit()
            logger.info(f"[μ] Stored short-term memory: '{content[:60]}...' identities={identities}")
            # Send response using NATS request-reply
            response = {
                "memory_id": memory_id,
                "status": "stored"
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to store memory: {e}")
            error_response = {
                "status": "error",
                "error": str(e)
            }
            await msg.respond(json.dumps(error_response).encode())
    async def handle_memory_search(self, msg):
        """Handle lyra.memory.search requests - backward compatibility, redirects to short_memory"""
        try:
            # Parse request payload
            payload = json.loads(msg.data.decode())
            logger.debug("[μ] Legacy search request - redirecting to short_memory")
            # Extract search parameters and map to new system
            limit = payload.get('limit', 10)
            identity_id = None
            if payload.get('identities'):
                identity_id = payload['identities'][0]  # Take first identity
            interaction_id = payload.get('interaction_id')
            # Query short-term memory (most recent literal memories)
            results = self._query_short_term(
                limit=limit,
                offset=0,
                identity_id=identity_id,
                interaction_id=interaction_id
            )
            # Send response using NATS request-reply
            response = {
                "results": results,
                "count": len(results),
                "source": "short_term",
                "note": "Legacy search API redirected to short-term memory. Use short_memory(), long_memory(), or facts() for specific queries."
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to search memories: {e}")
            error_response = {
                "results": [],
                "count": 0,
                "error": str(e)
            }
            await msg.respond(json.dumps(error_response).encode())
    async def handle_memory_reset(self, msg):
        """Handle lyra.memory.debug.reset requests - clears all three-layer memory"""
        try:
            # Parse request payload (though this endpoint typically doesn't need payload data)
            payload = json.loads(msg.data.decode()) if msg.data else {}
            logger.warning("[μ] Memory reset requested - clearing all three-layer memory contents")
            cursor = self.sqlite_conn.cursor()
            # Clear short-term memory
            cursor.execute("DELETE FROM short_term_memory")
            deleted_short_term = cursor.rowcount
            # Clear all identities
            cursor.execute("DELETE FROM identities")
            deleted_identities = cursor.rowcount
            # Reset any auto-increment sequences
            cursor.execute("DELETE FROM sqlite_sequence WHERE name IN ('short_term_memory', 'identities')")
            self.sqlite_conn.commit()
            # Clear ChromaDB collections
            deleted_long_term = 0
            deleted_facts = 0
            if self.long_term_collection:
                deleted_long_term = self.long_term_collection.count()
                # Delete all documents in long-term collection
                all_ids = self.long_term_collection.get()['ids']
                if all_ids:
                    self.long_term_collection.delete(ids=all_ids)
            if self.facts_collection:
                deleted_facts = self.facts_collection.count()
                # Delete all documents in facts collection
                all_ids = self.facts_collection.get()['ids']
                if all_ids:
                    self.facts_collection.delete(ids=all_ids)
            logger.warning(
                f"[μ] Memory reset completed: {deleted_short_term} short-term, "
                f"{deleted_long_term} long-term, {deleted_facts} facts, "
                f"{deleted_identities} identities cleared"
            )
            # Send response using NATS request-reply
            response = {
                "status": "success",
                "deleted_short_term": deleted_short_term,
                "deleted_long_term": deleted_long_term,
                "deleted_facts": deleted_facts,
                "deleted_identities": deleted_identities,
                "message": (
                    f"Cleared {deleted_short_term} short-term memories, "
                    f"{deleted_long_term} long-term summaries, "
                    f"{deleted_facts} facts, and {deleted_identities} identities"
                )
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to reset memory: {e}")
            error_response = {
                "status": "error",
                "error": str(e)
            }
            await msg.respond(json.dumps(error_response).encode())
    async def handle_short_memory(self, msg):
        """Handle short_memory requests - get recent literal memories"""
        try:
            payload = json.loads(msg.data.decode()) if msg.data else {}
            limit = payload.get('limit', 10)
            offset = payload.get('offset', 0)
            identity_id = payload.get('identity_id')
            interaction_id = payload.get('interaction_id')
            logger.debug(f"[μ] Short memory request: limit={limit}, offset={offset}")
            # Query short-term memory
            memories = self._query_short_term(
                limit=limit,
                offset=offset,
                identity_id=identity_id,
                interaction_id=interaction_id
            )
            response = {
                "status": "success",
                "memories": memories,
                "count": len(memories)
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to retrieve short-term memories: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
    async def handle_long_memory(self, msg):
        """Handle long_memory requests - semantic search in long-term summaries"""
        try:
            payload = json.loads(msg.data.decode()) if msg.data else {}
            query = payload.get('query')  # None = random sample
            limit = payload.get('limit', 5)
            identity_id = payload.get('identity_id')
            min_summary_level = payload.get('min_summary_level')
            max_summary_level = payload.get('max_summary_level')
            logger.debug(f"[μ] Long memory request: query='{query}', limit={limit}")
            # Query long-term memory from ChromaDB
            memories = self._query_long_term(
                query=query,
                limit=limit,
                identity_id=identity_id,
                min_summary_level=min_summary_level,
                max_summary_level=max_summary_level
            )
            response = {
                "status": "success",
                "memories": memories,
                "count": len(memories)
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to retrieve long-term memories: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
    async def handle_facts(self, msg):
        """Handle facts requests - search factual memory"""
        try:
            payload = json.loads(msg.data.decode()) if msg.data else {}
            query = payload.get('query', '')
            limit = payload.get('limit', 5)
            category = payload.get('category')
            identity_id = payload.get('identity_id')
            logger.debug(f"[μ] Facts request: query='{query}', category={category}, limit={limit}")
            # Query facts from ChromaDB
            facts = self._query_facts(
                query=query,
                limit=limit,
                category=category,
                identity_id=identity_id
            )
            response = {
                "status": "success",
                "facts": facts,
                "count": len(facts)
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to retrieve facts: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
    async def handle_save_fact(self, msg):
        """Handle save_fact requests - store new fact"""
        try:
            payload = json.loads(msg.data.decode())
            content = payload.get('content')
            if not content:
                raise ValueError("content is required")
            category = payload.get('category', 'general')
            identities = payload.get('identities', [])
            mutable = payload.get('mutable', True)
            metadata = payload.get('metadata', {})
            # Extract step execution ID from metadata if present
            step_exec_id = metadata.get('step_exec_id', 'unknown')
            logger.info(f"[μ] [{step_exec_id}] Saving fact: category={category}, content='{content[:50]}...'")
            # Create fact in ChromaDB
            fact_id = self._create_fact(
                content=content,
                category=category,
                identities=identities,
                mutable=mutable,
                metadata=metadata
            )
            logger.info(f"[μ] [{step_exec_id}] ✅ Created fact {fact_id[:8]}...: category={category}, content='{content[:50]}...'")
            response = {
                "status": "success",
                "fact_id": fact_id,
                "message": "Fact saved successfully"
            }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to save fact: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
    async def handle_update_fact(self, msg):
        """Handle update_fact requests - modify existing fact"""
        try:
            payload = json.loads(msg.data.decode())
            fact_id = payload.get('fact_id')
            new_content = payload.get('new_content')
            identity_id = payload.get('identity_id')  # Optional: validate ownership
            if not fact_id or not new_content:
                raise ValueError("fact_id and new_content are required")
            metadata = payload.get('metadata', {})
            logger.info(f"[μ] Updating fact: {fact_id} (identity: {identity_id})")
            # Update fact in ChromaDB with identity validation
            success, error_msg = self._update_fact(
                fact_id=fact_id,
                new_content=new_content,
                identity_id=identity_id,
                metadata=metadata
            )
            if success:
                response = {
                    "status": "success",
                    "fact_id": fact_id,
                    "message": "Fact updated successfully"
                }
            else:
                response = {
                    "status": "error",
                    "error": error_msg or "Fact not found or not mutable"
                }
            await msg.respond(json.dumps(response).encode())
        except Exception as e:
            logger.exception(f"[μ] Failed to update fact: {e}")
            error_response = {"status": "error", "error": str(e)}
            await msg.respond(json.dumps(error_response).encode())
    # Note: start() and stop() methods are now handled by BaseService
    # Custom initialization/cleanup is done in initialize_service() and cleanup_service()
    def _handle_event_wrapper(self, handler):
        """Wrapper to handle JSON parsing of event data"""
        async def wrapper(data):
            try:
                if isinstance(data, str):
                    payload = json.loads(data)
                else:
                    payload = data
                await handler(payload)
            except Exception as e:
                logger.error(f"[μ] Event handler error: {e}")
        return wrapper
 async def main():
    """Main entry point for memory service"""
    memory_service = MemoryService()
    try:
        await event_bus.connect()
        await memory_service.start(event_bus)
        logger.info("[μ] Memory service running. Press Ctrl+C to stop.")
        # Keep running
        while True:
            await asyncio.sleep(1)
    except KeyboardInterrupt:
        logger.info("[μ] Shutdown requested")
    except Exception as e:
        logger.exception(f"[μ] Unexpected error: {e}")
    finally:
        await memory_service.stop()
        await event_bus.close()
 if __name__ == "__main__":
    asyncio.run(main())
--- a/services/memory/operations/init.py
+++ b/services/memory/operations/init.py
@@ -0,0 +1 @@
 # Memory operations package
--- a/services/memory/operations/facts_ops.py
+++ b/services/memory/operations/facts_ops.py
@@ -0,0 +1,226 @@
 """
 Facts memory operations.
 Provides query and CRUD operations for factual memory (ChromaDB).
 """
 import json
 from uuid import uuid4
 from datetime import datetime
 from typing import List, Dict, Any, Optional, Tuple
 from core.logger import setup_logger
 logger = setup_logger('facts_ops', service_name='memory_service')
 class FactsOperations:
    """Handles facts queries and CRUD operations"""
    def __init__(self, chroma_store):
        """
        Initialize facts operations.
        Args:
            chroma_store: ChromaStore instance
        """
        self.chroma_store = chroma_store
    def query(
        self,
        query: str = '',
        limit: int = 5,
        category: Optional[str] = None,
        identity_id: Optional[str] = None
    ) -> List[Dict[str, Any]]:
        """
        Query facts from ChromaDB with optional category filtering.
        Args:
            query: Semantic search query (empty = get all matching filters)
            limit: Maximum number of facts to return
            category: Filter by fact category
            identity_id: Filter by identity ID
        Returns:
            List of fact dictionaries with metadata
        """
        try:
            collection = self.chroma_store.get_facts_collection()
            # Build metadata filters
            where_filters = {}
            if category:
                where_filters["category"] = category
            if identity_id:
                where_filters["identity_id"] = identity_id
            # Query ChromaDB
            if query:
                # Semantic search with query text
                results = collection.query(
                    query_texts=[query],
                    n_results=limit,
                    where=where_filters if where_filters else None
                )
            else:
                # Get all facts matching filters
                results = collection.get(
                    limit=limit,
                    where=where_filters if where_filters else None
                )
            # Format results
            facts = []
            if query and results['ids']:
                # Query results
                for i, doc_id in enumerate(results['ids'][0]):
                    metadata = results['metadatas'][0][i] if results['metadatas'] else {}
                    # Parse identities from JSON string
                    identities_str = metadata.get('identities', '[]')
                    identities = json.loads(identities_str) if isinstance(identities_str, str) else identities_str
                    facts.append({
                        "id": doc_id,
                        "content": results['documents'][0][i],
                        "category": metadata.get('category', 'general'),
                        "mutable": metadata.get('mutable', True),
                        "identities": identities,
                        "metadata": metadata,
                        "distance": results['distances'][0][i] if results['distances'] else None,
                        "source": "facts"
                    })
            elif not query and results['ids']:
                # Get results (no query)
                for i, doc_id in enumerate(results['ids']):
                    metadata = results['metadatas'][i] if results['metadatas'] else {}
                    # Parse identities from JSON string
                    identities_str = metadata.get('identities', '[]')
                    identities = json.loads(identities_str) if isinstance(identities_str, str) else identities_str
                    facts.append({
                        "id": doc_id,
                        "content": results['documents'][i],
                        "category": metadata.get('category', 'general'),
                        "mutable": metadata.get('mutable', True),
                        "identities": identities,
                        "metadata": metadata,
                        "source": "facts"
                    })
            logger.debug(f"[μ] Retrieved {len(facts)} facts (query='{query}', category={category}, limit={limit})")
            return facts
        except Exception as e:
            logger.error(f"[μ] Failed to query facts: {e}")
            return []
    def create(
        self,
        content: str,
        category: str = 'general',
        identities: List[str] = None,
        mutable: bool = True,
        metadata: Dict[str, Any] = None
    ) -> str:
        """
        Create a new fact in ChromaDB facts collection.
        Args:
            content: Fact content
            category: Fact category
            identities: List of identity IDs associated with this fact
            mutable: Whether the fact can be updated
            metadata: Additional metadata
        Returns:
            Created fact ID
        """
        fact_id = str(uuid4())
        identities = identities or []
        metadata = metadata or {}
        # Prepare metadata (ChromaDB only accepts scalar types, not lists)
        fact_metadata = {
            "category": category,
            "mutable": mutable,
            "identities": json.dumps(identities),  # Convert list to JSON string
            "created_at": datetime.utcnow().isoformat(),
            **metadata
        }
        # Add to ChromaDB (will automatically generate embedding)
        collection = self.chroma_store.get_facts_collection()
        collection.add(
            ids=[fact_id],
            documents=[content],
            metadatas=[fact_metadata]
        )
        logger.info(f"[μ] Created fact {fact_id}: category={category}, content='{content[:60]}...'")
        return fact_id
    def update(
        self,
        fact_id: str,
        new_content: str,
        identity_id: str = None,
        metadata: Dict[str, Any] = None
    ) -> Tuple[bool, str]:
        """
        Update an existing fact in ChromaDB if it's mutable and owned by identity.
        Args:
            fact_id: ID of fact to update
            new_content: New content for the fact
            identity_id: Identity ID for ownership validation (optional)
            metadata: Additional metadata to update
        Returns:
            (success, error_message) - error_message is empty string if successful
        """
        try:
            collection = self.chroma_store.get_facts_collection()
            # Get the fact to check if it exists and is mutable
            result = collection.get(ids=[fact_id])
            if not result['ids']:
                logger.warning(f"[μ] Fact {fact_id} not found")
                return False, "Fact not found"
            fact_metadata = result['metadatas'][0]
            # Check if fact is mutable
            if not fact_metadata.get('mutable', True):
                logger.warning(f"[μ] Fact {fact_id} is not mutable")
                return False, "Fact is not mutable"
            # Validate identity ownership if identity_id provided
            if identity_id:
                fact_identities = fact_metadata.get('identities', [])
                if isinstance(fact_identities, str):
                    try:
                        fact_identities = json.loads(fact_identities)
                    except:
                        fact_identities = [fact_identities]
                if identity_id not in fact_identities:
                    logger.warning(f"[μ] Identity {identity_id} does not own fact {fact_id}")
                    return False, f"Fact does not belong to identity {identity_id}"
            # Update metadata
            updated_metadata = dict(fact_metadata)
            updated_metadata['updated_at'] = datetime.utcnow().isoformat()
            if metadata:
                updated_metadata.update(metadata)
            # Update in ChromaDB
            collection.update(
                ids=[fact_id],
                documents=[new_content],
                metadatas=[updated_metadata]
            )
            logger.info(f"[μ] Updated fact {fact_id}")
            return True, ""
        except Exception as e:
            logger.error(f"[μ] Failed to update fact {fact_id}: {e}")
            return False, str(e)
--- a/services/memory/operations/long_term_ops.py
+++ b/services/memory/operations/long_term_ops.py
@@ -0,0 +1,102 @@
 """
 Long-term memory operations.
 Provides query operations for long-term summarized memories (ChromaDB).
 """
 from typing import List, Dict, Any, Optional
 from core.logger import setup_logger
 logger = setup_logger('long_term_ops', service_name='memory_service')
 class LongTermOperations:
    """Handles long-term memory queries and operations"""
    def __init__(self, chroma_store):
        """
        Initialize long-term operations.
        Args:
            chroma_store: ChromaStore instance
        """
        self.chroma_store = chroma_store
    def query(
        self,
        query: Optional[str] = None,
        limit: int = 5,
        identity_id: Optional[str] = None,
        min_summary_level: Optional[int] = None,
        max_summary_level: Optional[int] = None
    ) -> List[Dict[str, Any]]:
        """
        Query long-term memory from ChromaDB (summarized memories).
        Args:
            query: Optional semantic search query (None = random sample)
            limit: Maximum number of memories to return
            identity_id: Filter by identity ID
            min_summary_level: Minimum summary level filter
            max_summary_level: Maximum summary level filter
        Returns:
            List of memory dictionaries with semantic search scores
        """
        try:
            collection = self.chroma_store.get_long_term_collection()
            # Build metadata filters
            where_filters = {}
            if identity_id:
                where_filters["identity_id"] = identity_id
            if min_summary_level is not None:
                where_filters["summary_level"] = {"$gte": min_summary_level}
            if max_summary_level is not None:
                if "summary_level" in where_filters:
                    where_filters["summary_level"]["$lte"] = max_summary_level
                else:
                    where_filters["summary_level"] = {"$lte": max_summary_level}
            # Query ChromaDB
            if query:
                # Semantic search with query text
                results = collection.query(
                    query_texts=[query],
                    n_results=limit,
                    where=where_filters if where_filters else None
                )
            else:
                # Random sample - get all and sample
                results = collection.get(
                    limit=limit,
                    where=where_filters if where_filters else None
                )
            # Format results
            memories = []
            if query and results['ids']:
                # Query results
                for i, doc_id in enumerate(results['ids'][0]):
                    memories.append({
                        "id": doc_id,
                        "content": results['documents'][0][i],
                        "metadata": results['metadatas'][0][i] if results['metadatas'] else {},
                        "distance": results['distances'][0][i] if results['distances'] else None,
                        "source": "long_term"
                    })
            elif not query and results['ids']:
                # Get results (no query)
                for i, doc_id in enumerate(results['ids']):
                    memories.append({
                        "id": doc_id,
                        "content": results['documents'][i],
                        "metadata": results['metadatas'][i] if results['metadatas'] else {},
                        "source": "long_term"
                    })
            logger.debug(f"[μ] Retrieved {len(memories)} long-term memories (query='{query}', limit={limit})")
            return memories
        except Exception as e:
            logger.error(f"[μ] Failed to query long-term memory: {e}")
            return []
--- a/services/memory/operations/short_term_ops.py
+++ b/services/memory/operations/short_term_ops.py
@@ -0,0 +1,87 @@
 """
 Short-term memory operations.
 Provides query operations for short-term literal memory (SQLite).
 """
 import json
 from typing import List, Dict, Any, Optional
 from core.logger import setup_logger
 logger = setup_logger('short_term_ops', service_name='memory_service')
 class ShortTermOperations:
    """Handles short-term memory queries and operations"""
    def __init__(self, sqlite_store):
        """
        Initialize short-term operations.
        Args:
            sqlite_store: SQLiteStore instance
        """
        self.sqlite_store = sqlite_store
    def query(
        self,
        limit: int = 10,
        offset: int = 0,
        identity_id: Optional[str] = None,
        interaction_id: Optional[str] = None
    ) -> List[Dict[str, Any]]:
        """
        Query short-term memory from SQLite with chronological ordering.
        Args:
            limit: Maximum number of memories to return
            offset: Number of memories to skip
            identity_id: Filter by identity ID
            interaction_id: Filter by interaction ID
        Returns:
            List of memory dictionaries with metadata
        """
        conn = self.sqlite_store.get_connection()
        cursor = conn.cursor()
        conditions = []
        params = []
        if identity_id:
            conditions.append("identities LIKE ?")
            params.append(f"%{identity_id}%")
        if interaction_id:
            conditions.append("interaction_id = ?")
            params.append(interaction_id)
        where_clause = f"WHERE {' AND '.join(conditions)}" if conditions else ""
        query = f"""
        SELECT id, timestamp, content, identities, interaction_id, modality, metadata
        FROM short_term_memory
        {where_clause}
        ORDER BY timestamp DESC
        LIMIT ? OFFSET ?
        """
        params.extend([limit, offset])
        cursor.execute(query, params)
        memories = []
        for row in cursor.fetchall():
            mem_id, timestamp, content, identities_str, ixn_id, modality, metadata_str = row
            memories.append({
                "id": mem_id,
                "timestamp": timestamp,
                "content": content,
                "identities": json.loads(identities_str) if identities_str else [],
                "interaction_id": ixn_id,
                "modality": modality,
                "metadata": json.loads(metadata_str) if metadata_str else {},
                "source": "short_term"
            })
        logger.debug(f"[μ] Retrieved {len(memories)} short-term memories (limit={limit}, offset={offset})")
        return memories
--- a/services/memory/requirements.txt
+++ b/services/memory/requirements.txt
@@ -0,0 +1,3 @@
 sentence-transformers>=2.2.0
 numpy>=1.21.0
 chromadb>=0.4.0
--- a/services/memory/storage/init.py
+++ b/services/memory/storage/init.py
@@ -0,0 +1 @@
 # Memory storage package
--- a/services/memory/storage/chroma_store.py
+++ b/services/memory/storage/chroma_store.py
@@ -0,0 +1,93 @@
 """
 ChromaDB storage backend for long-term memory and facts.
 Provides initialization and collection management for ChromaDB.
 """
 from pathlib import Path
 import chromadb
 from chromadb.config import Settings
 from core.config import SHORT_TERM_DB
 from core.logger import setup_logger
 logger = setup_logger('chroma_store', service_name='memory_service')
 class ChromaStore:
    """ChromaDB storage backend for long-term memories and facts"""
    def __init__(self, chroma_path: str = None):
        """
        Initialize ChromaDB store.
        Args:
            chroma_path: Path to ChromaDB persistent storage (defaults to chroma_db next to SHORT_TERM_DB)
        """
        if chroma_path is None:
            default_path = Path(SHORT_TERM_DB).parent / "chroma_db"
            self.chroma_path = str(default_path)
        else:
            self.chroma_path = chroma_path
        self.client = None
        self.long_term_collection = None
        self.facts_collection = None
    def connect(self):
        """Initialize persistent ChromaDB client and collections"""
        try:
            # Create chroma directory if it doesn't exist
            Path(self.chroma_path).mkdir(parents=True, exist_ok=True)
            # Initialize persistent ChromaDB client
            self.client = chromadb.PersistentClient(
                path=self.chroma_path,
                settings=Settings(anonymized_telemetry=False)
            )
            # Create or get long-term memories collection
            self.long_term_collection = self.client.get_or_create_collection(
                name="long_term_memories",
                metadata={"description": "Summarized conversation histories"}
            )
            # Create or get facts collection
            self.facts_collection = self.client.get_or_create_collection(
                name="facts",
                metadata={"description": "Exact factual knowledge"}
            )
            logger.info(f"[μ] ChromaDB initialized at {self.chroma_path}")
            logger.info(f"[μ] Long-term collection: {self.long_term_collection.count()} entries")
            logger.info(f"[μ] Facts collection: {self.facts_collection.count()} entries")
        except Exception as e:
            logger.error(f"[μ] Failed to initialize ChromaDB: {e}")
            raise
    def get_long_term_collection(self):
        """
        Get the long-term memories collection.
        Returns:
            ChromaDB collection for long-term memories
        Raises:
            RuntimeError: If collections have not been initialized
        """
        if self.long_term_collection is None:
            raise RuntimeError("ChromaDB not connected. Call connect() first.")
        return self.long_term_collection
    def get_facts_collection(self):
        """
        Get the facts collection.
        Returns:
            ChromaDB collection for facts
        Raises:
            RuntimeError: If collections have not been initialized
        """
        if self.facts_collection is None:
            raise RuntimeError("ChromaDB not connected. Call connect() first.")
        return self.facts_collection
--- a/services/memory/storage/migrations.py
+++ b/services/memory/storage/migrations.py
@@ -0,0 +1,47 @@
 """
 Database migration utilities for memory service.
 Handles archiving old database schemas during upgrades.
 """
 import sqlite3
 import shutil
 from datetime import datetime
 from pathlib import Path
 from core.logger import setup_logger
 logger = setup_logger('migrations', service_name='memory_service')
 def archive_old_database(db_path: Path) -> None:
    """
    Archive old database if it exists (one-time migration).
    Checks if the database uses the old 'memory' table schema and archives it
    if found, allowing the service to start with a fresh schema.
    Args:
        db_path: Path to the database file
    """
    if not db_path.exists():
        logger.debug(f"[μ] No existing database found at {db_path}")
        return
    try:
        # Check if it's the old schema by trying to connect and inspect
        conn = sqlite3.connect(str(db_path))
        cursor = conn.cursor()
        cursor.execute("SELECT name FROM sqlite_master WHERE type='table' AND name='memory'")
        result = cursor.fetchone()
        conn.close()
        if result:
            # Old database exists, archive it
            timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
            archive_path = db_path.parent / f"{db_path.stem}_archive_{timestamp}{db_path.suffix}"
            shutil.move(str(db_path), str(archive_path))
            logger.info(f"[μ] Archived old database to {archive_path}")
        else:
            logger.debug(f"[μ] Database already uses new schema, no archive needed")
    except Exception as e:
        logger.warning(f"[μ] Could not check/archive old database: {e}")
--- a/services/memory/storage/sqlite_store.py
+++ b/services/memory/storage/sqlite_store.py
@@ -0,0 +1,97 @@
 """
 SQLite storage backend for short-term memory.
 Provides initialization and connection management for SQLite database.
 """
 import sqlite3
 from pathlib import Path
 from core.config import SHORT_TERM_DB
 from core.logger import setup_logger
 logger = setup_logger('sqlite_store', service_name='memory_service')
 class SQLiteStore:
    """SQLite storage backend for short-term memory"""
    def __init__(self, db_path: str = None):
        """
        Initialize SQLite store.
        Args:
            db_path: Path to SQLite database file (defaults to SHORT_TERM_DB config)
        """
        self.db_path = db_path or str(SHORT_TERM_DB)
        self.conn = None
    def connect(self) -> sqlite3.Connection:
        """
        Connect to SQLite database and initialize schema.
        Returns:
            SQLite connection object
        """
        self.conn = sqlite3.connect(self.db_path)
        self._init_schema()
        logger.info(f"[μ] SQLite connected: {self.db_path}")
        return self.conn
    def _init_schema(self):
        """Initialize simplified short-term SQLite database schema"""
        cursor = self.conn.cursor()
        # Simplified short-term memory table (no embeddings, fast queries)
        cursor.execute("""
        CREATE TABLE IF NOT EXISTS short_term_memory (
            id TEXT PRIMARY KEY,
            timestamp DATETIME DEFAULT CURRENT_TIMESTAMP,
            content TEXT NOT NULL,
            identities TEXT,
            interaction_id TEXT,
            modality TEXT DEFAULT 'dialogue',
            metadata TEXT
        )
        """)
        # Index for fast chronological queries
        cursor.execute("""
        CREATE INDEX IF NOT EXISTS idx_timestamp
        ON short_term_memory(timestamp DESC)
        """)
        # Identities table (still useful for all layers)
        cursor.execute("""
        CREATE TABLE IF NOT EXISTS identities (
            id TEXT PRIMARY KEY,
            display_name TEXT,
            role TEXT,
            intimacy REAL DEFAULT 0.0,
            last_seen DATETIME,
            last_spoken DATETIME,
            metadata TEXT
        )
        """)
        self.conn.commit()
        logger.info("[μ] SQLite schema initialized")
    def get_connection(self) -> sqlite3.Connection:
        """
        Get the active database connection.
        Returns:
            SQLite connection object
        Raises:
            RuntimeError: If connection has not been established
        """
        if self.conn is None:
            raise RuntimeError("SQLite connection not established. Call connect() first.")
        return self.conn
    def close(self):
        """Close the database connection"""
        if self.conn:
            self.conn.close()
            self.conn = None
            logger.info("[μ] SQLite connection closed")
--- a/services/memory/utils/init.py
+++ b/services/memory/utils/init.py
@@ -0,0 +1 @@
 # Memory utilities package
--- a/services/memory/utils/embeddings.py
+++ b/services/memory/utils/embeddings.py
@@ -0,0 +1,53 @@
 """
 Embedding utilities for memory service.
 Provides text-to-vector embedding generation and similarity calculations.
 """
 import numpy as np
 from sentence_transformers import SentenceTransformer
 from core.logger import setup_logger
 logger = setup_logger('embeddings', service_name='memory_service')
 # Initialize sentence transformer model (loaded once at module import)
 _model = None
 def get_model() -> SentenceTransformer:
    """Get or initialize the sentence transformer model"""
    global _model
    if _model is None:
        logger.info("[μ] Loading sentence transformer model: all-MiniLM-L6-v2")
        _model = SentenceTransformer('all-MiniLM-L6-v2')
        logger.info("[μ] Sentence transformer model loaded successfully")
    return _model
 def generate_embedding(text: str) -> np.ndarray:
    """
    Generate semantic embedding for text.
    Args:
        text: Input text to embed
    Returns:
        Normalized embedding vector as numpy array
    """
    model = get_model()
    return np.array(model.encode(text, normalize_embeddings=True))
 def cosine_similarity(a: np.ndarray, b: np.ndarray) -> float:
    """
    Calculate cosine similarity between two vectors.
    Args:
        a: First embedding vector
        b: Second embedding vector
    Returns:
        Similarity score between 0.0 and 1.0
    """
    if np.linalg.norm(a) == 0 or np.linalg.norm(b) == 0:
        return 0.0
    return float(np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b)))
--- a/services/memory/utils/serialization.py
+++ b/services/memory/utils/serialization.py
@@ -0,0 +1,32 @@
 """
 Serialization utilities for memory service.
 Provides functions to convert numpy arrays to/from bytes for database storage.
 """
 import numpy as np
 def serialize_embedding(vector: np.ndarray) -> bytes:
    """
    Convert numpy array to bytes for database storage.
    Args:
        vector: Numpy array embedding vector
    Returns:
        Serialized bytes representation
    """
    return vector.astype(np.float32).tobytes()
 def deserialize_embedding(blob: bytes) -> np.ndarray:
    """
    Convert bytes back to numpy array.
    Args:
        blob: Serialized embedding bytes
    Returns:
        Deserialized numpy array
    """
    return np.frombuffer(blob, dtype=np.float32)