Spaces:

milton124
/

IA_App

Build error

App Files Files Community

milton124 commited on about 1 month ago

Commit

64148ba

verified ·

1 Parent(s): 05ca4d9

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -58

app.py CHANGED Viewed

@@ -1,78 +1,60 @@
 from fastapi import FastAPI
-from fastapi.middleware.cors import CORSMiddleware
 from huggingface_hub import hf_hub_download
 from llama_cpp import Llama
-import json
 app = FastAPI()
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],
-    allow_methods=["*"],
-    allow_headers=["*"],
-)
-# --------- Cargar modelo GGUF en RAM ---------
-print("Descargando modelo a RAM...")
-model_path = hf_hub_download(
-    repo_id="second-state/Gemma-2B-Instruct-GGUF",
-    filename="Gemma-2B-Instruct-Q4_K_M.gguf"
-)
-print("Cargando modelo...")
-llm = Llama(
-    model_path=model_path,
-    n_ctx=2000,
-    n_threads=4,
-    use_mlock=True
-)
-# --------- Cargar himnos.jsonl ---------
-print("Cargando himnos.jsonl...")
-HIMNOS = []
 with open("himnos.jsonl", "r", encoding="utf-8") as f:
     for line in f:
-        HIMNOS.append(json.loads(line))
-# ============ ENDPOINT PRINCIPAL =============
-@app.post("/predict")
-def generar_respuesta(request: dict):
-    prompt_usuario = request.get("prompt", "")
-    # Pasar al modelo
-    output = llm(
-        f"Responde de forma breve y clara al usuario: {prompt_usuario}",
-        max_tokens=200
-    )
-    texto = output["choices"][0]["text"]
-    # Calcular relevancia simple (sin embeddings)
-    resultados = []
-    for h in HIMNOS:
-        titulo = h["titulo"].lower()
-        texto_prompt = prompt_usuario.lower()
-        # coincidencia básica
-        puntos = 0
-        for palabra in texto_prompt.split():
-            if palabra in titulo:
-                puntos += 1
-        resultados.append({
-            "id": h["id"],
-            "titulo": h["titulo"],
-            "relacion": puntos
-        })
-    # ordenar por relación
-    resultados = sorted(resultados, key=lambda x: -x["relacion"])[:7]
     return {
-        "respuesta": texto,
-        "recomendados": resultados
     }

+import os, json
 from fastapi import FastAPI
+from pydantic import BaseModel
 from huggingface_hub import hf_hub_download
 from llama_cpp import Llama
 app = FastAPI()
+# --- CONFIGURA ESTO ---
+MODEL_REPO = "TheBloke/TinyLlama-1.1B-Chat-v0.3-GGUF"   # ejemplo
+MODEL_FILE = "tinyllama-1.1b-chat-v0.3.Q4_K_M.gguf"      # ejemplo exacto del repo
+# -----------------------
+MODEL_PATH = f"/dev/shm/{MODEL_FILE}"
+# Descargar a RAM si no existe
+if not os.path.exists(MODEL_PATH):
+    print("Descargando modelo a /dev/shm (RAM)...")
+    # Si necesita token: use_auth_token=os.getenv("HF_TOKEN")
+    hf_hub_download(repo_id=MODEL_REPO, filename=MODEL_FILE, local_dir="/dev/shm")
+print("Cargando modelo en RAM (llama_cpp)...")
+llm = Llama(model_path=MODEL_PATH, n_ctx=2048, n_threads=4)
+# Cargar himnos.jsonl en RAM
+HIMNOS = {}
 with open("himnos.jsonl", "r", encoding="utf-8") as f:
     for line in f:
+        item = json.loads(line)
+        HIMNOS[int(item["id"])] = item
+class ExplainRequest(BaseModel):
+    id: int
+@app.post("/explicar")
+def explicar(req: ExplainRequest):
+    himno = HIMNOS.get(req.id)
+    if not himno:
+        return {"error": "Himno no encontrado", "id": req.id}
+    prompt = f"""Eres un asistente cristiano que explica himnos de forma breve y devocional.
+Himno #{himno['id']}
+Título: {himno['titulo']}
+Letra:
+{himno['letra']}
+Explica brevemente:
+- Mensaje principal
+- Aplicación práctica (1–2 frases)
+- Versículos relacionados (si procede)
+"""
+    out = llm(prompt, max_tokens=300, temperature=0.7)
+    texto = out["choices"][0]["text"].strip()
     return {
+        "id": himno["id"],
+        "titulo": himno["titulo"],
+        "explicacion": texto
     }