Aprendizaje — Monitor Series

🧠 Auto-aprendizaje

Claude analiza los últimos 30 lotes de clasificación y el feedback del editor para proponer mejoras al prompt.

💡 Consejos del último análisis

ClasificaciónLee siempre el contenido completo de notas de prensa de plataformas (Netflix, Atresplayer, Prime Video, Disney+, HBO Max, etc.), aunque tengan formato en mayúsculas o estructura 'PLATAFORMA | contenido'. No las descartes automáticamente como genéricas.ClasificaciónClasifica como relevante cualquier noticia que mencione tráilers, fechas de estreno, nuevos fichajes o estrenos de series españolas, incluso si se emiten en plataformas internacionales.ClasificaciónAcepta series turcas, latinoamericanas u otras producciones extranjeras que se emitan regularmente en canales españoles (Antena 3, Telecinco, Nova, etc.) como contenido relevante sobre televisión española.ClasificaciónIdentifica y clasifica correctamente series españolas mencionadas por nombre, incluso en titulares indirectos o entre otros contenidos. No descartes noticias que citen producciones españolas como 'La Promesa', 'Sueños de libertad' o 'La que se avecina'.ClasificaciónDefine el campo 'espana' de forma consistente: marca true si la serie se produce, emite regularmente o tiene relevancia para la televisión española, independientemente de su país de origen.ClasificaciónEvita usar tipo_evento 'N/A' u 'otro' cuando la noticia contenga datos específicos (títulos de series, plataformas, fechas). Selecciona el tipo más preciso: nueva_serie, estreno, trailer, fichaje, etc.ClasificaciónAplica criterios uniformes para docuseries y documentales: acepta como relevantes si son producciones españolas, estrenos en plataformas españolas o tienen impacto cultural en España.RedacciónEstablece un límite de tokens para salida completa y verifica que cada artículo termine con una frase completa y coherente. No permitir frases cortadas.RedacciónUtiliza solo información verificable del prompt original. No inventes nombres de actores, personajes, tramas ni datos que no estén explícitamente mencionados en la fuente.RedacciónIncorpora todos los datos relevantes del prompt: reparto completo, nuevos fichajes, detalles de trama y contexto. No omitas información disponible en la fuente.RedacciónVaría la estructura de los artículos según el tipo de noticia: usa cierre reflexivo para análisis, preguntas para anticipación, datos para anuncios. Reduce clichés como 'lo que empieza como X deriva en Y'.RedacciónAjusta la extensión según la importancia y complejidad de la noticia, no de forma automática. Prioriza claridad y completitud sobre longitud uniforme.

Último análisis: 2026-06-24 12:01 8 lotes clasificación 20 artículos redacción 41 correcciones

1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Notas de prensa de plataformas españolas descartadas como "programación genérica"

Los ejemplos de artículos mal clasificados muestran un patrón claro: las notas de prensa de Atresplayer, Netflix, Prime Video, Disney+, HBO Max, etc., se descartan sistemáticamente como "programación general" o "industria" cuando en realidad contienen información valiosa sobre estrenos, tráilers o nuevas series.

Ejemplos concretos:

`ATRESPLAYER | Destacados de programación del domingo 24 de mayo` → descartado, pero contenía info relevante

`ATRESPLAYER | Destacados de programación del sábado 13 y domingo 14 de junio` → descartado

`ATRESPLAYER | Destacados de programación del sábado 20 y domingo 21 de junio` → descartado como irrelevante pero luego se redactó un artículo sobre '33 Días' (Artículo 9)

`NETFLIX DESVELA EL TRÁILER DE RAFA` → descartado

`NETFLIX DESVELA EL TRÁILER OFICIAL DE EL MAPA DE LOS ANHELOS` → descartado

`NETFLIX DESVELA EL TRÁILER OFICIAL DE LOS CREYENTES` → descartado

`OLIVIA | DISPONIBLES EL TRÁILER Y EL PÓSTER...ESTRENO EL 1 DE JULIO EN DISNEY+` → descartado

`OASIS LLEGA A NETFLIX EL PRÓXIMO 19 DE JUNIO` → descartado

El problema es doble: 1. Las notas de prensa con título en mayúsculas y formato "PLATAFORMA | contenido" se tratan como boletines genéricos sin leer el contenido. 2. Los tráilers y fechas de estreno de series españolas en plataformas internacionales se ignoran.

### 1.2. Series turcas emitidas en España clasificadas como no españolas

`Nova apuesta por una nueva novela turca con Su Burcu Yazgı Coşkun, protagonista de 'Hermanos'` → descartada, pero Nova es un canal español y la noticia trata sobre la programación española

`La serie turca de Sinem Ünsal con el actor de 'Ada Masali' Alp Navruz antes de 'En tierra lejana'` → descartada, pero menciona serie emitida en Antena 3

`'En tierra lejana': ¿cuántos capítulos tiene la serie turca de Antena 3?` → descartada pese a que literalmente dice "Antena 3"

### 1.3. Noticias con series españolas identificables descartadas

`'Barrio Esperanza': el colegio acoge una acampada inclusiva` → descartada (serie diaria de TVE)

`APARICIÓN ESPECIAL PRIMICIA | "La Promesa" ficha a Juan Fleta como Aníbal Esparza` → descartada DOS VECES

`Telecinco ya promociona su serie con Maxi Iglesias de cura` → descartada (era 'Ella, maldita alma')

`Telecinco estrena 'Romi'` → descartada

`Amazon lo confirma: habrá temporada 18 de 'La que se avecina'` → descartada

`'El Eternauta' arrasa en los Premios Platino, que dejan sin colofón a las series diarias 'La Promesa' y 'Sueños de libertad'` → descartada pese a mencionar dos series españolas

### 1.4. Películas y docuseries españolas descartadas incorrectamente

`TRÁILER Y CARTEL FINAL DE "EL SER QUERIDO" DE RODRIGO SOROGOYEN` → descartado (película española de Movistar Plus)

`HBO Max estrenará la docuserie española Los Topuria el 5 de junio` → descartada

`La sexta temporada de las Pombo llega a Prime Video muy pronto` → descartada

### 1.5. Inconsistencia en el campo `espana`

En el Ejemplo 2, la noticia sobre Cuatro se marca como `espana: false` pese a ser una cadena española. En el Ejemplo 7, "Abismo de pasión" se marca como `espana: true` cuando es una telenovela mexicana emitida en Nova. El criterio es inconsistente: a veces `espana` se refiere a si la serie es producción española, a veces a si se emite en España.

### 1.6. Uso excesivo del tipo_evento "otro" y "N/A"

En el Ejemplo 3, el artículo 6 sobre nuevas series para Atresplayer recibe `tipo_evento: "N/A"` con razón "Anuncio genérico de nuevas series sin detalles; podría ser nueva_serie pero título muy vago". Esto es un error: el título menciona explícitamente dos series ('Las vecinas' y 'Crimen en España') y la plataforma (Atresplayer).

### 1.7. Documentales y docuseries tratados de forma inconsistente

"La más grande" (docuserie Rocío Jurado, Movistar Plus+) → clasificada correctamente como `fecha_estreno` en Ejemplo 3

"NETFLIX DESVELA EL TRÁILER DE RAFA" (docuserie Netflix) → descartada

"HBO Max estrenará la docuserie española Los Topuria" → descartada

No hay criterio claro sobre cuándo una docuserie es relevante y cuándo no.

---

2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Artículos cortados a mitad de frase

Es el problema más grave y recurrente. De los 20 artículos, al menos 10 terminan con una frase incompleta:

Artículo 1: "Con estos hilos sueltos sobre" (cortado)

Artículo 3: "sobre los que «t" (cortado)

Artículo 4: "Los vecinos de Chipiona, que" (cortado)

Artículo 5: "cuya máscara irá cayendo poco a poco." (parece cortado, falta cierre del artículo)

Artículo 6: "Pero el h" (cortado)

Artículo 8: "recorrido pr" (cortado)

Artículo 9: "Nausica Bonnín y **" (cortado a mitad de nombre)

Artículo 10: "envi" (cortado)

Artículo 11: "Otras iniciativas anteriores" (cortado)

Artículo 13: "Alaia, interpr" (cortado)

Artículo 15: "Con 123 hec" (cortado)

Artículo 17: "Pokeepsi" (cortado)

Artículo 19: "al" (cortado)

Esto sugiere que el modelo alcanza el límite de tokens de salida antes de completar el artículo. La instrucción de longitud no es suficiente o no existe.

### 2.2. Invención de datos no presentes en el prompt

Este es un problema crítico de fiabilidad:

Artículo 2 (Cuando solo quedemos nosotros): Menciona a "Judith Fernández, Pau Simón y Samantha López S." como reparto. Estos nombres no aparecen en ninguna parte del prompt mostrado. Es muy probable que sean inventados.

Artículo 14 (Rocío Jurado/Bertín): "El dato lo ha adelantado Diego Reinares en 'Fiesta'" - ¿Está en el contenido original? No se puede verificar con el fragmento del prompt mostrado.

Artículo 16 (Oasis final): Inventa nombres de personajes y tramas del final (Sandra Ortega como inspectora, Luis como padre de Celia, Ginés como subinspector). Estos detalles parecen inventados o al menos no verificables desde el prompt.

Artículo 11 (Chiapella): "Natalia Puente, a quien conoció durante el rodaje de 'La que se avecina' cuando ella trabajaba como estilista" - ¿dato verificable?

### 2.3. Información del prompt no utilizada

Artículo 1 (Sira): El prompt contiene un reparto completo detallado (Jeremy Neumark Jones, Borja Luna, Orla O'Leary, Kathleen Gati, etc.) pero el artículo solo menciona algunos personajes de la primera temporada y no incluye los nuevos fichajes.

Artículo 9 (33 Días): El prompt parece ser una nota de programación de Atresplayer, pero el artículo desarrolla detalles de trama que podrían no estar en la fuente.

### 2.4. Estilo y tono

El estilo es generalmente bueno: directo, periodístico, con personalidad. Hay aciertos notables:

"No suena a frase de promo. Suena a deuda saldada" (Artículo 1 del prompt)

"Difícil pedir más tensión por metro cuadrado" (Artículo 2)

"A veces los giros más inesperados no están en el guion" (Artículo 7)

Sin embargo, hay expresiones que se repiten o caen en clichés:

"Lo que empieza como X deriva en Y" (patrón repetido)

"El problema es que..." (demasiado frecuente)

Uso de "deliciosamente" (Artículo 18: "deliciosamente retorcido")

### 2.5. Estructura repetitiva

Casi todos los artículos siguen el mismo patrón: 1. Titular con datos clave 2. Primer párrafo con el dato principal 3. Desarrollo con contexto/reparto 4. Cierre reflexivo o con pregunta abierta

Esto funciona bien, pero la estructura de cierre con pregunta retórica se repite demasiado.

### 2.6. Uso de negritas

Las negritas se usan correctamente para destacar nombres de actores, series y plataformas. Es consistente y facilita la lectura.

### 2.7. Longitud desigual

Algunos artículos son muy extensos (Artículo 10, 12, 19) mientras que otros son cortos (Artículo 7). No hay una guía clara de extensión según el tipo de noticia.

---

3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### 3.1. Notas de prensa de plataformas

Problema: Las notas de prensa con formato "PLATAFORMA | Destacados de programación" y "NETFLIX DESVELA EL TRÁILER DE..." se descartan como genéricas sin analizar su contenido.

Propuesta (texto exacto para añadir al prompt): ``` REGLA CRÍTICA sobre notas de prensa:

Los emails con formato "ATRESPLAYER | Destacados de programación del..." o "NETFLIX DESVELA..." o "DISNEY+ ESTRENA..." SIEMPRE contienen información sobre series concretas. NO los descartes como programación genérica.

Lee el RESUMEN completo para identificar series mencionadas.

Si el resumen contiene imágenes/enlaces sin texto útil, clasifica como espana=true y tipo_evento="programacion" SIN filtros, para que el editor pueda revisarlo.

Los tráilers de series (españolas o internacionales con estreno en España) son tipo_evento="trailer", no "otro".

```

Impacto esperado: Recuperación de ~10 noticias que actualmente se pierden por lote, incluyendo tráilers de Netflix, estrenos de Disney+ y novedades de Atresplayer.

### 3.2. Series turcas emitidas en España

Problema: Series turcas que se emiten en cadenas españolas (Antena 3, Nova, Divinity) se clasifican como `espana: false`.

Propuesta: ``` REGLA sobre series turcas/internacionales en España:

Si la noticia menciona emisión en Antena 3, Nova, Telecinco, Divinity, La 1 u otra cadena/plataforma española → espana=true.

Las series turcas emitidas en España (En tierra lejana, Hermanos, Una nueva vida, etc.) son RELEVANTES para el sitio.

Noticias sobre actores turcos de series emitidas en España también son espana=true.

Solo marca espana=false si la serie turca NO tiene emisión confirmada en ninguna cadena española.

```

Impacto esperado: Correcta clasificación de 3-5 noticias diarias de series turcas que actualmente se pierden.

### 3.3. Definición clara del campo `espana`

Problema: Inconsistencia en qué significa `espana`. A veces se refiere a producción española, a veces a emisión en España.

Propuesta: ``` DEFINICIÓN de espana:

espana=true significa que la noticia es RELEVANTE para la audiencia española. Esto incluye:

· Series producidas en España · Series internacionales emitidas/estrenadas en cadenas o plataformas españolas · Series turcas en Antena 3, Nova, etc. · Noticias de actores españoles aunque la serie sea internacional · Películas españolas de plataformas (Movistar Plus, etc.)

espana=false SOLO para series sin ninguna conexión con el mercado español.

```

Impacto esperado: Eliminación de la ambigüedad que causa la mayoría de falsos negativos.

### 3.4. Series diarias españolas conocidas

Problema: Series como 'Barrio Esperanza' (TVE) se descartan porque el modelo no las reconoce.

Propuesta: ``` SERIES DIARIAS ESPAÑOLAS ACTIVAS (siempre espana=true, siempre relevantes):

La Promesa (TVE/La 1)

Sueños de libertad (Antena 3)

Valle Salvaje (Antena 3)

Barrio Esperanza (TVE/La 1)

La que se avecina (Prime Video/Telecinco)

Cualquier noticia que mencione estas series es SIEMPRE relevante, independientemente del tipo de contenido. ```

Impacto esperado: Evitar que se descarten noticias de las series más importantes del sitio.

### 3.5. Tipo de evento para tráilers

Problema: No existe un tipo_evento "trailer" en los ejemplos. Los tráilers se clasifican como "otro" o "N/A".

Propuesta: ``` Tipos de evento válidos (añadir):

trailer: cuando se publica un tráiler, teaser o primer vistazo de una serie

nueva_serie: cuando se anuncia una serie que no existía antes

```

Impacto esperado: Mejor categorización que facilita la priorización editorial.

### 3.6. Noticias con varias series mencionadas

Problema: Noticias como "'El Eternauta' arrasa en los Premios Platino, que dejan sin colofón a las series diarias 'La Promesa' y 'Sueños de libertad'" se descartan porque la serie principal no es española, aunque menciona dos series españolas relevantes.

Propuesta: ``` REGLA sobre noticias con múltiples series:

Si una noticia menciona AL MENOS UNA serie española relevante, clasifica como espana=true.

En el campo "serie", indica la serie española más relevante mencionada.

En la "razon", menciona todas las series referidas.

```

Impacto esperado: Recuperación de noticias de premios, comparativas y listas que mencionan series españolas.

### 3.7. Documentales y docuseries

Problema: Criterio inconsistente sobre cuándo una docuserie es relevante.

Propuesta: ``` REGLA sobre documentales y docuseries:

Las docuseries emitidas en plataformas españolas (Movistar Plus+, Netflix España, Prime Video, etc.) SON relevantes.

Incluye: biopics documentales, true crime, deportivos y de personalidades.

Clasifica con tipo_evento apropiado (fecha_estreno, trailer, etc.), NO como "otro".

```

Impacto esperado: Correcta clasificación de docuseries como 'Los Topuria', 'Rafa' (Nadal), 'La más grande', etc.

### 3.8. Películas de plataformas españolas

Problema: Películas producidas por o para plataformas españolas (Movistar Plus, etc.) se descartan como "no serie".

Propuesta: ``` REGLA sobre películas de plataformas:

Las películas originales de plataformas españolas (Movistar Plus+, Atresplayer, etc.) SÍ son relevantes.

Clasifica como espana=true, tipo_evento apropiado (trailer, fecha_estreno, etc.).

Ejemplo: 'El ser querido' de Sorogoyen para Movistar Plus+ → relevante.

```

Impacto esperado: Recuperación de 2-3 noticias semanales de películas de plataformas.

---

4. MEJORAS AL PROMPT DE REDACCIÓN

### 4.1. Límite de longitud explícito

Problema: Los artículos se cortan a mitad de frase por alcanzar el límite de tokens.

Propuesta: ``` LONGITUD OBLIGATORIA:

Extensión máxima: 400 palabras (artículos estándar) o 600 palabras (artículos de reparto/análisis).

NUNCA superes las 600 palabras.

El artículo DEBE terminar con una frase completa y un párrafo de cierre.

Si te acercas al límite, cierra el artículo inmediatamente con un párrafo conclusivo.

Preferible un artículo más corto pero completo que uno largo cortado a la mitad.

```

Impacto esperado: Eliminación total de artículos cortados a mitad de frase (actualmente ~50% de los artículos).

### 4.2. Prohibición de inventar datos

Problema: El modelo inventa nombres de actores, tramas y detalles que no están en el prompt.

Propuesta: ``` REGLA FUNDAMENTAL - NO INVENTAR:

Solo incluye datos que aparezcan explícitamente en el contenido proporcionado.

Si no conoces el reparto, NO inventes nombres de actores.

Si no conoces el final de una serie, NO inventes tramas.

Si no tienes un dato, omítelo. NUNCA rellenes con información inventada.

Frases como "

Análisis anteriores (9)

2026-06-10 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Sesgo hacia `espana: false` en noticias claramente españolas

El problema más grave y recurrente. Claude marca `espana: false` en noticias que **sí** son relevantes para el público español o que tratan sobre series/contenidos españoles.

**Ejemplos concretos de la lista de mal clasificados:**
- **"Nueve Reinas"** (3 noticias): Serie española de Netflix con Álvaro Morte y Patrick Criado, rodada en Madrid. Probablemente clasificada como `no_espana` porque el título original es una película argentina.
- **"Oasis"**: Serie española de Netflix rodada en Tenerife, marcada incorrectamente.
- **"Los Topuria"**: Docuserie española de HBO Max.
- **"Anatomía de un instante"**: Serie española basada en el libro de Javier Cercas sobre el 23-F.
- **"Ella, maldita alma"**: Serie de Telecinco con Maxi Iglesias.

**Patrón:** Claude interpreta `espana` como "¿es una producción originaria de España?" cuando debería ser "¿es relevante para el mercado español de series de televisión?".

### 1.2. Clasificación como `irrelevante` de noticias sobre series que se emiten en España

- **"En tierra lejana"** (2 noticias): Serie turca que se emite en Antena 3. Aunque sea turca, el ángulo editorial es español (emisión en cadena española).
- **"Mi otra yo"**: Serie turca de Netflix disponible en España.
- **"Hermanos"**: Serie turca emitida en Nova (Atresmedia).
- **"The Resident"**: Emitida en Divinity.

**Patrón:** Las series turcas/internacionales emitidas en canales españoles se descartan como si fueran noticias internacionales sin relevancia.

### 1.3. Notas de prensa y emails descartados como irrelevantes

- **"Nueve Reinas" (email de rodaje)**: Una nota de prensa sobre inicio de rodaje de serie española debería ser `pendientes`, no descartada.
- **"ATRESPLAYER | Destacados de programación"**: Información de programación de plataforma española.
- **"OASIS LLEGA A NETFLIX"**: Nota de prensa sobre estreno.
- **"NETFLIX DESVELA EL TRÁILER DE RAFA"**: Docuserie sobre Rafa Nadal.

**Patrón:** Claude desconfía de los emails/notas de prensa y los trata como spam o publicidad.

### 1.4. Confusión entre `tipo_evento` y decisión de clasificación

En el Ejemplo 2, artículo 9 ("Descubre la telepatía entre Adriana Torrebejano y Rubén Cortada"), Claude dice "Clip/promo sin serie identificable" y marca `espana: false`. Sin embargo, Adriana Torrebejano y Rubén Cortada son actores de series españolas de Antena 3 (probablemente '¿A qué estás esperando?').

### 1.5. Programas de entretenimiento siempre descartados sin matiz

El Hormiguero se descarta consistentemente (Ejemplos 2, 3), lo cual puede ser correcto, pero la nota del Ejemplo 8 sobre "Está el horno para bollos" de RTVE se descarta cuando **contiene una entrevista relevante con Inma Cuesta**, actriz de series españolas. Si la entrevista toca su carrera en series, podría ser `pendientes`.

### 1.6. Premios y festivales descartados incorrectamente

- **"Premios Platino"** (2 noticias sobre 'Anatomía de un instante' y 'La Promesa'): Descartados cuando mencionan series españolas ganadoras.
- **"Premios Anillos de Oro"** (Ejemplo 1): Correctamente descartado si no hay serie involucrada, pero los Platino sí mencionan series concretas.

### 1.7. `tipo_evento` inconsistente

- En Ejemplo 6, "¿A qué estás esperando?" último episodio se clasifica como `temporada_final`. ¿No debería ser `fecha_estreno` si lo relevante es que "se estrena mañana"? Hay inconsistencia con la regla del prompt que dice que 'El Inmortal' anunciando fecha de temporada final → `fecha_estreno` (no `temporada_final`).

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Artículos cortados a mitad de frase

Prácticamente **todos** los artículos se cortan abruptamente:
- Artículo 2: "La comparación con 'The White Lotus' es inevitable. Un"
- Artículo 3: "La dirección corre a cargo de **María Togores** y Marina Pérez, que también firma el guion co"
- Artículo 4: "donde se intuye que está la mayo"
- Artículo 6: "acompañado por Alix Poisson, Antoine Reinartz, Féli"
- Artículo 11: "pero los ultras no tienen ninguna intención d"

**Diagnóstico:** El límite de tokens de salida es insuficiente para la longitud que Claude intenta generar, o no hay instrucción de longitud máxima en el prompt.

### 2.2. Artículo 1 (Entrevías): Artículo vacío con relleno

Claude **no tenía datos suficientes** sobre la noticia y generó un artículo que reconoce explícitamente no saber de qué habla:

> "Los datos concretos sobre qué proyecto de Hugo Silva se señala como recomendación para los fans de 'Entrevías' no han trascendido en detalle."

Esto nunca debería publicarse. El prompt debería instruir a Claude a **no generar un artículo cuando no tiene información suficiente**.

### 2.3. Bloque de contexto irrelevante sobre 'Sira' en todos los prompts de redacción

Todos los prompts de redacción contienen un extenso fragmento sobre 'Sira' (Adriana Ugarte, María Dueñas, Atresmedia, etc.) que **no tiene relación alguna** con los artículos que se piden. Esto:
- Desperdicia tokens de contexto
- Podría "contaminar" la generación (¿Claude podría mezclar datos de Sira con otros artículos?)
- No aporta valor como ejemplo de estilo

### 2.4. Invención de datos no verificados

**Artículo 19 (Valle Salvaje):** El titular original dice "Berta Castañé irrumpe en 'Valle Salvaje' como la arrogante Manuela de Guzmán", pero el artículo generado dice **"Lydia Pavón ficha por 'Valle Salvaje'"**. Claude ha inventado la actriz. El nombre correcto era Berta Castañé.

Además inventa detalles biográficos: "nacida en Puerto Lápice (Ciudad Real) hace 27 años, llegó a la interpretación desde la danza". Esto es potencialmente falso y dañino.

**Artículo 14 (Sueños de libertad):** Menciona "episodio 580, que se emitirá el próximo jueves 11 de junio" — estos números específicos pueden ser inventados si no estaban en las fuentes.

**Artículo 18 (La Promesa):** "capítulo 851, emitido este martes 9 de junio" — ¿estaba este dato en la fuente o lo calculó/inventó Claude?

### 2.5. Estilo generalmente bueno pero con muletillas

El tono editorial es sólido: directo, informativo, con personalidad. Sin embargo, hay patrones repetitivos:
- **"No es [algo]. Es [otra cosa]."** — Aparece en múltiples artículos
- **"El tipo de [X] que [Y]"** — Fórmula recurrente
- **"Suena a [X]. No suena a [Y]."** — Estructura espejo repetida
- **"La pregunta ahora es otra:"** — Cierre formulaico

### 2.6. Artículos duplicados sin variación significativa

Los artículos 10, 13 y 14 cubren **la misma noticia** (Carolina Lapausa en 'Sueños de libertad'). Los tres son muy similares en estructura y contenido. El artículo 14 es el más completo (incluye número de episodio, contexto de la trama). Los otros dos son versiones más cortas del mismo contenido.

### 2.7. Falta de extracción de datos de la fuente

En varios casos, el artículo no aprovecha toda la información disponible en el resumen/título de la fuente. Por ejemplo:
- **Artículo 15** sobre el podcast: Extrae bien los datos, pero el texto del prompt de redacción no incluía esa información (estaba en la fuente original). Esto sugiere que Claude está generando contenido a partir de su conocimiento previo, no solo de la fuente proporcionada.

### 2.8. Longitud excesiva para algunos tipos de noticia

Artículos como el de 'Sueños de libertad' (regreso de un personaje) generan 5+ párrafos cuando 3 serían suficientes. Sin instrucciones de longitud por tipo de evento, Claude tiende a sobreextenderse.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### 3.1. Redefinir `espana`

**Problema:** Claude interpreta `espana: true` como "producción española" cuando debería incluir cualquier serie relevante para el mercado español (series turcas en Antena 3, series internacionales en plataformas españolas, etc.).

**Propuesta (texto exacto):**
```
El campo "espana" debe ser TRUE si cumple CUALQUIERA de estas condiciones:
- Es una serie producida en España (total o parcialmente)
- Se emite o se va a emitir en un canal/plataforma español (Antena 3, La 1, Telecinco, Movistar Plus+, Atresplayer, Mitele, RTVE Play, Netflix España, Prime Video España, Max España, Disney+ España, SkyShowtime, Nova, Divinity, Energy, etc.)
- La noticia menciona actores, directores o productoras españolas en rol principal
- La noticia tiene un ángulo editorial relevante para el público español (premios en los que participan series españolas, audiencias en España, etc.)

SOLO marca espana: false si la noticia trata exclusivamente sobre una serie extranjera sin ninguna conexión con el mercado español.
```

**Impacto esperado:** Reducción drástica de falsos negativos. Las series turcas de Antena 3, las series internacionales de plataformas españolas y las notas sobre premios con participación española serían correctamente clasificadas como relevantes.

### 3.2. Tratar notas de prensa/emails como fuentes de alta fiabilidad

**Problema:** Emails y notas de prensa de cadenas/productoras se descartan como irrelevantes o spam.

**Propuesta (texto exacto):**
```
FUENTES POR EMAIL / NOTA DE PRENSA:
Las notas de prensa de cadenas de televisión, plataformas de streaming, productoras y distribuidoras son fuentes de primera mano y tienen ALTA prioridad editorial. Si una nota de prensa anuncia un rodaje, un estreno, un fichaje o una fecha, clasifícala como pendientes salvo que el contenido sea claramente publicidad comercial sin valor informativo (banners, ofertas de suscripción, propuestas de monetización).

Ejemplos de emails RELEVANTES: anuncios de rodajes, fechas de estreno, fichas técnicas, notas de casting.
Ejemplos de emails IRRELEVANTES: propuestas comerciales de proveedores tecnológicos, newsletters de marketing, invitaciones a eventos no relacionados con ficción.
```

**Impacto esperado:** Las notas de prensa de Atresplayer, Netflix, Movistar, etc. se clasificarían correctamente como `pendientes`.

### 3.3. Reglas para series turcas/internacionales emitidas en España

**Problema:** Series como 'En tierra lejana', 'Hermanos', 'Una nueva vida', 'Mi otra yo' se clasifican como `no_espana` cuando se emiten en canales españoles.

**Propuesta (texto exacto):**
```
SERIES INTERNACIONALES CON EMISIÓN EN ESPAÑA:
Las series turcas, coreanas u otras internacionales que se emiten en cadenas españolas (Antena 3, Nova, Divinity, La 1, etc.) o plataformas disponibles en España (Netflix, etc.) deben clasificarse con espana: true cuando la noticia tenga ángulo español: emisión en cadena española, audiencias en España, doblaje español, sustitución en parrilla, etc.

Solo marca espana: false si la noticia trata sobre la serie en su mercado original sin conexión con España.
```

**Impacto esperado:** 'En tierra lejana' (Antena 3), 'Hermanos' (Nova), 'Mi otra yo' (Netflix) clasificados correctamente.

### 3.4. Regla explícita para noticias sobre premios

**Problema:** Noticias sobre premios que mencionan series españolas se descartan como genéricas.

**Propuesta (texto exacto):**
```
PREMIOS Y FESTIVALES:
Si una noticia sobre premios (Platino, Feroz, Emmy, etc.) menciona ESPECÍFICAMENTE una serie española o una serie emitida en España como nominada, ganadora o participante, clasifícala con la serie mencionada y espana: true. Si la noticia es genérica sobre el evento sin mencionar series concretas relevantes, clasifícala como irrelevante.
```

**Impacto esperado:** Las noticias de los Premios Platino mencionando 'Anatomía de un instante' y 'La Promesa' se clasificarían como `pendientes`.

### 3.5. Aclarar la diferencia entre `fecha_estreno` y `temporada_final`

**Problema:** Inconsistencia entre clasificar "último episodio mañana" como `temporada_final` vs. `fecha_estreno`. Los ejemplos del prompt dicen que 'El Inmortal' temporada final → `fecha_estreno`, pero '¿A qué estás esperando?' último episodio → `temporada_final`.

**Propuesta (texto exacto):**
```
REGLA tipo_evento PARA FINALES DE SERIE:
- Si la noticia anuncia que una serie TENDRÁ una temporada final o va a acabar → tipo_evento: "temporada_final"
- Si la noticia anuncia la FECHA CONCRETA de estreno de esa temporada final o de episodios concretos → tipo_evento: "fecha_estreno"
- Si la noticia es sobre el CONTENIDO del último episodio → tipo_evento: "avance_episodio"

Prioridad: fecha_estreno > temporada_final > avance_episodio (usa el que mejor describa el foco principal de la noticia)
```

**Impacto esperado:** Clasificación consistente entre noticias similares.

### 3.6. Regla para entrevistas con actores de series

**Problema:** Entrevistas con actores de series en programas de entretenimiento se descartan como "no serie de ficción".

**Propuesta (texto exacto):**
```
ENTREVISTAS CON ACTORES:
Si un actor de una serie española es entrevistado en un programa (El Hormiguero, Está el horno para bollos, La Revuelta, etc.) y la entrevista trata sobre su trabajo en una serie de ficción, clasifica con la serie correspondiente. Solo descarta si la entrevista es puramente personal sin mención a series.
```

**Impacto esperado:** La entrevista de Inma Cuesta o María Castro sobre sus series se clasificaría como `pendientes`.

### 3.7. No usar `N/A` como serie cuando hay una serie identificable

**Problema:** En varios artículos mal clasificados, la serie se identificó como `N/A` cuando el título mencionaba explícitamente una serie (ej. "María Castro ('La Promesa')").

**Propuesta (texto exacto):**
```
IDENTIFICACIÓN DE SERIE:
Si el título o resumen menciona el nombre de una serie entre comillas, paréntesis o de forma explícita, SIEMPRE identifícala en el campo "serie", aunque la noticia trate tangencialmente sobre ella. Usa N/A SOLO cuando genuinamente no haya ninguna serie identificable.
```

**Impacto esperado:** Menos clasificaciones con serie `N/A` cuando la serie es mencionada.

### 3.8. Docuseries como contenido válido

**Problema:** "NETFLIX DESVELA EL TRÁILER DE RAFA" (docuserie sobre Nadal), "Los Topuria" (docuserie en HBO Max) se descartan.

**Propuesta (texto exacto):**
```
DOCUSERIES:
Las docuseries (series documentales con estructura episódica) son contenido válido. Clasifícalas como cualquier otra serie. No las descartes por ser documentales. Sí descarta documentales unitarios (películas documentales de un solo episodio) salvo que tengan especial relevancia.
```

**Impacto esperado:** Docuseries españolas como 'Los Topuria', 'Rafa', 'Abandonados', 'Ultras' se clasifican correctamente.

---

## 4. MEJORAS AL PROMPT DE REDACCIÓN

### 4.1. Eliminar el bloque de contexto sobre 'Sira'

**Problema:** Todos los prompts de redacción incluyen un extenso párrafo sobre 'Sira' (Adriana Ugarte, María Dueñas, etc.) que no tiene relación con el artículo solicitado. Consume tokens y puede contaminar la generación.

**Propuesta:** Eliminar completamente el bloque que empieza con "se vendieron también a China, Taiwán, Hungría..." y termina con "¿puede 'Sira' volver a marcar el camino...?". Sustituirlo por ejemplos de artículos ya publicados de la misma web como referencia de estilo, o simplemente eliminarlo.

**Impacto esperado:** Más tokens disponibles para el contenido real, menos riesgo de contaminación, artículos más cortos y focalizados.

### 4.2. Instrucción explícita de longitud y cierre

**Problema:** Todos los artículos se cortan a mitad de frase por exceder el límite de tokens.

**Propuesta (texto exacto):**
```
LONGITUD Y ESTRUCTURA:
- Extensión máxima: 350-450 palabras (NUNCA más de 500 palabras).
- Estructura: titular H1 + 4-6 párrafos + cierre con frase completa.
- SIEMPRE termina el artículo con una frase completa

2026-06-03 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Falsos negativos graves: series españolas clasificadas como irrelevantes/no_espana

La lista de "artículos mal clasificados" revela un patrón sistemático y preocupante. Hay **22 noticias** que el editor tuvo que recuperar manualmente. Los problemas principales:

**a) Series turcas emitidas en España tratadas como no españolas:**
- *"La novela turca en español de Cansu Dere que más se parece a 'En tierra lejana'"* → Serie turca emitida en Antena 3, relevante para el público español.
- *"'En tierra lejana': ¿cuántos capítulos tiene la serie turca de Antena 3?"* → Claramente sobre programación española.
- *"La serie turca de Sinem Ünsal con el actor de 'Ada Masali' antes de 'En tierra lejana'"* → Conexión directa con serie emitida en España.
- *"Nova apuesta por una nueva novela turca con Su Burcu Yazgı Coşkun, protagonista de 'Hermanos'"* → Nova es canal español, noticia de programación española.
- *"Estreno de la tercera temporada de 'Mi otra yo' en Netflix"* → Netflix España, serie disponible en el mercado español.

**El modelo confunde "serie producida en España" con "serie relevante para el público español".** Series turcas, coreanas o de cualquier origen que se emiten en canales españoles (Antena 3, Nova, Divinity, Netflix España) son contenido editorial válido.

**b) Series españolas genuinas descartadas:**
- *"Nueve Reinas"* (3 noticias distintas): serie de Netflix con Álvaro Morte y Patrick Criado, rodada en Madrid. Descartada tres veces.
- *"Sueños de libertad"*: serie diaria de Antena 3 descartada.
- *"Barrio Esperanza"*: serie de TVE descartada.
- *"OASIS LLEGA A NETFLIX"*: serie española descartada.
- *"Ella, maldita alma"*: serie de Telecinco con Maxi Iglesias.
- *"Anatomía de un instante"*: serie española premiada en Platino.

**c) Docuseries y contenido no-ficción descartado erróneamente:**
- *"Dulceida al desnudo 2+1"* en Divinity: docuserie española relevante.
- *"NETFLIX DESVELA EL TRÁILER DE RAFA"*: docuserie sobre Nadal en Netflix.
- *"HBO Max estrenará la docuserie española Los Topuria"*: descartada como irrelevante inicialmente (luego se redactó artículo, lo que indica que fue recuperada).
- *"ATRESPLAYER | Destacados de programación del domingo 24 de mayo"*: contiene información sobre estrenos de series.

**d) Noticias de actores de series españolas descartadas:**
- *"María Castro ('La Promesa') desvela un detalle inédito de su casting"*: actriz de serie española hablando de su carrera.
- *"'La Promesa' ficha a Juan Fleta como Aníbal Esparza"* (2 veces): fichaje de actor para serie española.

**e) Series internacionales con relevancia editorial:**
- *"HBO Max estrenará en julio el tercer spin-off de 'The Big Bang Theory'"*: estreno relevante para audiencia española.
- *"The Resident" en Divinity*: programación de canal español.

### 1.2. Errores en los ejemplos mostrados (1-6)

**Ejemplo 1:** Correcto al descartar programa de entretenimiento.

**Ejemplo 2:**
- Artículo 4 ("PAGINA DOS - RTVE.es"): `"espana": false` es incorrecto. 'Página Dos' es un programa de RTVE sobre libros. Aunque no es serie de ficción (correcto descartarlo), marcarlo como "no España" es un error factual.
- Artículo 5: Correcto, "serie histórica" es término estadístico.
- Artículo 6 ("Los años nuevos"): Clasificado correctamente como serie española con tipo "critica". Bien.

**Ejemplo 4:** Correcto al descartar programa de cocina.

**Ejemplo 5:**
- Artículo 3 ("Cuatro proyectos españoles seleccionados para Cartoon Forum"): Marcado como `"espana": true` pero tipo "otro". Podría ser relevante como noticia de industria española.
- Artículo 4 ("AF Films y LatinWe adquieren guión de 'Amores Perros'"): Marcado como `"espana": true` pero es una producción latinoamericana. El texto no menciona que sea serie española.

**Ejemplo 6:** Todos correctamente descartados, pero el campo `"espana": false` se usa de forma inconsistente. Premios Iris Games se celebran en España y son de la Academia de TV española, pero se marca como `false`.

### 1.3. Uso inconsistente del campo `espana`

El modelo confunde dos conceptos:
- `espana = true`: ¿significa "producida en España" o "relevante para el mercado español"?
- En el ejemplo 2, artículo 2 (Rossy de Palma en El Hormiguero): `"espana": false` cuando es una entrevista en un programa español. Aunque no es serie de ficción, el campo debería reflejar el país de origen del contenido.

El campo `espana` se está usando a veces como "¿es relevante?" en lugar de "¿es española o se emite en España?".

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Artículos truncados

**Todos los artículos están cortados** a mitad de frase o párrafo. Ejemplos:

- Artículo 1: *"...impactante»."* → Termina abruptamente sin cierre.
- Artículo 2: *"...la capacidad y la flexibilida"* → Palabra cortada.
- Artículo 5: *"...la factoría que los Caballer"* → Palabra cortada.
- Artículo 8: *"El reparto va más allá de Yaman."* → Se corta antes de listar el reparto.
- Artículo 12: *"...la productora de **Álex de la Iglesia** y **Caro"* → Nombre cortado.

Esto indica un problema de **max_tokens** o de falta de instrucción sobre longitud máxima. El modelo no tiene incentivo para cerrar el artículo dentro del límite de tokens disponible.

### 2.2. Estilo y tono

El estilo es generalmente bueno: directo, informativo, con personalidad editorial. Hay elementos positivos:
- Uso efectivo de negritas para nombres.
- Estructura clara: titular → entradilla → desarrollo.
- Tono que mezcla información con opinión editorial dosificada.

**Problemas de estilo detectados:**

**a) Expresiones valorativas excesivas o editorializantes:**
- *"No suena a frase de promo. Suena a deuda saldada."* (aparece en el prompt de contexto, no en los artículos generados, pero el modelo podría imitarlo)
- *"La jugada tiene su gracia"* (Artículo 8)
- *"Porta no afloja el ritmo"* (Artículo 16)
- *"Un reparto coral donde casi cada nombre evoca un registro cómico distinto"* (Artículo 15)

Estas expresiones son aceptables en un blog editorial, pero el modelo a veces fuerza el tono "desenfadado" cuando la noticia no lo requiere.

**b) Muletillas y patrones repetitivos:**
- *"Lo que funciona/funcionó..."* aparece varias veces.
- *"La pregunta es/no es..."* como recurso retórico se usa en exceso.
- *"No es un dato menor"* (Artículo 13)
- *"Una mezcla de..."* (repetida en varios artículos)
- *"Detrás de las cámaras/del proyecto..."* (repetida)

**c) Frases vacías que no aportan información:**
- *"El calendario no es casual"* (Artículo 4) → Afirmación sin sustento.
- *"Que el protagonista figure como productor ejecutivo dice bastante del nivel de implicación"* (Artículo 4) → Obvio.
- *"Un escenario que no es decorado: la geografía y el clima forman parte central del relato"* (Artículo 1) → Frase de relleno.

### 2.3. Datos del prompt no utilizados o mal utilizados

**a) Artículo 9 ("La Nena"):** El título de la noticia es "ATRESPLAYER | Destacados de programación del domingo 31 de mayo". El artículo generado se centra exclusivamente en 'La Nena', lo cual sugiere que el resumen de la noticia original contenía múltiples destacados pero el modelo eligió uno solo. Esto puede ser correcto editorialmente, pero habría que verificar que no se perdieron otros estrenos relevantes.

**b) Artículo 14 ("33 Días"):** El artículo dice *"Atresplayer presentó anoche '33 Días'"* pero no cita ningún dato concreto de la premiere (asistentes, declaraciones del equipo, reacciones). Si el prompt contenía información sobre el evento, no se ha aprovechado.

**c) Artículo 20 ("Valle Salvaje"):** Buen ejemplo de uso de datos. El artículo extrae cifras concretas (240 capítulos, 16.320.000 euros, 660 episodios acumulados) y contextualiza con declaraciones de actores. Modelo a seguir.

### 2.4. Posible invención de datos

**a) Artículo 9:** Describe escenas específicas del último capítulo de 'La Nena' con un nivel de detalle que sugiere que el prompt contenía un resumen de trama detallado. Si no lo contenía, podría ser invención. Frases como *"Orduño sufre el ataque del Caracas en las sombras de un convento abandonado"* o *"el forense descubre algo en el móvil de Gestas"* son muy específicas para ser inventadas, pero habría que confirmar.

**b) Artículo 13 ("La bola negra"):** Afirma *"ovación de 20 minutos"* y *"terceros directores españoles en alzarse con el reconocimiento a mejor dirección"*. Si estos datos no estaban en el prompt original, son potencialmente inventados.

**c) Artículo 2 ("Torrente Presidente"):** Cita a Diego Ávalos con declaraciones entrecomilladas. Si estas citas estaban en el resumen fuente, correcto. Si no, es fabricación de citas, que es un error gravísimo.

### 2.5. Prompt de contexto: información irrelevante

Los 20 artículos comparten el mismo bloque de contexto sobre 'Sira' (Adriana Ugarte, Atresmedia, etc.). Este contexto **no tiene relación** con ninguno de los artículos generados. Parece ser un ejemplo de estilo/tono que se incluye como referencia, pero:
- Ocupa tokens innecesarios.
- No está claro si el modelo lo usa como guía de estilo o si lo ignora.
- Podría confundir al modelo en artículos sobre Atresmedia (como el de 'Una choni muy legal' de Flooxer/Atresplayer).

### 2.6. Estructura de titulares

Los titulares generados son generalmente buenos:
- Informativos y con gancho.
- Usan el nombre de la serie/plataforma.
- Longitud adecuada.

Pero hay inconsistencias:
- Artículo 14: *"Así satisfizo '33 Días' en su premiere"* → "Satisfizo" es un verbo poco natural en un titular español. Probablemente debería ser "convenció" o "brilló".
- Artículo 11: *"'Las Berrocal' termina el rodaje de su segunda temporada en Movistar Plus: seis episodios sin filtro"* → "Sin filtro" es una valoración editorial en el titular.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### 3.1. Definición de `espana`

**Problema:** El modelo descarta series turcas, coreanas y de otros orígenes que se emiten en canales españoles (Antena 3, Nova, Divinity, Netflix España). Confunde "producida en España" con "relevante para el mercado español".

**Propuesta (texto exacto para añadir al prompt):**

```
IMPORTANTE sobre el campo "espana":
- espana = true si la serie se EMITE o ESTÁ DISPONIBLE en España (en canales como Antena 3, Telecinco, TVE, Nova, Divinity, Netflix España, HBO Max España, Disney+, Movistar Plus+, Atresplayer, etc.), INDEPENDIENTEMENTE de su país de producción.
- Las series turcas emitidas en Antena 3, Nova o Divinity son espana = true.
- Las series de Netflix, HBO Max, Disney+ o Prime Video disponibles en España son espana = true.
- espana = false SOLO si la serie no se emite ni está disponible en España, o si la noticia trata exclusivamente sobre su emisión en otro país.
```

**Impacto esperado:** Eliminaría la mayoría de los falsos negativos de series turcas (En tierra lejana, Hermanos, Mi otra yo) y series internacionales en plataformas españolas (The Big Bang Theory spin-off, The Resident en Divinity, Oasis en Netflix).

### 3.2. Tipos de contenido relevante

**Problema:** El modelo descarta docuseries, docurealities y contenido no-ficción que sí es editorial relevante (Dulceida al desnudo, Los Topuria, docuserie de Nadal).

**Propuesta:**

```
CONTENIDO RELEVANTE (no descartar):
- Series de FICCIÓN (drama, comedia, thriller, etc.)
- Docuseries y series documentales (true crime, biografías, reality documental)
- Miniseries y TV movies
- Series de animación
NO son relevantes: programas de entretenimiento en directo (magazines, concursos, talent shows, programas de cocina, tertulias), informativos, eventos deportivos en directo.
```

**Impacto esperado:** Recuperaría docuseries como Dulceida, Los Topuria, Rafa Nadal.

### 3.3. Noticias de actores vinculados a series

**Problema:** Se descartan noticias sobre actores de series españolas (María Castro de 'La Promesa', fichaje de Juan Fleta).

**Propuesta:**

```
NOTICIAS DE ACTORES: Son relevantes si:
- El actor está vinculado a una serie española en emisión y la noticia menciona esa serie en el contexto.
- Se anuncia un fichaje o incorporación a una serie.
- El actor habla sobre su papel, experiencia o anécdotas de una serie concreta.
NO son relevantes si: la noticia es puramente personal (salud, vida privada) sin conexión con ninguna serie.
```

**Impacto esperado:** Recuperaría noticias como el fichaje de Juan Fleta para 'La Promesa' y la entrevista de María Castro.

### 3.4. Notas de prensa y comunicados

**Problema:** Las notas de prensa de Atresplayer ("Destacados de programación del domingo 24 de mayo") se descartan como irrelevantes cuando pueden contener información sobre estrenos de series.

**Propuesta:**

```
NOTAS DE PRENSA / COMUNICADOS:
- Los comunicados de programación de plataformas (Atresplayer, Movistar Plus+, Netflix, etc.) son RELEVANTES si mencionan estrenos, finales o cambios de programación de series.
- Examina el contenido, no solo el formato del título.
```

**Impacto esperado:** Recuperaría comunicados de Atresplayer y otras plataformas con información editorial valiosa.

### 3.5. Rodajes y nuevas producciones

**Problema:** Se descartaron 3 noticias distintas sobre 'Nueve Reinas' (rodaje de serie de Netflix con Álvaro Morte y Patrick Criado en Madrid).

**Propuesta:**

```
PRODUCCIONES NUEVAS: Cualquier noticia sobre el RODAJE, ANUNCIO o DESARROLLO de una nueva serie es SIEMPRE relevante si:
- Se produce o rueda en España, O
- Tiene actores españoles protagonistas, O
- Se emitirá en una plataforma disponible en España.
No descartar por no reconocer el título de la serie.
```

**Impacto esperado:** Evitaría descartar anuncios de nuevas series como Nueve Reinas, Oasis, Ella maldita alma.

### 3.6. Premios y reconocimientos

**Problema:** Se descartaron noticias sobre Premios Platino que mencionaban series españolas ('Anatomía de un instante', 'La Promesa', 'Sueños de libertad').

**Propuesta:**

```
PREMIOS: Las noticias sobre premios (Platino, Feroz, Iris, Ondas, Emmy, etc.) son RELEVANTES si mencionan series concretas que se emiten en España, especialmente si son ganadoras o nominadas.
```

**Impacto esperado:** Recuperaría noticias de premios con mención a series españolas.

### 3.7. Evitar el uso de `filtros` como cajón de sastre

**Problema:** En los ejemplos, el campo `filtros` incluye términos genéricos como "health news", "estados unidos", "festival musica" que no son útiles como palabras clave de bloqueo. Los filtros deberían ser términos específicos que ayuden a bloquear futuras noticias similares automáticamente.

**Propuesta:**

```
El campo "filtros" debe contener SOLO palabras o frases específicas que, si aparecen en futuros títulos, permitan bloquear la noticia automáticamente. Ejemplos válidos: "el hormiguero", "cocina abierta", "noches del botanico". Ejemplos NO válidos: "health news", "estados unidos", "programa cocina".
```

**Impacto esperado:** Filtros más precisos, menos ruido en el bloqueo automático.

---

## 4. MEJORAS AL PROMPT DE REDACCIÓN

### 4.1. Control de longitud y cierre

**Problema:** Todos los artículos se cortan a mitad de frase o párrafo. El modelo no gestiona la longitud dentro del límite de tokens.

**Propuesta (texto exacto):**

```
LONGITUD Y CIERRE:
- El artículo

2026-05-27 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Series turcas emitidas en España clasificadas como `no_espana`

Este es el error más grave y recurrente. Las series turcas que se emiten en canales españoles (Antena 3, Nova, Divinity) son contenido relevante para el público español, pero el sistema las descarta sistemáticamente.

**Ejemplos concretos de artículos mal clasificados:**
- *"La novela turca en español de Cansu Dere ('Infiel' y 'Madre') que más se parece a 'En tierra lejana'"* → Serie turca emitida en Antena 3, debería ser **pendientes**
- *"'En tierra lejana': ¿cuántos capítulos tiene la serie turca de Antena 3?"* → Información práctica sobre serie en emisión en España
- *"La serie turca de Sinem Ünsal con el actor de 'Ada Masali' Alp Navruz antes de 'En tierra lejana'"* → Contenido sobre actores de serie en emisión española
- *"Estreno de la tercera temporada de 'Mi otra yo', protagonizada por Tuba Büyüküstün, en Netflix"* → Netflix España, relevante
- *"Nova apuesta por una nueva novela turca con Su Burcu Yazgı Coşkun, protagonista de 'Hermanos'"* → Nova es canal español

En el Ejemplo 1, el artículo 5 sobre "Alya" se clasifica con `espana: true` correctamente, pero el patrón general muestra inconsistencia: a veces las turcas en canales españoles se marcan como españolas y otras no.

### 1.2. Series españolas no reconocidas como tales

- *"Nueve Reinas"* (3 artículos mal clasificados): Serie de Netflix con Álvaro Morte y Patrick Criado, claramente española. Incluso la nota de prensa dice "inicia su rodaje" y otro titular dice "Madrid, escenario de la nueva serie española de Netflix". Se perdieron 3 noticias sobre la misma serie.
- *"Anatomía de un instante"* y los Premios Platino: serie española premiada, debería ser pendientes.
- *"Telecinco ya promociona su serie con Maxi Iglesias"* → 'Ella, maldita alma', serie española de Telecinco.

### 1.3. Contenido sobre series diarias españolas descartado

- *"'Sueños de libertad' calienta el reencuentro más esperado"* → avance de serie española en emisión diaria
- *"'Barrio Esperanza': el colegio acoge una acampada inclusiva"* → serie española en emisión
- *"APARICIÓN ESPECIAL PRIMICIA | 'La Promesa' ficha a Juan Fleta"* → fichaje en serie española (aparece 2 veces, ambas mal clasificadas)

### 1.4. Notas de prensa de plataformas descartadas como irrelevantes

- *"OASIS LLEGA A NETFLIX EL PRÓXIMO 19 DE JUNIO"* → Serie con fecha de estreno concreta
- *"ATRESPLAYER | Destacados de programación del domingo 24 de mayo"* → Contenía información sobre 'La Nena' que el editor necesitaba (de hecho, se redactó un artículo a partir de ella: el Artículo 5)

### 1.5. Docuseries y realities descartados sin criterio claro

- *"Divinity celebra el Día de la Madre con el estreno en abierto de 'Dulceida al desnudo 2+1'"* → Estreno en abierto de docuserie
- *"NETFLIX DESVELA EL TRÁILER DE RAFA, LA DOCUSERIE SOBRE RAFA NADAL"* → Docuserie de alta relevancia en Netflix España
- *"LOS TOPURIA llega el 5 de junio a HBO Max"* (Ejemplo 1, art. 6) → Clasificado como `espana: false`, pero es HBO Max España con fecha concreta

### 1.6. El campo `espana` se usa de forma ambigua

El sistema confunde "es una serie española" con "es relevante para España". Ejemplo:
- *"HBO Max estrenará en julio de 2026 el tercer spin-off de 'The Big Bang Theory'"* → No es española, pero se estrena en HBO Max España y es noticia relevante
- *"Dos médicos de una saga familiar [...] en la 6ª y última temporada de 'The Resident' en Divinity"* → Serie americana pero en canal español

### 1.7. El tipo_evento "otro" se usa como cajón de sastre

En el Ejemplo 7, el artículo 7 (*"Vigo acogerá el estreno del próximo bombazo de Antena 3"*) se clasifica como `tipo_evento: "otro"` cuando claramente es un evento/estreno. El artículo 8 (*"serie española que ya es la número uno en 50 países"*) se clasifica como audiencias pero sin identificar la serie.

### 1.8. Respuestas JSON truncadas

En el Ejemplo 7, la respuesta se corta en el artículo 10: `"serie": "N`. En el Ejemplo 10, se corta en el artículo 10: `"r`. Esto indica que el prompt + respuesta exceden el límite de tokens, perdiendo artículos sin clasificar.

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. El bloque de contexto sobre 'Sira' contamina todos los artículos

Todos los prompts de redacción incluyen un extenso fragmento sobre 'Sira' y 'El tiempo entre costuras' (Adriana Ugarte, María Dueñas, Buendía Estudios, etc.). Este bloque aparece **idéntico** en los 20 artículos, independientemente de la serie sobre la que se escribe. Esto tiene varias consecuencias:

- **Desperdicia tokens**: Ocupa espacio que podría usarse para contexto relevante de la serie real.
- **Riesgo de contaminación**: Aunque Claude generalmente ignora este contexto cuando escribe sobre otra serie, hay un riesgo latente de que datos de 'Sira' se filtren en artículos no relacionados.

### 2.2. Artículos cortados por límite de tokens

Prácticamente **todos** los artículos están truncados. Ninguno de los 20 ejemplos tiene un final completo. Todos terminan a mitad de frase:

- Artículo 1: "Su trabajo como Bárbara es el eje sobre el qu"
- Artículo 2: "Noa Guillén,"
- Artículo 3: "paisajes de una h"
- Artículo 7: "abrir una brecha entre ella y **Marta**."... termina a mitad de desarrollo
- Artículo 10: "Darío Grandine"

Esto sugiere que `max_tokens` es insuficiente o que el prompt consume demasiados tokens del presupuesto total.

### 2.3. Datos no extraídos del contenido fuente

Hay casos donde el artículo generado no aprovecha toda la información disponible en la fuente. Sin embargo, sin ver el contenido completo de las fuentes (solo vemos fragmentos del prompt), es difícil determinar qué datos concretos se perdieron. Lo que sí se observa es:

- **Artículo 5** (La Nena 1x07): Se genera un artículo muy detallado con avances de trama. Esto sugiere que el prompt incluía sinopsis detallada, y Claude la reproduce bien.
- **Artículo 9** (La desconocida): Se menciona que es adaptación de novela de Rosa Montero, lo cual podría ser una invención si no estaba en la fuente.

### 2.4. Posibles invenciones de datos (hallucinations)

- **Artículo 1** ('Se tiene que morir mucha gente'): Se dice que adapta "la novela de Victoria Martín". ¿Estaba esto en la fuente? No se ve en el prompt mostrado.
- **Artículo 4** ('Aída y vuelta'): "La recaudación ha rozado los cinco millones de euros" → ¿dato real o inventado?
- **Artículo 6** (Ravalear): "El actor ganó el Goya en 2020" → Si no estaba en la fuente, es riesgoso.
- **Artículo 9** (La desconocida): "adapta la novela de Rosa Montero" → Podría ser inventado.
- **Artículo 13** (Cien años de soledad): Datos específicos de audiencia ("40,2 millones de horas vistas frente a 31,1 millones") → ¿De dónde salen?

### 2.5. Estilo general: correcto pero con patrones repetitivos

El estilo es periodístico, directo y atractivo. Sin embargo, hay muletillas:

- **"No es casual que..."** aparece en varios artículos
- **"Pocas [X] pueden presumir de..."** se repite
- **"Lo que queda claro es que..."**
- **"Eso dice bastante sobre..."**
- Uso recurrente de estructuras tipo "La pregunta es otra: ¿puede X...?"
- **Frases rematadas con punto dramático** al final de párrafos: "Una deuda saldada", "Medio país estaba esperando para repetir"

### 2.6. Títulos efectivos pero con tendencia al clickbait moderado

Los títulos son buenos en general:
- ✅ "Paco León estuvo a punto de fichar por 'Aquí no hay quien viva'"
- ✅ "'Pubertat' arrasa en su estreno en 3Cat"
- ⚠️ "El personaje fantasma de Argentina que amenaza la relación de Fina y Marta" → Algo sensacionalista

### 2.7. El campo "Serie" en los metadatos tiene errores

- Artículos 11 y 15: La serie se llama "My Life is Murder" pero el campo dice **"Segunda Temporada"**
- Artículo 20: Igual, dice **"Segunda Temporada"** en vez del nombre de la serie
- Esto parece un bug del sistema de metadatos, no de Claude

### 2.8. Artículos duplicados con contenido casi idéntico

- Artículos 10 y 14: Ambos sobre 'Sira', misma fuente, generados en momentos distintos. El contenido es muy similar pero no idéntico.
- Artículos 11 y 15: Ambos sobre 'My Life is Murder', prácticamente iguales.
- Artículos 12 y 16: Ambos sobre 'Pubertat', casi idénticos.

Esto indica que el sistema no detecta duplicados antes de enviar a redacción.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### Mejora 3.1: Definir explícitamente el criterio "España"

**Problema:** El campo `espana` se interpreta como "la serie es de producción española" en vez de "la noticia es relevante para el público español". Series turcas en Antena 3, series americanas en Divinity, estrenos en Netflix/HBO Max España se descartan.

**Propuesta (texto exacto para añadir al prompt):**
```
CRITERIO "espana":
- espana = true si la noticia es relevante para el público español. Esto incluye:
  · Series españolas (producción española)
  · Series extranjeras emitidas/estrenadas en canales o plataformas españolas (Antena 3, Telecinco, La 1, Nova, Divinity, Netflix España, HBO Max España, Movistar Plus+, Atresplayer, Prime Video España, Disney+ España)
  · Series turcas emitidas en canales españoles (Antena 3, Nova, Divinity)
  · Noticias sobre actores de series en emisión en España
  · Estrenos, fechas, renovaciones o cancelaciones que afecten al espectador español
- espana = false SOLO si la noticia no tiene ningún ángulo español: serie que no se emite en España, sin fecha de estreno en España, sin conexión con el mercado español
```

**Impacto esperado:** Recuperar todas las series turcas en canales españoles, series internacionales con estreno en España y contenido relevante para el espectador español. Estimación: +15-20 artículos/semana que actualmente se pierden.

---

### Mejora 3.2: Clasificar notas de prensa de programación como potencialmente relevantes

**Problema:** Las notas de prensa tipo "ATRESPLAYER | Destacados de programación del domingo 24 de mayo" se descartan, pero contienen información sobre estrenos de episodios de series que el editor necesita (como el caso de 'La Nena' 1x07).

**Propuesta (texto exacto para añadir al prompt):**
```
NOTAS DE PRENSA DE PROGRAMACIÓN:
- Las notas de prensa de programación de cadenas (Antena 3, ATRESPLAYER, La 1, Telecinco, Divinity, Nova, La Sexta) pueden contener estrenos o avances de series de ficción.
- Si el resumen menciona series de ficción concretas, clasifícalas con la serie principal mencionada y tipo_evento apropiado.
- Si el resumen está vacío o solo contiene enlaces, clasifica como tipo_evento: "programacion" con espana: true para que el editor pueda revisarlas.
- NO las descartes automáticamente como irrelevantes.
```

**Impacto esperado:** Recuperar información de estrenos y avances que llega exclusivamente por nota de prensa. Estimación: +3-5 artículos/semana.

---

### Mejora 3.3: Distinguir docuseries relevantes de documentales genéricos

**Problema:** Docuseries de alta relevancia (Rafa Nadal en Netflix, Los Topuria en HBO Max, Dulceida en Divinity) se descartan como "no ficción". Pero el sitio cubre contenido de plataformas de streaming, incluyendo docuseries de interés.

**Propuesta (texto exacto para añadir al prompt):**
```
DOCUSERIES Y REALITY SHOWS:
- Las docuseries sobre personajes públicos (deportistas, celebridades) que se estrenan en plataformas de streaming españolas (Netflix, HBO Max, Movistar Plus+, Atresplayer, Disney+) SON relevantes si:
  · Tienen fecha de estreno concreta
  · Se emiten en una plataforma disponible en España
  · Generan interés mediático significativo
- Clasifícalas con tipo_evento apropiado (fecha_estreno, nuevo_estreno, etc.) y espana: true.
- Solo descarta documentales informativos genéricos (reportajes de actualidad, documentales educativos).
```

**Impacto esperado:** Recuperar 2-4 docuseries relevantes/semana que el editor quiere cubrir.

---

### Mejora 3.4: Reducir el uso de tipo_evento "otro"

**Problema:** "otro" se usa como cajón de sastre, impidiendo que el sistema posterior filtre correctamente. Ejemplos: festival de series en Vigo → "otro"; serie española número 1 en Netflix → "audiencias" sin serie.

**Propuesta (texto exacto para añadir al prompt):**
```
TIPOS DE EVENTO - Usa estos valores específicos en lugar de "otro":
- "nuevo_estreno": serie nueva anunciada o en desarrollo
- "fecha_estreno": se confirma fecha concreta de estreno
- "rodaje": inicio o progreso de rodaje
- "casting": fichaje de actores
- "avance_episodio": adelanto de capítulo concreto
- "avance": avance general de temporada o trama
- "resumen": resumen de capítulo ya emitido
- "audiencias": datos de audiencia o récords de visionado
- "opinion": artículo de opinión, análisis o editorial
- "critica": reseña o crítica de serie
- "temporada_final": anuncio de cancelación o última temporada
- "nueva_temporada": renovación o anuncio de nueva temporada
- "perfil_actor": entrevista o perfil de actor/actriz
- "analisis_trama": análisis de personajes o tramas
- "recomendacion": lista o recomendación de series para ver
- "agenda_plataforma": calendario de estrenos de plataforma
- "industria": noticia sobre el sector audiovisual
- "premios": premios, nominaciones o festivales
- "localizacion": rodaje en localización específica
- "programacion": cambios de parrilla o programación
- "N/A": la noticia no es sobre series de ficción ni docuseries relevantes
Usa "otro" SOLO si ninguna de las anteriores aplica. Si usas "otro", explica en "razon" por qué.
```

**Impacto esperado:** Clasificación más precisa que permite al sistema automatizar mejor el filtrado posterior.

---

### Mejora 3.5: Evitar truncamiento del JSON

**Problema:** En los ejemplos 7 y 10, la respuesta JSON se corta, perdiendo artículos. Esto ocurre porque el prompt es demasiado largo (incluye muchas correcciones históricas) y la respuesta supera max_tokens.

**Propuesta:**
1. **Limitar el bloque de correcciones históricas** a las últimas 10 (no 20+).
2. **Aumentar max_tokens** de la respuesta de clasificación.
3. **Reducir el tamaño del JSON**: Eliminar el campo `filtros` de las respuestas (ocupa tokens innecesarios; el filtrado por palabras clave ya se hace antes de Claude).
4. **Dividir lotes grandes**: Si hay más de 8 artículos, dividir en dos llamadas.

**Texto exacto para el prompt:**
```
IMPORTANTE: Tu respuesta debe ser un JSON completo y válido. Si el lote tiene muchos artículos, prioriza completar el JSON con todos los artículos. Sé conciso en el campo "razon" (máximo 15 palabras). NO incluyas el campo "filtros".
```

**Impacto esperado:** Eliminar respuestas truncadas. Estimación: 2-3 artículos/semana que se pierden por truncamiento.

---

### Mejora 3.6: Tratar películas españolas con ángulo de series como potencialmente relevantes

**Problema:** 'Aída y vuelta' (película derivada de la serie 'Aída') se habría descartado como "película" en clasificación, pero el editor la publicó (Artículo 4). Las películas derivadas de series españolas son relevantes.

**Propuesta (texto exacto para añadir al prompt):**
```
PELÍCULAS DERIVADAS DE SERIES:
- Si una película está directamente relacionada con una serie española (spin-off, secuela, reunión de reparto), clasifícala como relevante con espana: true

2026-05-20 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Series turcas emitidas en España clasificadas como `espana: false`

El error más grave y recurrente. Series turcas que se emiten en cadenas españolas (Antena 3, Nova, Divinity) están siendo marcadas como `espana: false` o descartadas. La lista de artículos mal clasificados lo confirma:

- **'En tierra lejana'** (Antena 3) → descartada
- **'Cuento de una noche'** (Nova/Atresmedia) → descartada
- **'Mi otra yo'** (Netflix, pero con cobertura editorial) → descartada
- **'Hermanos'** (Antena 3/Nova) → descartada
- **'Leyla'** (Nova) → descartada

El modelo interpreta "española" literalmente (producida en España) en lugar de "emitida/relevante para el público español". En el ejemplo 8, Claude sí clasificó bien "Cuento de una noche" como `espana: true`, pero en la lista de errores aparecen múltiples series turcas descartadas, lo que indica inconsistencia.

### 1.2. Series españolas de plataformas no identificadas correctamente

- **'Nueve Reinas'** (Netflix, con Álvaro Morte y Patrick Criado): tres noticias diferentes descartadas. Es una serie española de Netflix y debería ser `pendiente`.
- **'Oasis'** (Netflix/Bambú): descartada pese a ser producción española.
- **'Anatomía de un instante'**: descartada pese a ser serie española premiada.

### 1.3. Docuseries tratadas como irrelevantes

- **'Dulceida al desnudo 2+1'** (Divinity): descartada. Es contenido de ficción/entretenimiento emitido en cadena española.
- **'RAFA'** (Netflix, docuserie sobre Nadal): descartada como irrelevante en clasificación pero luego SÍ se redactó un artículo (artículo 20). Hay incoherencia entre clasificación y redacción.
- **'Abandonados'** (Disney+, Carles Porta): el prompt de corrección indica que debería ser `fecha_estreno`, lo que sugiere que fue mal clasificada previamente.

### 1.4. `tipo_evento` mal asignado

El prompt incluye ejemplos correctivos extensos, lo que indica errores previos persistentes:

- Resúmenes de capítulos clasificados como `otro` en lugar de `resumen`
- Avances de episodios clasificados como `otro` en lugar de `avance_episodio`
- Análisis de trama clasificados como `otro` en lugar de `analisis_trama`
- Perfiles de actor clasificados como `otro` en lugar de `perfil_actor`
- Fechas de estreno clasificadas como `temporada_final` o `N/A` en lugar de `fecha_estreno`

El modelo tiende a usar `otro` como cajón de sastre cuando no identifica un tipo específico.

### 1.5. `espana: false` usado como "no es noticia de series"

En los ejemplos 1-3, artículos irrelevantes (coches, videojuegos, política) reciben `espana: false`. Esto es incorrecto: el campo `espana` solo debería indicar si la serie se emite en España. Para contenido no-serie, `espana` debería ser `null` o irrelevante, no `false`.

### 1.6. Artículos de series diarias españolas descartados

- **'Sueños de libertad'**: avance descartado pese a ser serie diaria de Antena 3.
- **'Barrio Esperanza'**: descartada pese a ser serie española.
- **'La Promesa'** (ficha de actor Juan Fleta): dos veces descartada siendo primicia de casting.

### 1.7. Filtros mal aplicados en artículos relevantes

En el ejemplo 7, el artículo 3 sobre Manuela Vellés recibe filtros y se descarta. Si la actriz aparece en una serie española activa, debería revisarse. El problema es que el modelo no tiene contexto suficiente para saber si el perfil es relevante.

### 1.8. Programas de entretenimiento vs. ficción: frontera difusa

El modelo descarta correctamente programas como 'Zero Dramas', 'Trivial Pursuit' o 'El Hormiguero'. Pero también descarta 'Dulceida al desnudo', que es una docuserie/reality que el editor sí quería cubrir. La regla sobre qué formatos incluir no está clara.

### 1.9. 'Historias del buen valle' (ejemplo 7, id 6)

Clasificada como `nuevo_estreno` y `espana: true`. Bien clasificada como española, pero es un **documental** dirigido por José Luis Guerín, no una serie de ficción. Si el criterio es solo ficción, debería descartarse. Si incluye documentales/docuseries, la regla necesita clarificarse.

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Información inventada o no verificable

Este es el problema más crítico. El modelo genera datos que **no aparecen en el prompt**:

**Artículo 1 (Oasis):**
- El prompt es una nota de prensa sobre 'OASIS LLEGA A NETFLIX EL 19 DE JUNIO', pero el contenido del prompt visible habla de 'Se tiene que morir mucha gente'. El modelo genera un artículo entero sobre 'Oasis' con reparto detallado (Ana Garcés, Tomy Aguilera, Victoria Kantch, Unax Ugalde, Alicia Borrachero, Mercedes Sampietro, Paco Tous, Verónica Sánchez...) que **no aparece en ningún lugar del prompt mostrado**. Si estos datos vienen de la nota de prensa original (no visible en el fragmento), es correcto. Si no, es invención pura.

**Artículo 2 (Caldas: El último barco):**
- Menciona que es "serie de seis episodios", adapta un "bestseller de Domingo Villar", incluye nombres como María Pujalte, Alejandra Onieva, Miryam Gallego, el director Jorge Saavedra, el fotógrafo Johnny Yebra. De nuevo, el prompt visible no contiene estos datos. Si provienen de la nota de prensa truncada, bien. Si no, es fabricación.

**Artículo 6 (Una nueva vida):**
- Afirma que "A.B.I." se estrenó el 13 de enero de 2026 en ATV con "23,83% de cuota". Este dato es extremadamente específico. Si no está en las fuentes, es una alucinación peligrosa.

**Artículo 14 (Una nueva vida, capítulos restantes):**
- Dice "quedan algo menos de 15 capítulos", "terminó en Turquía el 4 de abril de 2025, capítulo 101", "primera temporada sumó 36 episodios, la segunda 37 y la tercera 28". Son datos muy concretos que podrían ser correctos o inventados. Sin la fuente original completa, es imposible verificarlo desde el prompt.

**Artículo 10 (Mi otra yo):**
- Afirma estreno el "24 de junio de 2026". Si este dato no está en la fuente, es grave.

### 2.2. Truncamiento sistemático de artículos

Todos los artículos generados se cortan a mitad de frase. Ejemplos:

- Artículo 1: "...la serie lleva la firma de un equipo ampli"
- Artículo 2: "...la última puerta que el propi"
- Artículo 3: "...La trama lleva a Andrés y **Damián** (T"
- Artículo 6: "...conocido por 'E"
- Artículo 8: "...se rumorea incluso una posible serie derivada centrada en el **Coronel Tamayo** y su búsqueda del oro robado..."

Esto indica que el **max_tokens** configurado es insuficiente para el artículo que Claude intenta generar, o que el modelo no está siendo instruido a ajustar la longitud al espacio disponible.

### 2.3. Estilo editorial: análisis

El estilo es en general bueno y consistente:
- **Tono periodístico con personalidad**: frases como "No suena a frase de promo. Suena a deuda saldada" o "Una ficción que nació como guion en 2017, se convirtió en libro porque nadie la quiso comprar"
- **Uso de negritas** para nombres propios: correcto y consistente
- **Estructura**: titular H1 + desarrollo narrativo sin subtítulos intermedios
- **Ritmo**: frases cortas alternas con desarrollo, buena cadencia

**Posibles problemas de estilo:**
- Tendencia a frases excesivamente sentenciosas: "Eso cambia todo", "Otra cosa", "Otro mundo". Puede resultar repetitivo en un sitio con muchos artículos publicados.
- Abuso del recurso de la frase corta como remate de párrafo
- Expresiones que podrían considerarse "de relleno": "Hay un dato que pesa sobre todo el proyecto", "Conviene empezar por ahí"

### 2.4. Datos del prompt no utilizados

En el prompt de redacción aparece un bloque extenso sobre 'Se tiene que morir mucha gente' (Anna Castillo, Macarena García, Laura Weissmahr, Victoria Martín, Amaral, etc.) que parece ser **contexto de referencia** de artículos recientes del sitio. Este bloque se repite idénticamente en todos los prompts de redacción mostrados, lo que sugiere que es un ejemplo de estilo/tono inyectado como few-shot.

El modelo lo usa bien como referencia tonal pero **a veces parece confundirlo con información de la noticia actual**, especialmente cuando la nota de prensa original no es visible.

### 2.5. Artículo 20 (Rafa Nadal): serie vs. docuserie

El artículo se redactó correctamente como docuserie, pero esto contradice la clasificación, que debería haberlo marcado como irrelevante si el criterio editorial excluye documentales. Hay incoherencia sistémica.

### 2.6. Artículo 9 (Aquí no hay quien viva / Sofía Nieto)

Buen artículo, bien documentado. Pero incluye el dato "Hoy tiene 43, no tiene redes sociales, vive en Santurtzi y da clases de matemáticas a adolescentes" — si estos datos no están en la fuente original, son invención. También "Premio Extraordinario de Fin de Carrera", "entre 2010 y 2016 ejerció como profesora ayudante". Datos muy específicos que necesitan verificación.

### 2.7. Titulares

Los titulares son en general buenos:
- Informativos y con gancho
- Usan comillas simples para nombres de series
- Longitud adecuada

Algunas inconsistencias:
- Artículo 17: "Sevilla como escenario: todas las localizaciones..." — usa dos puntos, es más tipo reportaje que noticia
- Artículo 11: "'Mi nombre es Farah': la serie turca de Prime Video..." — el título de la noticia original era sobre 'Una nueva vida', pero el artículo habla de otra serie. Esto podría confundir al editor.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### Mejora 3.1: Definir claramente qué significa "España"

**Problema:** Series turcas emitidas en cadenas españolas (Antena 3, Nova, Divinity) se clasifican como `espana: false` porque no son "españolas" de producción.

**Propuesta (texto exacto):**
```
CAMPO "espana":
- true = la serie se emite o se va a emitir en una cadena/plataforma en España (Antena 3, La 1, Telecinco, Nova, Divinity, Atresplayer, Mitele, Movistar Plus+, Netflix España, Prime Video España, Disney+ España, HBO Max España, etc.)
- false = la serie NO se emite ni se va a emitir en España, o no hay información suficiente para determinarlo
- IMPORTANTE: las series turcas emitidas en Antena 3, Nova o Divinity son espana=true
- IMPORTANTE: las series internacionales disponibles en Netflix/HBO/Prime Video en España son espana=true si la noticia es relevante para el público español
```

**Impacto esperado:** Eliminación del error más frecuente (series turcas descartadas). Reduce drásticamente los falsos negativos.

---

### Mejora 3.2: Restringir el uso de `tipo_evento: "otro"`

**Problema:** El modelo usa `otro` como cajón de sastre, incluso para noticias que claramente encajan en categorías existentes (resumen, avance_episodio, perfil_actor, etc.).

**Propuesta (texto exacto):**
```
TIPO_EVENTO - REGLAS ESTRICTAS:
- Usa "otro" SOLO si ninguna de las categorías específicas encaja. Antes de asignar "otro", repasa mentalmente TODAS las opciones:
  · resumen → ¿habla de lo que pasó en capítulos emitidos?
  · avance_episodio → ¿adelanta qué pasará en un episodio concreto próximo?
  · avance → ¿da información general sobre lo que viene en la serie?
  · fecha_estreno → ¿anuncia cuándo se estrena o cuándo vuelve?
  · nueva_temporada → ¿confirma renovación o nueva temporada?
  · temporada_final → ¿confirma que la serie termina?
  · rodaje → ¿informa sobre grabaciones en curso?
  · perfil_actor → ¿el foco es un actor/actriz, su vida o carrera?
  · opinion → ¿es artículo de opinión, editorial o especulación de fans?
  · analisis_trama → ¿analiza personajes, relaciones o arcos argumentales?
  · recomendacion → ¿recomienda ver una serie?
  · curiosidades → ¿comparte datos curiosos o detrás de cámaras?
  · industria → ¿habla de producción, acuerdos, cifras del sector?
  · programacion → ¿habla de cambios de horario o parrilla?
  · audiencias → ¿habla de datos de audiencia?
- Si el artículo trata sobre una serie pero no encaja en ninguna categoría, usa "otro" y explica en "razon"
```

**Impacto esperado:** Reducción del 60-70% en uso incorrecto de `otro`. Mejor clasificación automática downstream.

---

### Mejora 3.3: Lista explícita de series turcas activas en España

**Problema:** El modelo no sabe qué series turcas se emiten actualmente en cadenas españolas y las descarta.

**Propuesta (texto exacto):**
```
SERIES TURCAS ACTUALMENTE EN EMISIÓN EN ESPAÑA (espana=true SIEMPRE):
- 'Una nueva vida' / 'Yalı Çapkını' (Antena 3, domingos)
- 'En tierra lejana' (Antena 3)
- 'Leyla' (Nova)
- 'Cuento de una noche' (Nova)
- '¿A qué estás esperando?' (Antena 3/Nova)
- 'Hermanos' (Antena 3/Nova)
- Cualquier serie turca mencionada junto a Antena 3, Nova, Divinity, Atresplayer → espana=true
```

**Impacto esperado:** Eliminación casi total de falsos negativos en series turcas. La lista requiere actualización periódica.

---

### Mejora 3.4: Definir qué formatos incluir además de ficción

**Problema:** Inconsistencia en el tratamiento de docuseries, realities y formatos híbridos. 'Dulceida al desnudo' descartada, 'Rafa' descartada en clasificación pero redactada.

**Propuesta (texto exacto):**
```
FORMATOS QUE SÍ SON RELEVANTES (clasificar como serie):
- Series de ficción (drama, comedia, thriller, etc.)
- Miniseries de ficción
- Docuseries con narrativa (ej: 'Rafa', 'Abandonados', 'Dulceida al desnudo')
- Realities con formato seriado si se emiten en cadenas españolas relevantes

FORMATOS QUE NO SON RELEVANTES:
- Películas de cine (salvo que sean de franquicias de series)
- Programas de entretenimiento en plató (talk shows, magacines, concursos)
- Documentales unitarios (un solo capítulo, sin formato serie)
- Informativos, deportes, eventos musicales
```

**Impacto esperado:** Reglas claras para los casos fronterizos. Reduce intervención manual del editor.

---

### Mejora 3.5: Tratar artículos con información insuficiente

**Problema:** El artículo 4 del ejemplo 1 ("La serie de thriller más extraña del año llega a España tras conquistar a la crítica") fue descartado porque no identifica la serie. Pero el título dice "llega a España", lo que sugiere relevancia.

**Propuesta (texto exacto):**
```
INFORMACIÓN INSUFICIENTE:
- Si el título menciona una serie que "llega a España" o se emitirá en una plataforma española, pero no identificas el nombre concreto: clasifica como espana=true y tipo_evento="otro", con razon="Serie no identificada, posiblemente relevante".
- NO descartes automáticamente artículos solo porque no puedes identificar la serie. Si el contexto sugiere relevancia para España, marca espana=true para que el editor lo revise.
```

**Impacto esperado:** Reduce falsos negativos en artículos con títulos clickbait que no nombran la serie.

---

### Mejora 3.6: Separar `espana` de la relevancia editorial

**Problema:** El campo `espana` se usa tanto para "producción española" como para "irrelevante". Artículos de videojuegos reciben `espana: false` cuando deberían recibir `espana: null` (no aplica).

**Propuesta (texto exacto):**
```
CAMPO "espana" SOLO SE APLICA A SERIES:
- Si el artículo NO es sobre una serie (película, videojuego, música, política, etc.): espana=null
- Si el artículo ES sobre una serie: espana=true/false según se emita en España
- NUNCA uses espana=false para indicar que algo no es relevante. Para eso está el campo "razon".
```

**Impacto esperado:** Datos más limpios. Permite filtrar

2026-05-13 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Películas clasificadas como series
**Ejemplo 7, artículo 4**: "Ni contigo ni sin mí" es una película (comedia con Gorka Otxoa, Adrián Lastra). Claude la clasifica con `tipo_evento: "fecha_estreno"` y `espana: true`, como si fuera una serie. Incluso el propio Claude anotó en la razón: "película española con fecha de estreno confirmada, **no serie**", pero aun así no la marcó como irrelevante. El sistema está diseñado para series de televisión; las películas deberían filtrarse.

### 1.2. Series turcas emitidas en España marcadas como `espana: false` o sin serie
En la lista de "artículos mal clasificados" hay varios casos evidentes:
- **"En tierra lejana"**: serie turca emitida en Antena 3, debería ser `espana: true` (se emite en España).
- **"Mi otra yo"**: serie turca en Netflix disponible en España.
- **"Hermanos"** (Nova apuesta por nueva novela turca con protagonista de 'Hermanos'): debería ser `espana: true`.
- **"En tierra lejana" (cuántos capítulos)**: información práctica sobre serie emitida en Antena 3.

El patrón es claro: **Claude confunde "serie no española" (origen) con "serie que no se emite en España"**. El campo `espana` debería indicar si se emite/está disponible en España, no el país de producción.

### 1.3. Docuseries y documentales rechazados sistemáticamente
**Ejemplo 5**: "Seekers" se descarta como "docuserie, no ficción narrativa". Pero en los ejemplos de corrección del prompt, **'Abandonados'** (serie documental de Carles Porta en Disney+) tiene tipo correcto `fecha_estreno`, no N/A. Claude aplica un criterio inconsistente: unas docuseries las acepta y otras las rechaza.

**Ejemplo 1, artículo 1**: "Outlander" en Movistar Plus se clasifica correctamente como `temporada_final`, pero el criterio de "ficción narrativa" es arbitrario cuando se aplica a docuseries españolas que sí interesan editorialmente.

### 1.4. Programas de entretenimiento con filtros demasiado amplios
**Ejemplo 3, artículo 6**: "Noche en familia" (Bertín Osborne) se descarta correctamente, pero el filtro sugerido `"bertín osborne"` bloquearía cualquier noticia futura donde Bertín aparezca en una serie de ficción (improbable pero posible). Más grave: filtrar `"la sexta"` (ejemplo 3, artículo 1) bloquearía noticias sobre series emitidas en La Sexta.

### 1.5. Artículos recuperados manualmente: fallos graves
De la lista de 17 artículos mal clasificados:
- **"Nueve Reinas"** (3 noticias): serie española de Netflix con Álvaro Morte y Patrick Criado. Tres noticias distintas sobre la misma serie fueron rechazadas. Esto es un fallo crítico.
- **"Sueños de libertad"** (avance de reencuentro): serie diaria de Antena 3, núcleo del contenido del sitio.
- **"Barrio Esperanza"** (acampada inclusiva): serie de La 1 activa.
- **"Anatomía de un instante"** y **"El Eternauta"** en Premios Platino: noticias de premios con series españolas implicadas.
- **"Dulceida al desnudo"**: serie documental en Divinity, rechazada probablemente por ser documental.
- **"The Resident"** en Divinity: serie emitida en canal español.
- **"María Castro / La Promesa"**: entrevista a actriz de serie española core.

### 1.6. `espana: false` mal aplicado a noticias irrelevantes
**Ejemplos 1, 3, 7**: Noticias sobre programas españoles de entretenimiento (Sálvame, Chicote, Telemadrid) se marcan con `espana: false`. El campo `espana` debería indicar si el contenido es español, independientemente de si es relevante. Lo correcto sería `espana: true` + `tipo_evento: "N/A"` (irrelevante). El campo `espana` se usa luego para clasificar en `no_espana`, y estas noticias no deberían ir a esa categoría.

### 1.7. Filtros que sugiere Claude pueden ser contraproducentes
- `"tve"`: bloquearía noticias sobre series de TVE (La Promesa, Barrio Esperanza).
- `"la sexta"`: bloquearía series de La Sexta.
- `"antena 3"` (en contexto de concursos): podría bloquear noticias sobre series de Antena 3.
- `"alberto chicote"`: aceptable, pero `"servicio secreto"` podría coincidir con una serie futura.

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Truncamiento sistemático
Prácticamente todos los artículos están cortados a mitad de frase:
- **Artículo 1**: "...una operación obsesi" (truncado)
- **Artículo 3**: "España no se fu" (truncado)
- **Artículo 4**: "Nova lleva tiempo constru" (truncado)
- **Artículo 5**: "Hay parejas de ficción que" (truncado)
- **Artículo 6**: "Adem" (truncado)
- **Artículo 8**: "La solución no pasa" (truncado)
- **Artículo 9**: "...la policía irrumpió con las ar" (truncado)
- **Artículos 11, 12, 13, 15, 16, 17, 18, 19**: todos truncados.

Esto indica que el parámetro `max_tokens` es insuficiente o que no hay instrucción de ajustar la extensión al límite disponible. El modelo no sabe cuántos tokens tiene y no cierra los artículos antes de agotarlos.

### 2.2. Invención de datos no presentes en el prompt
**Artículo 1 (Buscametales)**: El prompt no contiene información sobre "Buscametales". Todo el contenido del artículo (teaser, comentario de Fernando Cayo, detalles del proyecto) parece inventado o inferido de conocimiento del modelo. No hay fuente en el prompt.

**Artículo 5 (Marco Cáceres)**: El prompt solo dice "ARTICULO SOBRE Marco Cáceres QUE EL MARTES VA A EL HORMIGUERO. PRESENCIA EN SERIES, PAPELES IMPORTANTES, CURIOSIDADES..." — todo el contenido sobre 'La chica de nieve', cifras de audiencia, citas textuales de Cáceres, son generadas por el modelo sin fuente verificable.

**Artículo 6 (Aquí no hay quien viva)**: Cifras muy específicas ("8.300.000 espectadores", "43,1% de cuota", "10.000.000 de telespectadores"). Si provienen del conocimiento del modelo, pueden ser correctas pero no verificables. Si se inventan, es un problema grave.

**Artículo 8 (Regreso a las Sabinas)**: Datos de audiencia muy granulares (40.000 espectadores, 0,5% cuota, 18.000-79.000 espectadores). La fuente del artículo debería proporcionar estos datos; si no lo hace, Claude los está fabricando.

**Artículo 17 (La Reina del Sur)**: Nombres de actores del reparto, título provisional "La Reina del Sur IV: el origen", detalles sobre el guionista Pablo Illanes. No hay fuente clara en el prompt mostrado.

### 2.3. El prompt de contexto es idéntico para todos los artículos
Todos los artículos reciben como contexto la misma información sobre 'Se tiene que morir mucha gente' (Victoria Martín, Amaral, Movistar Plus+). Este contexto parece ser un ejemplo fijo o un artículo anterior que se inyecta como modelo de estilo. El problema es que **no se proporciona la noticia fuente** de forma visible en los fragmentos mostrados, lo que sugiere que el contenido real de la noticia se pasa en otra parte del prompt o que Claude genera desde el título solo.

### 2.4. Estilo y tono
El estilo es generalmente bueno: directo, periodístico, con gancho. Usa negritas para nombres de actores/actrices. Tiene buen ritmo narrativo. Sin embargo:

- **Frases excesivamente largas**: Artículo 9 tiene párrafos muy densos con muchos eventos encadenados.
- **Repetición de fórmulas**: "No es poca cosa", "Todo apunta a", "Lo que queda claro es", "Toca esperar", "Habrá que estar atentos" aparecen como muletillas recurrentes.
- **"Habrá que estar atentos"**: Esta expresión aparece en el artículo 7 y es un cliché periodístico vacío. Debería evitarse.

### 2.5. Artículos demasiado cortos vs. demasiado largos
- **Artículo 7 (Berlín/Guadalquivir)**: Excesivamente corto (4 párrafos breves). Se nota que no había información suficiente y Claude estiró lo poco que tenía.
- **Artículo 14 (Eva & Nicole v1)**: También corto (4 párrafos), pero el artículo 15 sobre el mismo tema es mucho más completo. Parece que se generó dos veces con resultados muy diferentes.
- **Artículos 1, 2 (Buscametales)**: Dos versiones del mismo artículo, ambas largas y detalladas pero con contenido potencialmente inventado.

### 2.6. Falta de instrucción sobre extensión objetivo
No hay indicación clara de cuántas palabras o párrafos debe tener el artículo. Esto causa que algunos sean de 4 párrafos y otros de 15+, sin criterio visible.

### 2.7. Doble generación del mismo artículo
Los artículos 1-2 (Buscametales) y 14-15 (Eva & Nicole) son versiones duplicadas. Esto sugiere un problema en el flujo de trabajo, no en el prompt per se, pero el prompt podría incluir una instrucción para gestionar regeneraciones.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### 3.1. Clarificar el significado de `espana`

**Problema**: Claude interpreta `espana` como "la serie es de producción española", cuando debería significar "la serie se emite o está disponible en España". Series turcas en Antena 3/Nova, series americanas en Divinity/Movistar, y series internacionales en Netflix España se marcan incorrectamente como `espana: false`.

**Propuesta** (texto exacto para añadir al prompt):
```
IMPORTANTE sobre el campo "espana":
- "espana": true → la serie se EMITE o ESTÁ DISPONIBLE en España (en cualquier cadena, plataforma o TDT española), independientemente de su país de producción original.
- "espana": false → la serie NO se emite ni está disponible en España.
- Series turcas en Antena 3, Nova, Divinity → espana: true
- Series de Netflix, HBO Max, Disney+, Movistar Plus+, Prime Video disponibles en España → espana: true
- Series americanas/internacionales emitidas en canales españoles (Divinity, Nova, FDF, etc.) → espana: true
- Solo marcar espana: false si la serie se emite exclusivamente fuera de España (cadenas latinoamericanas sin presencia en España, canales extranjeros sin emisión española).
```

**Impacto esperado**: Eliminación de falsos negativos en series turcas (En tierra lejana, Hermanos, Mi otra yo), series americanas en TDT (The Resident en Divinity) y series internacionales en plataformas (The Big Bang Theory spin-off en HBO Max).

### 3.2. Distinguir películas de series

**Problema**: "Ni contigo ni sin mí" (película) se clasifica como si fuera una serie con `fecha_estreno`. No hay instrucción que diga que el sistema solo cubre series.

**Propuesta**:
```
ALCANCE: Este sistema cubre SOLO series de televisión (ficción, docuseries, miniseries). NO cubre:
- Películas (largometrajes para cine o plataformas). Si la noticia es sobre una PELÍCULA, marca tipo_evento: "N/A", espana: false, y en razon indica "película, no serie".
- Programas de entretenimiento, concursos, realities, talent shows, magacines, informativos.
- Videojuegos, teatro, música, eventos deportivos.
```

**Impacto esperado**: Las películas dejarán de mezclarse con las series en la clasificación.

### 3.3. Aceptar docuseries emitidas en España

**Problema**: Claude rechaza docuseries inconsistentemente. "Abandonados" (Carles Porta, Disney+) se marca como `fecha_estreno` en los ejemplos de corrección, pero "Seekers" (docuserie internacional) y "Dulceida al desnudo" se rechazan.

**Propuesta**:
```
DOCUSERIES Y SERIES DOCUMENTALES:
- Si la docuserie se emite en una plataforma o cadena española → SÍ clasificar como serie (espana: true).
- Solo rechazar docuseries si no tienen emisión en España O si son documentales puntuales (no seriados).
- Ejemplos que SÍ son válidos: 'Abandonados' (Disney+), 'Dulceida al desnudo' (Divinity), docuseries de producción española.
```

**Impacto esperado**: Se recuperarán docuseries españolas y docuseries emitidas en plataformas españolas.

### 3.4. No usar `espana: false` para contenido irrelevante español

**Problema**: Noticias sobre programas españoles no ficcionales (Sálvame, Chicote, Telemadrid) se marcan con `espana: false`, lo que las enviaría a la categoría `no_espana` cuando deberían ir a `irrelevantes`.

**Propuesta**:
```
CAMPO "espana" EN CONTENIDO NO FICCIONAL:
- Si la noticia NO es sobre una serie pero el contenido es español (programas de TV, concursos, eventos españoles), marca espana: true y tipo_evento: "N/A".
- El campo espana indica el PAÍS del contenido, no si es relevante.
- La irrelevancia se determina por tipo_evento: "N/A", no por espana: false.
```

**Impacto esperado**: Separación correcta entre "no es de España" e "irrelevante". Mejora en la categorización downstream.

### 3.5. Evitar filtros que coincidan con cadenas/canales

**Problema**: Claude sugiere filtros como `"tve"`, `"la sexta"`, `"antena 3"` en el contexto de noticias irrelevantes. Estos filtros bloquearían noticias legítimas sobre series emitidas en esas cadenas.

**Propuesta**:
```
REGLAS PARA FILTROS:
- NUNCA sugerir como filtro nombres de cadenas o plataformas: "tve", "rtve", "la 1", "la sexta", "antena 3", "telecinco", "cuatro", "divinity", "nova", "netflix", "hbo", "movistar", "disney+", "prime video", etc.
- NUNCA sugerir filtros genéricos que puedan coincidir con series futuras.
- Los filtros deben ser ESPECÍFICOS: nombre completo del programa no ficcional, nombre de persona no relacionada con series, combinaciones únicas.
- Buenos filtros: "pesadilla en la cocina", "el hormiguero", "supervivientes 2026"
- Malos filtros: "la sexta", "tve", "antena 3"
```

**Impacto esperado**: Eliminación de filtros que bloquean contenido legítimo. Reducción drástica de falsos positivos en el sistema de bloqueo.

### 3.6. Mejorar detección de series españolas conocidas

**Problema**: Series core del sitio (La Promesa, Sueños de libertad, Barrio Esperanza) aparecen en la lista de artículos mal clasificados. Esto es un fallo crítico.

**Propuesta**:
```
SERIES PRIORITARIAS (NUNCA rechazar noticias sobre estas series):
- La Promesa (La 1)
- Sueños de libertad (Antena 3)
- Valle Salvaje (La 1)
- Barrio Esperanza (La 1)
- Una nueva vida (Antena 3, turca)
- En tierra lejana (Antena 3, turca)
- Regreso a las Sabinas (Divinity/Disney+)
- Hermanos (Antena 3/Nova, turca)

Si una noticia menciona alguna de estas series, SIEMPRE clasificar como espana: true con el tipo_evento correspondiente, sin importar el ángulo de la noticia (avance, entrevista, perfil de actor, opinion, datos, etc.).
```

**Impacto esperado**: Eliminación de los falsos negativos más dañinos. Las series core nunca serán rechazadas.

### 3.7. Ampliar los tipos de evento reconocidos

**Problema**: Muchos artículos que deberían clasificarse con tipos específicos caen en "otro" o "N/A". Los ejemplos de corrección en el prompt muestran una lista amplia de tipos (`rodaje`, `entrevista`, `perfil_actor`, `opinion`, `analisis_trama`, `recomendacion`, `programacion`, `premio`, `casting`) pero Claude sigue usando "otro" con frecuencia.

**Propuesta**:
```
TIPOS DE EVENTO (usa SIEMPRE el más específico posible, evita "otro"):
- fecha_estreno: se anuncia fecha concreta de estreno
- nueva_temporada: se confirma nueva temporada sin fecha
- temporada_final: se confirma que será la última temporada
- rodaje: noticias sobre inicio, desarrollo o fin de rodaje
- casting: fichajes, incorporaciones o salidas del reparto
- avance: información general sobre lo que vendrá en la serie
- avance_episodio: adelanto específico de un episodio concreto
- resumen: resumen de episodios ya emitidos
- entrevista: entrevista a actor/actriz/creador sobre la serie
- perfil_actor: artículo sobre la carrera de un actor vinculado a una serie
- opinion: artículo de opinión o análisis editorial sobre la serie
- analisis_trama: análisis de tr

2026-05-06 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Series españolas clasificadas como no españolas (ERROR CRÍTICO)

El error más grave y recurrente es clasificar series españolas o con emisión relevante en España como `"espana": false`, enviándolas a la categoría `no_espana` cuando deberían ser `pendientes`.

**Ejemplo 6, Artículo 1 — "El verano en que me enamoré":**
Se clasificó como `"espana": false` con razón "Serie extranjera, noticia sobre rodaje sin mención a España". Sin embargo, 'El verano en que me enamoré' es una serie de **Prime Video** disponible en España y basada en la novela de la autora española **Jenny Han** adaptada al mercado latino/español. La noticia trata sobre el rodaje y la plataforma pidiendo privacidad. Debería haber sido `pendientes`.

**Artículos mal clasificados confirmados por el editor:**
- **"La novela turca en español de Cansu Dere que más se parece a 'En tierra lejana'"**: La serie 'En tierra lejana' se emite en Antena 3 España. Clasificada incorrectamente como no relevante cuando es una serie turca emitida en España (patrón habitual del sitio).
- **"Nueve Reinas" (3 artículos diferentes)**: Serie española de Netflix con Álvaro Morte y Patrick Criado, rodada en Madrid. Tres noticias distintas sobre la misma serie fueron mal clasificadas, lo que indica un fallo sistemático, no puntual.
- **"María Castro ('La Promesa') desvela un detalle inédito de su casting"**: 'La Promesa' es una de las series españolas más cubiertas del sitio. Fue clasificada incorrectamente.
- **"'Sueños de libertad' calienta el reencuentro más esperado"**: Serie diaria española de Antena 3, también mal clasificada.
- **"HBO Max estrenará el tercer spin-off de 'The Big Bang Theory'"**: Aunque no es española, se estrena en HBO Max España, lo que la hace relevante para el sitio.

### 1.2. Confusión entre series de ficción y documentales/docuseries

**Ejemplo 3, Artículo 4 — "Pyjamada":**
Correctamente descartada como docurreality. Sin embargo, en el Ejemplo de redacción 15, 'Abandonados' (serie documental de Carles Porta en Disney+) SÍ fue aceptada para redacción. El criterio es inconsistente: ¿se cubren docuseries o no?

**Ejemplo 2, Artículo 1 — "Sidosa":**
Clasificada como `nuevo_estreno` de serie española. Pero 'Sidosa' es un documental, no una serie de ficción. En la redacción (Artículo 18) se trata correctamente como documental. La clasificación debería haber detectado esto.

### 1.3. `tipo_evento` incorrecto o inconsistente

**Ejemplo 3, Artículo 2 — "System":**
Clasificada como `fecha_estreno` con razón "Anuncia llegada a España en Prime Video con fecha implícita". Pero el título dice "lanzará", no da fecha concreta. Debería ser `nuevo_estreno` o `avance`.

**Ejemplo 7, Artículo 1 — "¿A qué estás esperando?":**
Clasificada como `nuevo_estreno`. Pero el título dice "estrena el **tercer capítulo**", no es un estreno nuevo de serie. Debería ser `avance_episodio`.

### 1.4. El campo `espana: false` se usa como cajón de sastre para "irrelevante"

En múltiples ejemplos, artículos que no son series (películas, podcasts, conciertos, música) se clasifican con `"espana": false`. Esto es semánticamente incorrecto: no son "no españolas", son "no series de ficción". El campo `espana` debería reflejar el país, no la relevancia temática.

**Ejemplos:** Ejemplo 1 (los 3 artículos), Ejemplo 4 (artículos 2, 3, 4), Ejemplo 6 (artículos 3, 4, 5, 6, 7), Ejemplo 8 (artículos 2, 3, 4).

### 1.5. Series turcas emitidas en España no se reconocen como relevantes

El sitio cubre activamente series turcas emitidas en cadenas españolas ('En tierra lejana', 'Una nueva vida'). Sin embargo, la clasificación tiende a marcarlas como extranjeras. Los ejemplos de corrección del prompt ya incluyen casos de series turcas, pero el modelo sigue fallando con noticias relacionadas.

### 1.6. Filtros propuestos de baja utilidad

En varios casos, los filtros sugeridos son demasiado genéricos para ser útiles como palabras clave de bloqueo:
- `"cines"`, `"película"`, `"musica"` → demasiado amplios, podrían bloquear noticias legítimas
- `"disney"` → bloquearía noticias de Disney+ sobre series
- `"antena 3"` → bloquearía noticias de series de Antena 3

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Artículos cortados a mitad de frase (PROBLEMA SISTÉMICO)

Prácticamente TODOS los artículos generados terminan a mitad de frase o párrafo:

- **Artículo 1:** "...La produce Diagonal, del grupo Banijay Iberia," (corte abrupto)
- **Artículo 2:** "...los tres coo" (corte a mitad de palabra)
- **Artículo 3:** "...los tres coo" (idéntico corte)
- **Artículo 6:** "...David Ulloa y Rafa Montesinos rep" (corte a mitad de palabra)
- **Artículo 7:** "...infiltrarse en el círculo de lo" (corte)
- **Artículo 13:** "...comparaciones c" (corte)
- **Artículo 14:** "...El e" (corte a dos letras del final)

Esto indica que el límite de tokens de salida es insuficiente o que no hay instrucción para que el modelo gestione la longitud y cierre el artículo antes de llegar al límite.

### 2.2. Artículos duplicados con títulos/series vacíos

Los artículos 2-3-4 son **tres versiones del mismo artículo** sobre 'Todo lo necesario' pero con campos Serie y Título vacíos. Esto sugiere un problema en el pipeline: se envía el mismo contenido varias veces o no se asigna correctamente la metadata.

Los artículos 9-10 son también **dos versiones del mismo artículo** sobre 'Rivales a doble juego' con campos vacíos.

### 2.3. El contexto del prompt contamina la redacción

**Problema grave:** El fragmento del prompt visible en los ejemplos de redacción es siempre sobre 'El mapa de los anhelos' (la novela de Alice Kellen en Netflix), pero los artículos generados son sobre series completamente diferentes. Esto sugiere que el "contexto editorial" que se inyecta como ejemplo de estilo es un artículo fijo que no cambia. No parece causar contaminación en el contenido final (Claude ignora correctamente ese contexto para escribir sobre la serie correcta), pero:
- Desperdicia tokens del prompt
- Podría en algún caso confundir al modelo si hay coincidencias temáticas

### 2.4. Uso correcto del estilo editorial

Los artículos SÍ mantienen un estilo consistente y reconocible:
- ✅ Tono directo, periodístico pero con personalidad
- ✅ Uso de negritas para nombres propios relevantes
- ✅ Frases cortas y párrafos concisos
- ✅ Opinión editorial integrada sin ser prepotente
- ✅ Datos concretos (fechas, cifras, nombres completos)
- ✅ Apertura con el dato más importante
- ✅ Citas textuales bien integradas

### 2.5. Posible invención de datos

No puedo verificar con certeza si todos los datos son reales, pero hay indicios de que el modelo añade información no presente en el prompt visible:

- **Artículo 13 (Harry Potter):** Incluye datos extremadamente específicos (32.000 aspirantes al casting, 11 millones de visitas del tráiler, nombres completos de todo el reparto con sus papeles). Esto podría venir del contenido de la noticia original (no visible en el fragmento del prompt que vemos) o del conocimiento del modelo.
- **Artículo 17 (En tierra lejana):** Contiene un resumen detallado de la trama semanal que parece provenir de una fuente específica de contenido (adelantos semanales).

### 2.6. Títulos SEO bien construidos

Los títulos de los artículos generados son generalmente buenos:
- Informativos sin ser clickbait
- Incluyen el nombre de la serie
- Incorporan el gancho noticioso

Sin embargo, algunos son demasiado largos para SEO óptimo:
- "La serie de 'Harry Potter' ya tiene fecha de estreno: Navidad de 2026 en HBO Max" (75 caracteres, aceptable)
- "'Rivales a doble juego': la versión en español del drama gay 'Más que rivales' cambia el hockey por el fútbol" (111 caracteres, demasiado largo)

### 2.7. Los artículos no tienen cierre/conclusión

Más allá del corte por tokens, incluso los artículos que llegan más lejos no tienen un párrafo de cierre definido. El modelo escribe linealmente sin planificar un final. No hay señal de que se le pida cerrar con un dato clave, una fecha de estreno o un resumen.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### Mejora 3.1: Definir explícitamente el alcance geográfico del sitio

**Problema:** Series emitidas en España (turcas, latinas, adaptaciones) se clasifican como `no_espana` porque no son producciones españolas. El modelo confunde "serie española" con "serie relevante para España".

**Propuesta (texto exacto para añadir al prompt):**

```
REGLA CRÍTICA SOBRE "espana":
- "espana": true significa que la serie se emite, estrena o está disponible en España, NO que sea producción española.
- Series turcas emitidas en Antena 3, Telecinco o Divinity (ej: 'En tierra lejana', 'Una nueva vida', 'Infiel', 'Madre') → espana: true
- Series de Netflix, Prime Video, Disney+, HBO Max, Movistar Plus+, atresplayer → espana: true (todas estas plataformas operan en España)
- Series latinas en Vix/atresplayer, Univisión → espana: true si se confirma distribución en España
- SOLO marca espana: false si la serie NO tiene emisión confirmada ni prevista en España (ej: serie de CBS sin plataforma española, serie de canal local extranjero)
```

**Impacto esperado:** Eliminación del error más grave (series como 'Nueve Reinas', 'En tierra lejana', 'Sueños de libertad' dejaron de perderse). Reduce recuperaciones manuales del editor en un ~60%.

### Mejora 3.2: Lista explícita de series actualmente cubiertas por el sitio

**Problema:** Series como 'La Promesa', 'Sueños de libertad', 'Valle Salvaje', 'En tierra lejana' son cubiertas activamente, pero el modelo no lo sabe y clasifica noticias sobre ellas como irrelevantes.

**Propuesta (texto exacto):**

```
SERIES ACTIVAMENTE CUBIERTAS POR EL SITIO (clasificar siempre como espana: true):
Dailies/Diarias: La Promesa, Sueños de libertad, Valle Salvaje, En tierra lejana, Una nueva vida
Semanales: Barrio Esperanza, ¿A qué estás esperando?
Recientes: Cochinas, Sidosa, El Inmortal, Regreso a Las Sabinas
Plataformas: Cualquier serie de Netflix España, Prime Video España, HBO Max España, Disney+ España, Movistar Plus+, atresplayer

Si una noticia menciona alguna de estas series, NUNCA la clasifiques como no_espana ni irrelevante.
```

**Impacto esperado:** Cero falsos negativos en series que el sitio ya cubre. Elimina el caso de 'Sueños de libertad' y 'La Promesa' mal clasificadas.

### Mejora 3.3: Separar "irrelevante" de "no es serie"

**Problema:** El campo `espana: false` se usa para marcar contenido que no es serie de ficción (películas, podcasts, música), lo que corrompe el significado del campo y dificulta el análisis posterior.

**Propuesta (texto exacto):**

```
IMPORTANTE: El campo "espana" SOLO indica si el contenido tiene relevancia para el mercado español.
- Si el artículo NO es sobre una serie de ficción (película, podcast, concurso, música, evento), usa tipo_evento: "no_serie" y espana: false.
- Si el artículo es sobre una serie pero NO se emite en España, usa espana: false con el tipo_evento correcto.
- NUNCA uses espana: false como sinónimo de "irrelevante". Son conceptos distintos.
```

**Impacto esperado:** Clasificación más limpia, mejor análisis de datos, menos confusión en la lógica downstream.

### Mejora 3.4: Instrucción explícita sobre filtros propuestos

**Problema:** Los filtros sugeridos incluyen términos demasiado genéricos (`"disney"`, `"antena 3"`, `"cines"`) que bloquearían noticias legítimas.

**Propuesta (texto exacto):**

```
REGLAS PARA FILTROS SUGERIDOS:
- Solo sugiere filtros para contenido que NUNCA será relevante (bandas de música, políticos, deportes, etc.)
- NUNCA sugieras como filtro: nombres de cadenas (antena 3, telecinco, la 1, lasexta), plataformas (netflix, disney, hbo, prime video, movistar), géneros (cine, película, documental) ni formatos (serie, ficción)
- Los filtros deben ser específicos: nombre del programa/película + rasgo identificativo (ej: "torrente pelicula", "the floor concurso")
- Si no hay filtros seguros que sugerir, devuelve filtros: []
```

**Impacto esperado:** Evita que el sistema de bloqueo automático elimine noticias legítimas sobre series.

### Mejora 3.5: Clarificar el tratamiento de adaptaciones y spin-offs internacionales

**Problema:** La adaptación turca de 'Vis a vis' se clasificó como `no_espana`, pero podría ser relevante si se va a emitir en España. Series internacionales basadas en formatos españoles o que llegan a plataformas españolas necesitan un criterio claro.

**Propuesta (texto exacto):**

```
ADAPTACIONES Y SPIN-OFFS:
- Adaptación extranjera de serie española SIN emisión en España → espana: false, tipo_evento: industria
- Adaptación extranjera de serie española CON emisión prevista en España → espana: true
- Spin-off internacional (ej: NCIS nuevo spin-off) → espana: false SALVO que se confirme plataforma española
- En caso de duda sobre si llegará a España, clasifica como espana: true (es mejor que el editor descarte que perder una noticia)
```

**Impacto esperado:** Reduce el principal dolor del editor (recuperar manualmente noticias que sí eran relevantes).

### Mejora 3.6: Añadir regla sobre documentales y docuseries

**Problema:** Inconsistencia entre rechazar 'Pyjamada' (docurreality) pero aceptar 'Sidosa' (documental) y 'Abandonados' (docuserie).

**Propuesta (texto exacto):**

```
DOCUMENTALES Y DOCUSERIES:
- Docuseries sobre temas de interés editorial (true crime, personajes del mundo de las series, temas sociales relevantes) → SÍ clasificar como serie relevante
- Docurreality/reality shows (dating shows, talent shows, convivencia) → NO son series de ficción → tipo_evento: "no_serie"
- Si el documental está producido por una plataforma de series (Movistar Plus+, Netflix, Disney+, atresplayer) y tiene formato seriado → SÍ clasificar
```

**Impacto esperado:** Criterio consistente para documentales. Evita perder docuseries como 'Abandonados' o 'Sidosa'.

### Mejora 3.7: Regla de seguridad "ante la duda, pendiente"

**Problema:** El modelo tiende a descartar en caso de duda. El coste de un falso negativo (perder una noticia relevante que el editor tiene que recuperar manualmente) es mucho mayor que el de un falso positivo (el editor descarta rápidamente una noticia irrelevante).

**Propuesta (texto exacto):**

```
REGLA DE ORO: Ante la duda, clasifica como espana: true.
Es preferible que el editor descarte manualmente una noticia irrelevante a que se pierda una noticia relevante.
Si no estás seguro de si una serie se emite en España, asume que sí.
Si no estás seguro de si un contenido es serie de ficción o documental, asume que sí.
```

**Impacto esperado:** Reducción drástica de falsos negativos. El editor revisará algunas noticias extra pero no perderá las importantes.

---

## 4. MEJORAS AL PROMPT DE REDACCIÓN

### Mejora 4.1: Gestión obligatoria de la longitud y cierre del artículo

**Problema:** Todos los artículos se cortan a mitad de frase porque el modelo no planifica la extensión ni prioriza un cierre.

**Propuesta (texto exacto para añadir al prompt):**

```
LONGITUD Y ESTRUCTURA OBLIGATORIAS:
- El artículo debe tener entre 350 y 500 palabras. NUNCA más de 500 palabras.
- SIEMPRE termina con un párrafo de cierre completo. Nunca dejes una frase a medias.
- Estructura recomendada:
  1. Titular (1 línea con #)
  2. Párrafo de apertura con el dato más importante (2-3 frases)
  3. Desarrollo (3-5 párrafos con datos, nombres, contexto)
  4. Párrafo de cierre (fecha de estre

2026-04-29 12:02


## 1. PROBLEMAS EN CLASIFICACIÓN

### 1.1. Series españolas clasificadas como no españolas o irrelevantes

Los 4 artículos mal clasificados revelan el problema más grave:

- **'Nueve Reinas'** (3 artículos rechazados): Serie de Netflix con Álvaro Morte y Patrick Criado, rodada en Madrid. Es claramente una serie española. El sistema probablemente la confundió con la película argentina de 2000 del mismo nombre y la clasificó como `no_espana` o `irrelevantes`. Esto es un fallo crítico: Claude está priorizando el conocimiento de su training data (la película argentina) sobre la información concreta del artículo (Netflix, rodaje en Madrid, actores españoles).

- **'En tierra lejana'**: Serie turca emitida en España. El artículo de culturaenserie.com la compara con una novela turca, pero el editor la quiere cubierta. Esto sugiere que las series turcas emitidas en cadenas españolas (Divinity, Antena 3, etc.) SÍ son relevantes para el sitio, algo que Claude no tiene claro.

### 1.2. Confusión en `tipo_evento`

Las correcciones del editor muestran un patrón recurrente:

- Claude clasifica como `otro` cosas que deberían ser `cancelacion`, `critica`, `audiencias` o `casting`.
- El caso de "Antena 3 dispara su ficción tras Semana Santa" fue corregido **4 veces** alternando entre `audiencias`, `entrevista` y `otro`, lo que indica que incluso el editor tuvo dudas, pero la tendencia final es `audiencias`.
- "Lista de actores y personajes de 'La casa de los espíritus'" debía ser `casting`, no `otro`. Claude no asocia "lista de actores y personajes" / "quién es quién" con casting.

### 1.3. Filtros demasiado genéricos

En el Ejemplo 2, los filtros propuestos son `["hormiguero", "macarena", "trastorno"]`. "Macarena" bloquearía cualquier noticia sobre Macarena García u otra actriz llamada Macarena en series españolas. Los filtros deberían ser más específicos o combinados.

### 1.4. Velvet clasificada con `espana: true` pero sin acción clara

En el Ejemplo 5, el artículo de Velvet se clasifica como serie española (correcto) con `tipo_evento: "otro"`, pero no se indica si es `pendientes` o `irrelevantes`. Un artículo nostálgico sobre un romance de actores en una serie antigua probablemente debería ser irrelevante, pero la clasificación no lo deja claro.

### 1.5. True crime descartado como "no ficción"

En el Ejemplo 9, Carles Porta se descarta como "documental true crime, no serie de ficción" con `espana: false`. Sin embargo, es contenido de Movistar Plus+ y el editor podría considerarlo relevante. Además, `espana: false` es incorrecto: Carles Porta es un productor catalán y se emite en una plataforma española.

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### 2.1. Artículos cortados a mitad de frase

Los artículos 1, 3, 4, 5 y 6 terminan a mitad de párrafo:
- Artículo 1: "Ese reg..." (cortado)
- Artículo 3: "Se pr..." (cortado)
- Artículo 4: "...una image..." (cortado)
- Artículo 5: "No hablamos de c..." (cortado)
- Artículo 6: "...no parece puesta ahí" (posiblemente cortado también)

Esto indica que el **límite de tokens de salida** es insuficiente para artículos de 500-700 palabras, o que Claude no está calibrando bien la extensión para terminar dentro del límite.

### 2.2. Datos del prompt no utilizados completamente

**Artículo 1 (Regreso a las Sabinas):** El prompt contenía descripciones detalladas de personajes (Esther, Tano, Miguel, Gracia) con sus motivaciones y conflictos. El artículo generado empieza a cubrir esto pero se corta antes de llegar a la guía de personajes que el propio titular promete ("Guía de personajes y reparto"). Es decir, el titular promete algo que el cuerpo no entrega.

**Artículo 4 (Najwa Nimri / Respira):** El prompt incluye citas textuales riquísimas. Claude las usa bien ("Cuando me enfado se me cierran las puertas..."), pero se corta antes de completar el análisis. También menciona "una mezcla entre Rita Barberá e Isabel Díaz Ayuso" como si fuera dato propio cuando viene de la entrevista — esto es correcto pero debería atribuirse ("según ella misma describe" o similar).

**Artículo 5 (Aída y vuelta):** El prompt tenía poca información concreta (la mayor parte era boilerplate de la web Vandal). Claude rellena con datos que parecen inventados o sacados de su training data: "5,3 millones de euros recaudados", "producción de Mediapro". Si estos datos no estaban en el prompt, es **invención**, que es exactamente lo que las instrucciones prohíben.

### 2.3. Tono editorializante excesivo

Hay expresiones que rozan el relleno opinático:
- "Había ganas. Muchas ganas." (Artículo 5)
- "Se les entiende la emoción." (Artículo 6)
- "Ese es el terreno que pisa la ficción, y lo hace sin red." (Artículo 6)
- "Movimiento calculado." (Artículo 1)

Estas frases cortas tipo sentencia son un recurso estilístico que Claude repite en exceso. Funcionan una vez; usarlas en cada artículo las convierte en muletilla.

### 2.4. Frases sueltas tipo "frase-fragmento"

Claude abusa de frases cortísimas aisladas como recurso de estilo:
- "Otro personaje cerilla. Otra explosión controlada." (Artículo 4)
- "Tiene capas." (Artículo 5)
- "No es poco." (implícito en varios)

Esto funciona en periodismo de opinión, pero en noticias informativas sobre series resulta artificial si se repite constantemente.

### 2.5. Artículo 2 (Barrio Esperanza) es correcto en extensión

Con datos escasos, Claude genera un artículo breve y proporcionado (~180 palabras). Esto está bien calibrado. Sin embargo, el titular generado es genérico y no añade gancho SEO: "**'Barrio Esperanza' recibe a la reina Letizia en el colegio en su segundo episodio**" — debería indicar que es La 1 o RTVE para posicionar mejor.

### 2.6. Artículo 6 sin título ni serie

El prompt llegó sin serie ni título, pero Claude generó correctamente un artículo sobre 'Yo siempre a veces' infiriendo la información del contenido. Esto es positivo, pero preocupante: si el sistema envía prompts incompletos, Claude debería señalarlo en lugar de asumir.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### Mejora 3.1: Evitar confusión con títulos de películas/remakes

**Problema →** 'Nueve Reinas' fue rechazada 3 veces porque Claude la asoció con la película argentina de 2000 en lugar de leer el contenido del artículo que habla de una serie de Netflix con actores españoles rodada en Madrid.

**Propuesta (texto exacto para añadir al prompt):**
```
REGLA CRÍTICA: Clasifica SIEMPRE basándote en la información del artículo, NO en tu conocimiento previo del título. Si un artículo habla de una serie con actores españoles, producida para una plataforma y rodada en España, es española aunque el título coincida con una película extranjera. Lee el contenido, no asumas por el nombre.
```

**Impacto esperado →** Eliminación de falsos negativos por confusión con obras homónimas. Habría evitado los 3 rechazos de 'Nueve Reinas'.

### Mejora 3.2: Definir que series turcas emitidas en España SÍ son relevantes

**Problema →** 'En tierra lejana' fue descartada como no española, pero el editor la quiere cubierta porque se emite en cadenas españolas.

**Propuesta (texto exacto):**
```
SERIES EXTRANJERAS EMITIDAS EN ESPAÑA: Las series turcas, latinoamericanas u otras que se emiten en cadenas españolas (Antena 3, Divinity, La 1, Telecinco, etc.) SÍ son relevantes. Clasifícalas con espana: true. Solo marca espana: false si la serie NO se emite ni se ha anunciado para ninguna cadena o plataforma española.
```

**Impacto esperado →** Cobertura correcta de series turcas/latinas que son parte habitual de la parrilla española y generan tráfico en la web.

### Mejora 3.3: Mejorar la clasificación de `tipo_evento`

**Problema →** Claude clasifica como `otro` muchas noticias que deberían ser `cancelacion`, `audiencias`, `critica` o `casting`. Las correcciones del editor se acumulan.

**Propuesta (texto exacto):**
```
GUÍA DE tipo_evento (usa estas definiciones estrictas):
- "fecha_estreno": anuncia o confirma fecha de estreno/lanzamiento
- "renovacion": confirma nueva temporada
- "cancelacion": confirma que una serie termina, no se renueva, o es su temporada final
- "casting": menciona actores, reparto, quién es quién, incorporaciones o salidas de actores
- "audiencias": datos de audiencia, cuota de pantalla, espectadores, récords, rankings
- "critica": valoración, reseña o análisis de calidad de la serie (incluye "lo más visto" con valoración)
- "entrevista": declaraciones de actores/creadores sobre la serie (no sobre su vida personal)
- "trailer": tráiler, teaser, primeras imágenes, póster oficial
- "rodaje": inicio o avance de rodaje, grabaciones
- "otro": SOLO si no encaja en ninguna de las anteriores

Palabras clave para detectar tipo_evento:
- "llega a su final" / "temporada final" / "no habrá más" → cancelacion
- "quién es quién" / "reparto" / "se une al elenco" → casting
- "espectadores" / "cuota" / "share" / "récord de audiencia" → audiencias
- "primeras imágenes" / "tráiler" / "teaser" → trailer
- "inicia rodaje" / "comienza a rodarse" → rodaje
```

**Impacto esperado →** Reducción drástica de la categoría "otro" como cajón de sastre. Las correcciones manuales del editor deberían disminuir significativamente.

### Mejora 3.4: Filtros menos genéricos

**Problema →** Filtros como `["macarena", "trastorno"]` o `["gran", "senora"]` son demasiado amplios y podrían bloquear noticias legítimas.

**Propuesta (texto exacto):**
```
REGLAS PARA FILTROS:
- Los filtros deben ser específicos al contenido irrelevante, no a palabras comunes.
- Usa combinaciones de 2-3 palabras cuando una sola sea ambigua: "macarena gomez hormiguero" en vez de "macarena".
- No uses nombres propios de actores como filtro si actúan en series españolas.
- No uses palabras genéricas como "gran", "nuevo", "primer".
- Los filtros son para bloquear TEMAS recurrentes no deseados (deportes, política, prensa rosa sin serie).
```

**Impacto esperado →** Menos falsos positivos en el sistema de bloqueo por palabras clave.

### Mejora 3.5: Clarificar qué es "ficción" para el sitio

**Problema →** Claude descarta true crime, docuseries y contenido como Carles Porta marcando `espana: false` cuando es contenido español. La frontera ficción/no-ficción no está clara.

**Propuesta (texto exacto):**
```
ALCANCE DEL SITIO: La web cubre series de FICCIÓN españolas. Descarta:
- Reality shows y concursos (La caja amarilla, Supervivientes, etc.)
- Programas de entretenimiento (El Hormiguero, La Revuelta, etc.)
- Documentales y true crime (Carles Porta, etc.)
- Películas (aunque sean de directores de series)
- Noticias de espectáculos sin relación con series de ficción

EXCEPCIÓN: Si una noticia de un programa no-ficción menciona directamente una serie de ficción española como tema principal, SÍ es relevante.

IMPORTANTE: Si descartas algo, usa espana: false SOLO si no es español. Si es español pero no ficción, usa espana: true con razon explicando que no es ficción.
```

**Impacto esperado →** Clasificación más precisa del campo `espana` y criterios claros sobre qué entra y qué no.

### Mejora 3.6: Añadir categoría explícita de decisión

**Problema →** La respuesta JSON no incluye explícitamente la categoría final (`pendientes`, `cubiertos`, `no_espana`, `irrelevantes`), lo que obliga al sistema a inferirla de `espana` + `razon`. Esto genera ambigüedad.

**Propuesta (texto exacto):**
```
Añade el campo "categoria" al JSON con uno de estos valores exactos: "pendientes", "cubiertos", "no_espana", "irrelevantes".
- "pendientes": serie española de ficción con noticia relevante no cubierta aún
- "cubiertos": serie española ya publicada en el sitio (aparece en historial)
- "no_espana": serie que no es española ni se emite en España
- "irrelevantes": no es serie de ficción, no tiene interés editorial

Formato actualizado:
[{"id": 1, "serie": "...", "categoria": "pendientes", "tipo_evento": "...", "espana": true, "razon": "...", "filtros": []}]
```

**Impacto esperado →** Eliminación de ambigüedad en la clasificación final. El sistema no tiene que interpretar la razón textual.

---

## 4. MEJORAS AL PROMPT DE REDACCIÓN

### Mejora 4.1: Impedir invención de datos no presentes en el prompt

**Problema →** En el Artículo 5 ('Aída y vuelta'), Claude incluye "5,3 millones de euros recaudados" y "producción de Mediapro" que podrían no estar en el contenido extraído del prompt (el fragmento visible es principalmente boilerplate de Vandal). Claude está usando su training data para rellenar.

**Propuesta (texto exacto):**
```
PROHIBICIÓN ABSOLUTA: No incluyas NINGÚN dato que no aparezca explícitamente en el CONTENIDO EXTRAÍDO de las fuentes proporcionadas arriba. Esto incluye cifras de recaudación, nombres de productoras, fechas, datos de audiencia o cualquier información factual. Si un dato está en tu memoria pero NO en el texto que te proporciono, NO lo uses. Invéntate la frase de otra manera o escribe un artículo más corto. Ante la duda, omite.
```

**Impacto esperado →** Eliminación de datos fabricados o extraídos de la memoria del modelo. Mayor fiabilidad factual.

### Mejora 4.2: Controlar la longitud para evitar cortes

**Problema →** 5 de 6 artículos se cortan a mitad de frase, lo que indica que Claude excede el límite de tokens de salida.

**Propuesta (texto exacto):**
```
CONTROL DE LONGITUD CRÍTICO: Tu respuesta completa debe caber en el límite de tokens. 
- Si hay datos ricos: máximo 500 palabras (no 700). Prioriza terminar el artículo completo.
- Si hay pocos datos: máximo 200 palabras.
- SIEMPRE termina con un párrafo completo y con sentido. NUNCA dejes una frase a medias.
- Si notas que te estás extendiendo, cierra el artículo en el siguiente párrafo.
- Es mejor un artículo de 400 palabras completo que uno de 600 cortado.
```

**Impacto esperado →** Artículos que siempre terminan correctamente. Elimina el problema más visible y dañino para la publicación.

### Mejora 4.3: Reducir muletillas estilísticas

**Problema →** Claude repite el mismo recurso retórico en todos los artículos: frases sueltas tipo sentencia ("Movimiento calculado.", "Tiene capas.", "Otro personaje cerilla."). También abusa de arranques como "Había ganas. Muchas ganas."

**Propuesta (texto exacto):**
```
ESTILO - EVITA ESTOS RECURSOS REPETITIVOS:
- No uses frases-fragmento aisladas como recurso dramático ("Tiene capas.", "Movimiento calculado.", "No es poco."). Máximo una por artículo.
- No empieces párrafos con construcciones exclamativas o enfáticas repetidas ("Había ganas. Muchas ganas.").
- Varía la estructura de las frases: alterna frases largas con cortas, pero no conviertas cada cierre de párrafo en una sentencia de una sola frase.
- Tono: informativo con personalidad. Ni frío ni sobreactuado. Piensa en un periodista de series que escribe con criterio, no en un copywriter de redes sociales.
```

**Impacto esperado →** Artículos con estilo más variado y profesional. Menor sensación de "plantilla" entre artículos.

### Mejora 4.4: El titular debe reflejar solo lo que el cuerpo cubre

**Problema →** El Artículo 1 promete en el titular "Guía de personajes y reparto" pero el cuerpo se corta antes de llegar a esa sección. Aunque parte del problema es el corte por tokens, el titular no debería prometer lo que no puede entregar.

**Propuesta (texto exacto):**
```
COHERENCIA TITULAR-CUERPO: El titular debe reflejar SOLO lo que el cuerpo del artículo efectivamente desarrolla. Si no vas a poder cubrir todos los aspectos de la noticia (por ejemplo, una guía completa de personajes), no lo prometas en el titular. Ajusta el enfoque del titular al contenido que realmente escribes.
```

**

2026-04-28 20:21


## 1. PROBLEMAS EN CLASIFICACIÓN

### Error principal: Clasificación incorrecta de noticias sobre series turcas emitidas en España

El caso más evidente es el artículo mal clasificado que el editor tuvo que recuperar manualmente:

> **"La novela turca en español de Cansu Dere ('Infiel' y 'Madre') que más se parece a 'En tierra lejana'"**

Este artículo fue descartado (probablemente como `no_espana` o `irrelevantes`) cuando debería haber sido clasificado como `pendientes`. La noticia habla de 'En tierra lejana', una serie que se emite en Antena 3 y que en el Ejemplo 2 SÍ fue correctamente clasificada como `espana: true`. El problema es que el título menciona "novela turca" y a la actriz Cansu Dere, lo que probablemente disparó la lógica de "no es española".

**Patrón identificado:** Claude confunde el origen de producción de la serie con su relevancia editorial. Si una serie turca se emite en España y está cubierta por el sitio, las noticias relacionadas (comparativas, recomendaciones, contenido adyacente) son relevantes. El sistema ya demostró saber esto al clasificar correctamente el avance semanal de 'En tierra lejana', pero falla cuando el titular enfatiza el origen turco.

### Inconsistencias en tipo_evento según correcciones del editor

Las correcciones revelan varios patrones de confusión:

- **"Ver o no ver 'Furia'"**: Claude clasificó como `critica`, el editor corrigió a `otro`. Los artículos de tipo "ver o no ver" o recomendaciones generales no son críticas propiamente dichas.
- **"Netflix Machos Alfa llega a su final"**: Claude clasificó como `otro`, debería ser `cancelacion`. Si se confirma el final de una serie, es una cancelación.
- **"Acaba de llegar a Movistar Plus+ y ya es lo más visto"**: Claude clasificó como `otro`, debería ser `critica`. El "ya es lo más visto" con valoración implica crítica/reseña.
- **"Regreso a Las Sabinas: un triángulo amoroso con Andrés Velencoso..."**: Claude clasificó como `casting`, el editor corrigió a `otro`. Describir personajes y actores en contexto de presentación de serie no es "casting" (que implica fichaje nuevo).
- **Antena 3 dispara su ficción**: Hubo múltiples correcciones contradictorias (`audiencias` → `entrevista` → `audiencias`), lo que sugiere que el artículo cubría varios temas. Esto indica que Claude necesita una regla de priorización cuando un artículo toca varios tipos.

### El email de pago (Ejemplo 1)

Claude lo clasificó correctamente como irrelevante, pero llama la atención que un email de "Remittance Advice" llegara al sistema. Esto sugiere que el filtro de palabras clave (bloqueados) no incluye términos financieros básicos.

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### Artículo 1: 'Regreso a las Sabinas'

**Datos disponibles en el prompt que SÍ se usaron bien:**
- Nombres de personajes (Esther, Gracia, Tano, Miguel)
- Descripción de relaciones y conflictos
- Contexto de Divinity, Disney+, nominación al Emmy

**Datos del prompt infrautilizados:**
- El prompt contiene descripciones ricas de personajes (Esther como "médica de familia de Manterana", "joven generosa volcada en su profesión") que aparentemente se desarrollaron en el cuerpo del artículo (el texto está cortado, pero se ve que iba encaminado).
- La debilidad del patriarca ("su hija Esther"), los celos de Tano, la inseguridad de Esther ante el regreso de Gracia: datos dramáticos muy útiles.

**Problemas detectados:**
- El artículo está **cortado** en el ejemplo ("Ese reg..."), así que no puedo evaluar si completó la guía de personajes. Pero la estructura inicial es sólida.
- Expresión "Movimiento calculado" al final del tercer párrafo: es un fragmento suelto que funciona como frase de efecto pero roza el estilo editorial opinativo. No es grave, pero es una muletilla que podría repetirse.
- Buen cumplimiento de la regla de longitud: al tener datos ricos, va hacia las 500-700 palabras.

**Estilo:** Ágil, con gancho, sin subtítulos. Cumple bien las instrucciones. El lead en negrita está presente. Los párrafos están separados.

### Artículo 2: 'Barrio Esperanza'

**Datos disponibles en el prompt:**
- Visita oficial de la reina Letizia
- Segundo episodio (segunda semana)
- Éxito en primera semana
- Esperanza lidia con padres y profesores, defiende inclusión y educación
- "Grandes sorpresas e inesperados protagonistas"

**Problemas detectados:**

1. **El titular no tiene formato de titular sino de lead en negrita.** El artículo empieza directamente con el lead en negrita, pero ¿dónde está el titular separado? Según las instrucciones, la estructura debe ser: 1) TITULAR, 2) LEAD EN NEGRITA. Lo que veo es que el texto en negrita actúa como titular y lead fusionados. Falta un titular diferenciado no-negrita antes del lead.

2. **Relleno especulativo en los dos últimos párrafos:**
   - *"Ese tipo de visitas lo alteran todo, desde los nervios del profesorado hasta las dinámicas entre los padres"* → Esto NO está en la fuente. Es especulación narrativa.
   - *"Una combinación que puede dar juego"* → Meta-comentario editorial genérico.
   - *"Habrá que ver cómo gestiona la serie este encuentro entre dos mundos y si el segundo capítulo consolida el impulso"* → Reflexión genérica, exactamente lo que el prompt prohíbe ("NUNCA rellenes con reflexiones genéricas").

3. **Longitud:** La fuente es escasa (una nota de prensa con 3-4 datos concretos). Según las instrucciones, debería ser un artículo BREVE de 150-200 palabras. El artículo generado tiene aproximadamente 220-240 palabras y al menos 2 párrafos son relleno. Debería haberse quedado en el lead + 2 párrafos cortos.

4. **"Ese pulso entre lo institucional y lo cotidiano es el terreno donde la serie planta su bandera"** → Frase editorial/literaria que no aporta información. Es exactamente el tipo de relleno que el prompt intenta evitar.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### Mejora 3.1: Series turcas/extranjeras emitidas en España

**Problema →** Claude descarta noticias que mencionan "novela turca" o actrices turcas aunque la serie se emita en cadenas españolas y esté en el ámbito editorial del sitio. El caso de 'En tierra lejana' lo demuestra: un avance semanal se clasifica bien, pero un artículo comparativo que menciona el origen turco se descarta.

**Propuesta (texto exacto para añadir al prompt):**
```
REGLA IMPORTANTE SOBRE SERIES EXTRANJERAS EMITIDAS EN ESPAÑA:
Si una serie se emite actualmente en una cadena española (Antena 3, La 1, Telecinco, Divinity, Nova, etc.), es relevante para la web AUNQUE sea de producción extranjera (turca, latinoamericana, etc.). Clasifica como espana=true cualquier noticia sobre estas series, incluyendo comparativas, recomendaciones de series similares, o artículos sobre sus actores originales, siempre que la serie de referencia se emita en España.
```

**Impacto esperado →** Evita descartes incorrectos de artículos sobre series turcas o extranjeras que sí son parte de la cobertura editorial.

### Mejora 3.2: Definición precisa de tipos de evento conflictivos

**Problema →** Las correcciones del editor muestran confusión recurrente entre `otro`, `critica`, `cancelacion`, `casting` y `audiencias`. Claude no tiene definiciones claras de cada tipo.

**Propuesta (texto exacto para añadir al prompt):**
```
DEFINICIONES DE tipo_evento (usa estas definiciones estrictas):
- "cancelacion": Se confirma que una serie termina, no tendrá más temporadas, o se cancela. Incluye "final de la serie", "última temporada", "no habrá más temporadas".
- "critica": Reseña, valoración o análisis cualitativo de una serie o episodio. Incluye artículos tipo "ya es lo más visto" si incluyen valoración del contenido.
- "audiencias": Datos numéricos de audiencia, cuota de pantalla, récords de visualización. El foco es el DATO numérico, no la valoración.
- "casting": Fichaje NUEVO de un actor para una serie. NO incluye presentaciones generales de reparto ya conocido.
- "avance": Adelantos de trama, avances semanales, spoilers de próximos episodios.
- "estreno": Fecha de estreno confirmada, lanzamiento de nueva serie o temporada.
- "rodaje": Inicio, desarrollo o localización de rodaje.
- "renovacion": Confirmación de nueva temporada.
- "entrevista": El artículo es principalmente una entrevista a un actor, creador o directivo sobre la serie.
- "otro": Solo si no encaja en ninguna de las anteriores. Incluye: artículos de recomendación tipo "ver o no ver", listas, comparativas entre series, reportajes generales.

REGLA DE PRIORIZACIÓN: Si un artículo toca varios tipos, usa el que aparezca primero en el titular. Si el titular no lo aclara, prioriza: cancelacion > estreno > renovacion > casting > audiencias > critica > otro.
```

**Impacto esperado →** Reduce las correcciones de tipo_evento del editor. Las definiciones explícitas con ejemplos eliminan la ambigüedad.

### Mejora 3.3: Artículos adyacentes a series cubiertas

**Problema →** El artículo "La novela turca en español de Cansu Dere que más se parece a 'En tierra lejana'" fue descartado. Aunque no es directamente un avance o noticia de 'En tierra lejana', es contenido relevante para los seguidores de esa serie. Claude no tiene una regla para artículos "satélite" o comparativos.

**Propuesta (texto exacto para añadir al prompt):**
```
ARTÍCULOS COMPARATIVOS O DE RECOMENDACIÓN:
Si un artículo recomienda una serie PORQUE se parece a una serie española o emitida en España, clasifícalo como pendiente con la serie de referencia española. Ejemplo: "Series parecidas a 'En tierra lejana'" → serie: "En tierra lejana", pendiente.
```

**Impacto esperado →** Captura artículos de recomendación y comparativas que atraen tráfico SEO y que el editor quiere cubrir.

### Mejora 3.4: Filtro de spam/correo no editorial

**Problema →** Un email de "Remittance Advice" (aviso de pago) llegó al sistema de clasificación. Aunque Claude lo descartó correctamente, no debería haber llegado.

**Propuesta (palabras clave para bloqueados):**
```
Añadir a la lista de palabras bloqueadas: "remittance", "wire transfer", "payment processed", "invoice", "factura", "transferencia bancaria"
```

**Impacto esperado →** Estos emails se filtran antes de llegar a Claude, ahorrando tokens y tiempo.

---

## 4. MEJORAS AL PROMPT DE REDACCIÓN

### Mejora 4.1: Separar titular y lead de forma inequívoca

**Problema →** En el Artículo 2 ('Barrio Esperanza'), el titular y el lead aparecen fusionados. El texto en negrita actúa como ambos a la vez, lo que no cumple la estructura definida en el prompt. El artículo de 'Regreso a las Sabinas' sí los separa correctamente.

**Propuesta (texto exacto para reemplazar en la sección ESTRUCTURA):**
```
1. TITULAR: En la primera línea, sin negrita, sin formato especial. Concreto, con gancho, orientado a SEO. Incluye el nombre de la serie. NUNCA en negrita.

2. LEAD EN NEGRITA (**texto**): Línea separada del titular por una línea en blanco. Una o dos frases con el dato más importante. SIEMPRE diferente del titular (no repitas el titular en negrita).
```

**Impacto esperado →** Elimina la ambigüedad sobre dónde empieza el titular y dónde el lead. Facilita el procesamiento automático posterior.

### Mejora 4.2: Prohibir explícitamente frases de cierre especulativas

**Problema →** El Artículo 2 termina con *"Habrá que ver cómo gestiona la serie este encuentro entre dos mundos y si el segundo capítulo consolida el impulso de una primera semana que dejó buenas sensaciones en RTVE."* Esto es exactamente lo que el prompt prohíbe pero no con suficiente especificidad. El prompt dice "NUNCA rellenes con reflexiones genéricas" pero Claude interpreta que un cierre editorial no es "relleno".

**Propuesta (texto exacto para añadir a la sección SIEMPRE):**
```
- NUNCA cierres un artículo con frases del tipo "habrá que ver", "queda por ver", "el tiempo dirá", "veremos si", "solo el tiempo lo dirá". Si no tienes más datos, termina con el último dato concreto. El artículo puede terminar de forma abrupta; eso es preferible a un cierre vacío.
- NUNCA uses frases como "planta su bandera", "puede dar juego", "promete sacudir", "no es un detalle menor" como relleno. Cada frase debe contener información verificable de la fuente.
```

**Impacto esperado →** Elimina los cierres especulativos que son el principal tipo de relleno que se cuela en artículos cortos.

### Mejora 4.3: Reforzar la regla de brevedad con fuentes escasas

**Problema →** El artículo de 'Barrio Esperanza' tenía una fuente con 3-4 datos concretos y aun así generó 5 párrafos con relleno. La regla de "150-200 palabras máximo" no se respetó.

**Propuesta (texto exacto para reemplazar la sección de longitud):**
```
LONGITUD SEGÚN DATOS DISPONIBLES:
- FUENTE RICA (reparto detallado, fechas, sinopsis extensa, declaraciones textuales, múltiples datos verificables): 500-700 palabras, 6+ párrafos.
- FUENTE MEDIA (algunos datos concretos pero sin gran profundidad, 2-5 datos verificables): 200-350 palabras, 3-4 párrafos.
- FUENTE ESCASA (solo titular, un dato, nota de prensa genérica): 100-170 palabras MÁXIMO. Lead + 1-2 párrafos. PARA cuando acabes los datos. No añadas un párrafo más.

REGLA DE ORO: Cuenta los datos concretos y verificables de la fuente. Si tienes menos de 4 datos, el artículo es CORTO. Cada párrafo debe contener al menos un dato nuevo de la fuente. Si no puedes añadir un dato nuevo, no añadas un párrafo nuevo.
```

**Impacto esperado →** Introduce un nivel intermedio (fuente media) y la "regla de oro" que obliga a vincular cada párrafo a un dato concreto, eliminando el relleno estructuralmente.

### Mejora 4.4: Prohibir especulación narrativa disfrazada de contexto

**Problema →** En el Artículo 2, la frase *"Ese tipo de visitas lo alteran todo, desde los nervios del profesorado hasta las dinámicas entre los padres"* no está en la fuente. Es una especulación sobre lo que "suele pasar" en visitas oficiales a colegios. Claude la presenta como contexto cuando es invención.

**Propuesta (texto exacto para añadir a la sección SIEMPRE):**
```
- NUNCA inventes consecuencias, reacciones o dinámicas que no estén en la fuente. Si la fuente dice "la reina visita el colegio", NO escribas "eso altera la rutina del centro". Solo puedes describir lo que la fuente AFIRMA explícitamente.
- Distingue entre DATO (está en la fuente) y DEDUCCIÓN (lo asumes tú). Solo escribe datos.
```

**Impacto esperado →** Cierra la puerta a la especulación narrativa que Claude disfraza de contexto natural, que es el tipo de invención más sutil y frecuente.

### Mejora 4.5: Evitar muletillas de estilo periodístico vacío

**Problema →** Tanto "Movimiento calculado" (Artículo 1) como "planta su bandera" (Artículo 2) son muletillas de estilo que no aportan información. Son formas de simular profundidad editorial sin datos.

**Propuesta (texto exacto para añadir):**
```
ESTILO:
- Tono informativo, directo, con gancho pero sin artificios.
- Evita frases-efecto sin contenido informativo: "Movimiento calculado", "No es casualidad", "Planta su bandera", "El terreno de juego", "Las cartas sobre la mesa", etc.
- Cada frase debe poder responder a: "¿qué dato nuevo le da esto al lector?" Si la respuesta es "ninguno", elimínala.
```

**Impacto esperado →** Depura el estilo eliminando muletillas que ocupan espacio sin informar, especialmente problemáticas en artículos cortos donde cada palabra cuenta.

---

## 5. CONFIGURACIÓN

### Palabras clave a AÑADIR al filtro de bloqueados:
- `remittance`, `wire transfer`, `payment processed`, `invoice`, `factura` → Filtran correos financieros que no son noticias.
- `unsubscribe`, `darse de baja`, `preferencias de email` → Filtran footers de newsletters que puedan llegar como artículos.

### Palabras clave a REVISAR (posibles falsos positivos):
- Verificar que "turca", "novela turca" NO estén en la lista de bloqueados/filtros, ya que series turcas emitidas en España son relevantes.
- Verificar que "similar", "parecida", "se parece"

2026-04-28 20:18


## 1. PROBLEMAS EN CLASIFICACIÓN

### Error principal: Clasificación incorrecta de noticias sobre series turcas emitidas en España

El caso más claro es el artículo mal clasificado que el editor tuvo que recuperar manualmente:

> "La novela turca en español de Cansu Dere ('Infiel' y 'Madre') que más se parece a 'En tierra lejana'"

Este artículo fue rechazado (probablemente como `no_espana` o `irrelevantes`) cuando debería haber sido clasificado como **pendiente**. La clave está en que 'En tierra lejana' es una serie que se emite en Antena 3 y ya aparece en el historial como serie cubierta. Si miramos el Ejemplo 2 de clasificación, Claude clasificó correctamente un avance semanal de 'En tierra lejana' como serie española (`"espana": true`). Sin embargo, cuando el titular menciona "novela turca" y actrices turcas (Cansu Dere), el modelo parece haber cambiado su criterio y la descartó.

**Patrón de error**: Claude se deja llevar por las palabras "turca", "novela turca" o nombres de actrices no españolas y marca la noticia como no española, incluso cuando la serie principal del artículo (En tierra lejana) se emite en cadenas españolas y está cubierta por el sitio.

### Inconsistencias en tipo_evento

Las correcciones del editor revelan varios patrones problemáticos:

- **"Machos Alfa llega a su final"** → Claude clasificó como `otro` cuando era `cancelacion`. El modelo no asocia "llega a su final" con cancelación/fin de serie.
- **"Acaba de llegar a Movistar Plus+ y ya es lo más visto"** → Claude clasificó como `otro` cuando era `critica`. El modelo no reconoce artículos de valoración/reseña con titulares orientados a engagement.
- **"Regreso a Las Sabinas: un triángulo amoroso con Andrés Velencoso..."** → Claude clasificó como `casting` cuando era `otro`. El modelo asume que la mención de actores implica noticia de casting, cuando en realidad es una presentación general de la serie.
- **Antena 3 dispara su ficción** → Se corrigió varias veces entre `audiencias`, `entrevista` y `otro`, lo que sugiere que el artículo cubría múltiples temas y el sistema no tiene una regla clara de prioridad.

---

## 2. PROBLEMAS EN REDACCIÓN DE ARTÍCULOS

### Artículo 1: 'Regreso a las Sabinas'

**Aspectos positivos:**
- Buen titular SEO con mención a Emmy y Disney+.
- Lead en negrita con datos concretos (70 episodios, horario, fecha).
- Buen contexto editorial (aniversario Divinity, estrategia de programación).
- Tono periodístico con personalidad ("Movimiento calculado").

**Problemas detectados:**
- **Datos del prompt no aprovechados al máximo**: El prompt contiene descripciones detalladas de personajes (Esther como médica de familia, Tano como hermano mayor de Miguel, sus motivaciones). El artículo se titula "Guía de personajes y reparto" pero el texto se corta antes de cubrir a todos los personajes. Si bien esto puede ser un problema de truncamiento del ejemplo, el fragmento visible dedica más espacio al contexto de programación que a los propios personajes, que es lo que promete el titular.
- **Nombres de actores**: El prompt menciona "Andrés Velencoso, Cecilia Freire" en el historial de correcciones. Si el contenido fuente incluía el reparto completo, debería estar más presente en el cuerpo del artículo.
- **Expresiones aceptables**: No se detectan meta-comentarios ni relleno especulativo.

### Artículo 2: 'Barrio Esperanza'

**Aspectos positivos:**
- Longitud adecuada para la información disponible (fuente escasa).
- No inventa datos.
- Estructura correcta con párrafos separados.

**Problemas detectados:**
- **El titular no está en formato de titular** — aparece en negrita como si fuera el lead: `**'Barrio Esperanza' recibe a la reina Letizia...**`. Debería haber un titular sin negrita y luego el lead en negrita. Esto incumple la estructura pedida en el prompt.
- **Relleno editorial que bordea lo prohibido**: Frases como "Habrá que ver cómo gestiona la serie este encuentro entre dos mundos" y "Una combinación que puede dar juego" son reflexiones genéricas especulativas. El prompt dice explícitamente: *"NUNCA rellenes con reflexiones genéricas sobre el título, meta-comentarios sobre la falta de datos, ni análisis especulativos."*
- **"dejó buenas sensaciones en RTVE"**: No está en la fuente. La fuente dice "gran éxito en su primera semana de emisión", que no es lo mismo que "buenas sensaciones en RTVE".
- **Se estira innecesariamente**: Con los datos disponibles (visita de la reina Letizia, Esperanza lidia con padres y profesores, segunda semana), el artículo debería ser de 150-200 palabras, pero alcanza unas 250+ con relleno especulativo.

---

## 3. MEJORAS AL PROMPT DE CLASIFICACIÓN

### Mejora 3.1: Series turcas/internacionales emitidas en España

**Problema** → Claude descarta artículos sobre series turcas (o de otro origen) que se emiten en cadenas españolas cuando el titular menciona su origen no español. El caso de 'En tierra lejana' demuestra que la mención de "novela turca" o actrices turcas provoca que el modelo marque `espana: false`, incluso cuando la serie está en el historial como cubierta.

**Propuesta** (texto exacto para añadir al prompt):
```
REGLA CRÍTICA - Series internacionales en España:
Una serie emitida en una cadena española (Antena 3, La 1, Telecinco, Divinity, Nova, etc.) se considera serie española A EFECTOS DE CLASIFICACIÓN, independientemente de su país de producción. Si el artículo habla sobre una serie turca, coreana o de cualquier otro origen que se emite en España, márcala como espana: true. Solo marca espana: false si la serie NO se emite ni se ha emitido en ninguna cadena española.
Ejemplos: 'En tierra lejana' (turca pero emitida en Antena 3) → espana: true. 'Squid Game' (coreana, solo en Netflix global) → espana: false.
```

**Impacto esperado** → Evita la pérdida de artículos relevantes sobre series turcas en Antena 3, Nova o Divinity, que son un contenido importante para el sitio.

### Mejora 3.2: Artículos comparativos o "parecidos a"

**Problema** → El artículo "La novela turca que más se parece a 'En tierra lejana'" fue descartado, probablemente porque Claude lo interpretó como un artículo sobre otra serie (la novela de Cansu Dere) y no sobre 'En tierra lejana'. Sin embargo, para el editor es contenido relevante porque su audiencia sigue 'En tierra lejana' y quiere recomendaciones similares.

**Propuesta** (texto exacto):
```
ARTÍCULOS DE COMPARACIÓN O RECOMENDACIÓN:
Si un artículo compara una serie con otra o recomienda series "parecidas a" una serie que cubrimos, clasifícalo como relevante para la serie principal que cubrimos. El tipo_evento será "otro". Ejemplo: "Series parecidas a En tierra lejana" → serie: "En tierra lejana", tipo_evento: "otro", espana: true.
```

**Impacto esperado** → Captura artículos de recomendación que generan tráfico SEO y son relevantes para la audiencia del sitio.

### Mejora 3.3: Clarificación de tipo_evento "cancelacion"

**Problema** → Claude clasificó "Machos Alfa llega a su final" como `otro` en vez de `cancelacion`. No reconoce que "final de la serie" o "confirma el final" equivalen a cancelación/cierre.

**Propuesta** (texto exacto):
```
TIPO_EVENTO - cancelacion:
Usa "cancelacion" cuando una serie anuncia su final definitivo, es cancelada, o se confirma que no habrá más temporadas. Señales: "final de la serie", "confirma el final", "última temporada", "no habrá temporada X", "dice adiós", "llega a su fin". No confundir con el final de temporada (que sería "otro" o "avance").
```

**Impacto esperado** → Clasificación correcta de noticias de cancelación, que son de alto interés editorial.

### Mejora 3.4: Clarificación de tipo_evento "critica" vs "otro"

**Problema** → Claude no reconoce artículos de crítica/reseña cuando el titular usa un enfoque de engagement ("ya es lo más visto", "merece la pena ver"). También clasificó un artículo de tipo "Ver o no ver 'Furia'" como `critica` cuando el editor quería `otro`.

**Propuesta** (texto exacto):
```
TIPO_EVENTO - critica:
Usa "critica" para artículos que valoran, reseñan o analizan la calidad de una serie con opinión del autor. Señales: "review", "crítica", "merece la pena", "ya es lo más visto" (cuando incluye valoración).
Usa "otro" para artículos tipo "ver o no ver" que son más listados o guías de contenido sin análisis profundo, y para artículos que mezclan datos de audiencia con recomendación sin opinión clara del autor.
```

**Impacto esperado** → Reducción de errores en la distinción crítica/otro.

### Mejora 3.5: Distinción casting vs presentación de serie

**Problema** → "'Regreso a Las Sabinas': un triángulo amoroso con Andrés Velencoso, Cecilia Freire" fue clasificado como `casting` cuando era `otro`. La mención de actores no siempre implica noticia de casting.

**Propuesta** (texto exacto):
```
TIPO_EVENTO - casting:
Usa "casting" SOLO cuando la noticia principal es la incorporación o salida de un actor/actriz a una serie. Si el artículo presenta la serie, su trama o su reparto de forma general, usa "otro" o el tipo que corresponda al enfoque principal (estreno, renovacion, etc.). La simple mención de nombres de actores NO convierte un artículo en noticia de casting.
```

**Impacto esperado** → Evita falsos positivos de casting en artículos de presentación.

### Mejora 3.6: Prioridad cuando el artículo cubre múltiples temas

**Problema** → El artículo de "Antena 3 dispara su ficción" fue corregido varias veces entre `audiencias`, `entrevista` y `otro`, revelando que el modelo no sabe qué priorizar.

**Propuesta** (texto exacto):
```
PRIORIDAD DE TIPO_EVENTO:
Si un artículo cubre varios temas (audiencias + entrevista + estreno), prioriza así:
1. El tema del titular o gancho principal
2. Si el titular es ambiguo, prioriza: estreno > renovacion > cancelacion > audiencias > casting > critica > otro
```

**Impacto esperado** → Consistencia en clasificación de artículos multi-tema.

---

## 4. MEJORAS AL PROMPT DE REDACCIÓN

### Mejora 4.1: Separación clara entre titular y lead

**Problema** → En el Artículo 2, el titular aparece en negrita fusionado con el lead. El prompt define la estructura como "1. TITULAR" y "2. LEAD EN NEGRITA", pero Claude a veces los mezcla o pone el titular en negrita.

**Propuesta** (texto exacto):
```
FORMATO OBLIGATORIO:
- LÍNEA 1: Titular en texto plano (sin ** ni ##). Es el título del artículo.
- LÍNEA 2: En blanco.
- LÍNEA 3: Lead en negrita (**texto del lead**). Es la primera frase del cuerpo.
- LÍNEA 4: En blanco.
- Resto: Párrafos normales separados por líneas en blanco.

NUNCA pongas el titular en negrita. NUNCA fusiones titular y lead en la misma línea.
```

**Impacto esperado** → Formato consistente que facilita el procesamiento automático del CMS.

### Mejora 4.2: Prohibición explícita de relleno especulativo

**Problema** → A pesar de la instrucción existente, el Artículo 2 incluye frases como "Habrá que ver cómo gestiona la serie este encuentro" y "puede dar juego". Estas son exactamente las "reflexiones genéricas" y "análisis especulativos" que el prompt prohíbe.

**Propuesta** (texto exacto, para reemplazar la frase actual):
```
PROHIBICIONES ABSOLUTAS (si detectas alguna en tu borrador, elimínala):
- "Habrá que ver..." / "Queda por ver..." / "Solo el tiempo dirá..."
- "Puede dar juego" / "Promete ser interesante" / "No dejará indiferente"
- "Está por ver si..." / "Veremos cómo..." / "Lo que está claro es que..."
- Cualquier frase que empiece con condicional especulativo sobre el futuro de la serie
- Párrafos de cierre que no aporten información nueva
- Atribuir sentimientos o reacciones a cadenas/productoras que no estén en la fuente ("dejó buenas sensaciones en RTVE")

Si el último párrafo es especulativo, elimínalo. Mejor un artículo que termina con datos que uno que termina con relleno.
```

**Impacto esperado** → Eliminación del relleno que devalúa la calidad percibida de los artículos y viola las propias reglas del prompt.

### Mejora 4.3: Regla estricta de longitud para fuentes escasas

**Problema** → El Artículo 2 tiene una fuente de apenas 3 líneas pero el artículo generado tiene 5 párrafos con ~250 palabras, superando el rango de 150-200 indicado. El exceso viene del relleno especulativo.

**Propuesta** (texto exacto):
```
REGLA DE PROPORCIONALIDAD:
Cuenta los datos concretos de la fuente (nombres, fechas, hechos, declaraciones). 
- 1-3 datos concretos → artículo de 150-200 palabras, máximo 3-4 párrafos incluyendo lead.
- 4-8 datos concretos → artículo de 300-500 palabras.
- 9+ datos concretos → artículo de 500-700 palabras.
Si al terminar de escribir los datos te quedan palabras por llenar, NO las llenes. El artículo está