3- Fuentes

FORMATOS

Hontza permite leer las Fuentes de información en estos formatos:

1. RSS: Hontza puede importar en cualquiera de los estándares (Atom, RSS 2.0 …) de modo directo, creando canales de vigilancia de forma muy sencilla.

2. Filtro RSS: Hontza da la opción de filtrar los RSS usando cinco filtros distintos:

  • Filtrado general,
  • Contiene la palabra en el titulo/descripción,
  • No contiene la palabra en el titulo/descripción,
  • Una combinación de ambas
  • Filtros manuales (usando el lenguaje YQL)

3. CSV: Hontza permite cargar datos de fuentes que emitan con plantillas csv.

4. JSON: Hontza permite importar en formato JSON, dejando seleccionar qué elementos del JSON serán los que se descarguen a la plataforma en los campos title, link, description.

5. Google Sheet: Las Google Sheet u Hojas electrónicas de Google son a la vez una plataforma y una herramienta que permite escrapear y almacenar de modo sencillo fuentes no-RSS.

 

AYUDAS

Hemos desarrollado dos plantillas de scraping, que facilitan a cualquier usuario no programador, con un entrenamiento adecuado, explotar fuentes sistemáticamente y gestionarlas.

Hontza descarga directamente las Google Sheet creadas con estas plantillas, indicando sólamente el ID y el nº de la hoja

 

HOUND

Hound es un servidor de Scripting + Scraping que explota las fuentes más complicadas y las convierte en RSS:

  • Crear Hound: Hontza permite que un usuario construya un canal Hound a su medida y lo explote de modo exclusivo.
  • Cargar Hound: Hontza permite obtener los resultados de un canal Hound construido por CDE.
  • Filtro Hound: Hontza permite obtener noticias desde un canal Hound y luego filtrarlas usando cinco filtros diferentes.