
3- Fuentes
FORMATOS
Hontza permite leer las Fuentes de información en estos formatos:
1. RSS: Hontza puede importar en cualquiera de los estándares (Atom, RSS 2.0 …) de modo directo, creando canales de vigilancia de forma muy sencilla.
2. Filtro RSS: Hontza gestiona canales RSS de un modo muy potente:
- Agregación: Suma decenas de RSS de distinta procedencia
- Filtrado: Filtra noticias con lógica booleana (OR, AND, NOT).
- Permite decenas de términos de filtrado con varias condiciones
- Contiene ciertas palabras en el titulo
- Contiene ciertas palabras en la descripción
- Contiene ciertas palabras en el enlace
3. CSV: Hontza permite cargar datos de fuentes que emitan con plantillas csv.
4. JSON: Hontza permite importar en formato JSON, dejando seleccionar qué elementos del JSON serán los que se descarguen a la plataforma en los campos title, link, description.
5. Google Sheet: Las Google Sheet u Hojas electrónicas de Google son a la vez una plataforma y una herramienta que permite escrapear y almacenar de modo sencillo fuentes no-RSS.
AYUDAS
Hemos desarrollado dos plantillas de scraping, que facilitan a cualquier usuario no programador, con un entrenamiento adecuado, explotar fuentes sistemáticamente y gestionarlas.
Hontza descarga directamente las Google Sheet creadas con estas plantillas, indicando sólamente el ID y el nº de la hoja
HOUND
Hound es un servidor de Scripting + Scraping que explota las fuentes más complicadas y las convierte en RSS:
- Crear Hound: Hontza permite que un usuario construya un canal Hound a su medida y lo explote de modo exclusivo.
- Cargar Hound: Hontza permite obtener los resultados de un canal Hound construido por CDE.
- Filtro Hound: Hontza permite obtener noticias desde un canal Hound y luego filtrarlas usando cinco filtros diferentes.