🧠 Cómo convertir cualquier artículo web en un audio usando IA de Google (Gemini + TTS)
¿Te gustaría transformar artículos de Internet en audios que puedes escuchar mientras cocinas, conduces o descansas? Esta guía te enseña paso a paso cómo montar tu propia aplicación para hacerlo en cualquier equipo, usando inteligencia artificial de Google.
✅ ¿Qué hace esta aplicación?
Toma una lista de URLs de artículos.
Extrae el contenido visible de la página (como si fueras tú leyéndola).
Envía el texto a Gemini Flash, que filtra el contenido útil con IA.
Convierte el texto limpio a voz con Google Text-to-Speech.
Genera un archivo .mp3 con todo el contenido leído en voz clara y profesional.
🧰 Requisitos previos
Python 3.9+ instalado en tu sistema
FFmpeg instalado y en el PATH (necesario para unir audios)
Puedes descargar FFmpeg desde:
🔗 https://ffmpeg.org/download.html
Una clave de API de Google Gemini
Una cuenta de Google Cloud con acceso a Text-to-Speech
Tu archivo de credenciales de Google Cloud: clave-google.json
📁 Estructura recomendada de tu carpeta
mi_aplicacion/
│
├── scraper_a_voz.py ← El script principal
├── urls.txt ← Lista de URLs a convertir
├── clave-google.json ← Clave de servicio de Google Cloud
└── voz_completa_*.mp3 ← Archivos generados
📦 Instalación de dependencias
Abre la terminal o consola y ejecuta:
pip install requests beautifulsoup4 google-cloud-texttospeech pydub
📝 Paso 1: Escribe tus URLs
Crea un archivo urls.txt y coloca allí las URLs que quieras convertir, una por línea. Por ejemplo:
https://www.elconfidencial.com/tecnologia/
https://elpais.com/ciencia/
🔐 Paso 2: Configura tu clave API
🔹 Clave Gemini
Asegúrate de tener tu API Key de Gemini. En el archivo scraper_a_voz.py, reemplaza esta línea:
GEMINI_API_KEY = "TU_API_KEY_AQUI"
por tu clave real:
GEMINI_API_KEY = "AIzaSyCRLvL11msNEN42MjDt87xJb7BN_qwQpG8"
🔹 Clave Google Cloud TTS
Guarda tu archivo clave-google.json en la misma carpeta, y asegúrate de que esta línea esté correcta:
GOOGLE_CREDENTIALS = "clave-google.json"
🚀 Paso 3: Ejecuta el script
Abre terminal en la carpeta donde está el script y ejecuta:
python scraper_a_voz.py
El script hará lo siguiente:
Descargar el HTML de cada URL
Enviarlo a Gemini Flash para limpiarlo con IA
Convertir el texto útil a voz
Guardar el resultado como voz_completa_YYYYMMDD_HHMMSS.mp3
✅ Resultado
Obtendrás un archivo .mp3 con todo el contenido del artículo leído en voz clara, sin menús, ni firmas, ni publicidad.
🧠 Consejo final
Puedes programar este script en un cron job o tarea automática, o integrarlo con tus feeds RSS para tener tus noticias favoritas en audio cada mañana.
People: máxima motivación. Llevo dos semanas con esto y finalmente gracias a la IA (sobre todo) y a una idea de última hora ya tengo solucionado mi programa "Locutor de noticias". ¿Qué es lo que hace? 1. Tú le proporcionas una serie de páginas web. 2. El programa extrae el texto de las páginas y subpáginas. 3. Con la API de Google (tienes que crear tu propia LLAVE API de Google) la IA de Google limpia el texto, eliminando la publicidad y dejando un texto limpio. 3. Lo vuelca todo a un mp3 usando librerías de python. Necesitas un servicio en Google Cloud para usar sus voces. Ojo, esto tiene su aquel, pero la IA te guía en todo: proceso de instalación, librerías a instalar, etc.... una pasada. En el PDF tenéis la guía que le he pedido que me haga.
Originalmente mi fallo es que me dejé asesorar por chatGPT usando librerías de python que hacen tareas como extraer el texto de una web, limpiar el texto de publicidad (pero no funcionaba del todo bien, o no he tenido la paciencia de seguir adelante probando y pidiéndole mejoras).
En una nueva versión dependo totalmente de la API KEY de Google, esta extrae el texto, le quita la publicidad y en una versión diferente lo resume. Todo lo vuelva a aun archivo mp3 (librerías ffmepg instaladas en el entorno virtual de python) que me llevo al móvil y lo escucho tranquilamente.
Sin embargo, poder usar la API de Google de forma tan abierta me simplifica muchísimo las cosas:con un script de python puedo pedirle cualquier cosa como TAREAS ESPECÍFICAS, que me haga un guión de un podcast. Que me escriba un post sobre temas de actualidad. Que busque en twitter temas que son tendencia. Y es mucho más sencillo, el script llama a la IA de Google, ella hace el trabajo duro y me crea dos .txt, uno con un guión de podcast y otro con un post… tremendo.
No hay comentarios:
Publicar un comentario
Tolerancia cero con las faltas de respeto, palabras malsonantes y comentarios denigrantes sobre la sublime saga de Stars Wars..