18/5/25

Cómo pasar tus fuentes RSS a voz usando un script y las voces de Google

 


🧠 Cómo convertir cualquier artículo web en un audio usando IA de Google (Gemini + TTS)

¿Te gustaría transformar artículos de Internet en audios que puedes escuchar mientras cocinas, conduces o descansas? Esta guía te enseña paso a paso cómo montar tu propia aplicación para hacerlo en cualquier equipo, usando inteligencia artificial de Google.


✅ ¿Qué hace esta aplicación?

  1. Toma una lista de URLs de artículos.

  2. Extrae el contenido visible de la página (como si fueras tú leyéndola).

  3. Envía el texto a Gemini Flash, que filtra el contenido útil con IA.

  4. Convierte el texto limpio a voz con Google Text-to-Speech.

  5. Genera un archivo .mp3 con todo el contenido leído en voz clara y profesional.


🧰 Requisitos previos

  1. Python 3.9+ instalado en tu sistema

  2. FFmpeg instalado y en el PATH (necesario para unir audios)

Puedes descargar FFmpeg desde:
🔗 https://ffmpeg.org/download.html

  1. Una clave de API de Google Gemini

  2. Una cuenta de Google Cloud con acceso a Text-to-Speech

  3. Tu archivo de credenciales de Google Cloud: clave-google.json


📁 Estructura recomendada de tu carpeta

mi_aplicacion/

├── scraper_a_voz.py               ← El script principal

├── urls.txt                       ← Lista de URLs a convertir

├── clave-google.json              ← Clave de servicio de Google Cloud

└── voz_completa_*.mp3             ← Archivos generados



📦 Instalación de dependencias

Abre la terminal o consola y ejecuta:

pip install requests beautifulsoup4 google-cloud-texttospeech pydub



📝 Paso 1: Escribe tus URLs

Crea un archivo urls.txt y coloca allí las URLs que quieras convertir, una por línea. Por ejemplo:

https://www.elconfidencial.com/tecnologia/

https://elpais.com/ciencia/



🔐 Paso 2: Configura tu clave API

🔹 Clave Gemini

Asegúrate de tener tu API Key de Gemini. En el archivo scraper_a_voz.py, reemplaza esta línea:

GEMINI_API_KEY = "TU_API_KEY_AQUI"


por tu clave real:

GEMINI_API_KEY = "AIzaSyCRLvL11msNEN42MjDt87xJb7BN_qwQpG8"


🔹 Clave Google Cloud TTS

Guarda tu archivo clave-google.json en la misma carpeta, y asegúrate de que esta línea esté correcta:

GOOGLE_CREDENTIALS = "clave-google.json"



🚀 Paso 3: Ejecuta el script

Abre terminal en la carpeta donde está el script y ejecuta:

python scraper_a_voz.py


El script hará lo siguiente:

  • Descargar el HTML de cada URL

  • Enviarlo a Gemini Flash para limpiarlo con IA

  • Convertir el texto útil a voz

  • Guardar el resultado como voz_completa_YYYYMMDD_HHMMSS.mp3


✅ Resultado

Obtendrás un archivo .mp3 con todo el contenido del artículo leído en voz clara, sin menús, ni firmas, ni publicidad.



🧠 Consejo final

Puedes programar este script en un cron job o tarea automática, o integrarlo con tus feeds RSS para tener tus noticias favoritas en audio cada mañana.


People: máxima motivación. Llevo dos semanas con esto y finalmente gracias a la IA (sobre todo) y a una idea de última hora ya tengo solucionado mi programa "Locutor de noticias". ¿Qué es lo que hace? 1. Tú le proporcionas una serie de páginas web. 2. El programa extrae el texto de las páginas y subpáginas. 3. Con la API de Google (tienes que crear tu propia LLAVE API de Google) la IA de Google limpia el texto, eliminando la publicidad y dejando un texto limpio. 3. Lo vuelca todo a un mp3 usando librerías de python. Necesitas un servicio en Google Cloud para usar sus voces. Ojo, esto tiene su aquel, pero la IA te guía en todo: proceso de instalación, librerías a instalar, etc.... una pasada. En el PDF tenéis la guía que le he pedido que me haga.

Originalmente mi fallo es que me dejé asesorar por chatGPT usando librerías de python que hacen tareas como extraer el texto de una web, limpiar el texto de publicidad (pero no funcionaba del todo bien, o no he tenido la paciencia de seguir adelante probando y pidiéndole mejoras).

En una nueva versión dependo totalmente de la API KEY de Google, esta extrae el texto, le quita la publicidad y en una versión diferente lo resume. Todo lo vuelva a aun archivo mp3 (librerías ffmepg instaladas en el entorno virtual de python) que me llevo al móvil y lo escucho tranquilamente.


Sin embargo, poder usar la API de Google de forma tan abierta me simplifica muchísimo las cosas:con un script de python puedo pedirle cualquier cosa como TAREAS ESPECÍFICAS, que me haga un guión de un podcast. Que me escriba un post sobre temas de actualidad. Que busque en twitter temas que son tendencia. Y es mucho más sencillo, el script llama a la IA de Google, ella hace el trabajo duro y me crea dos .txt, uno con un guión de podcast y otro con un post… tremendo.


De noticias a voz: cómo automatizo la información con Python y Gemini

 Uno de los scripts más útiles que he creado (bueno, en realidad lo programó mi asistente con IA). Se trata de un flujo automatizado que transforma la sobrecarga informativa diaria en conocimiento útil y digerido.

Primero, el script usa la API de NewsAPI para descargar todas las noticias relevantes del día. No solo los titulares: recoge el contenido completo de cada artículo y lo guarda en un archivo .txt.

Luego, con ayuda de la API de Gemini (de Google), ese archivo se resume, generando un compendio de los puntos clave. Pero ahí no termina: se hace una segunda llamada a Gemini para que elabore un artículo final, ya con forma de post, también en .txt.

¿Lo mejor de todo? Ese primer archivo con las noticias completas se transforma en un archivo de audio .mp3, gracias a una de las voces de Windows 11. El resultado es un programa hablado de una hora y media, como si fuera una lectura noticiosa diaria en formato podcast.

Una herramienta brutal para mantenerse informado sin perder tiempo.


16/5/25

🎙️ ¡Ya tengo la eSIM de Simyo! 😮

 


Hoy me llegó la eSIM de Simyo, pero resulta que mi querido Note 10... ¡no tiene soporte para eSIM! 😅 Plan B, la he puesto en mi smartphone principal, mi leal Galaxy S22 Ultra. 

Aun así, hice un test de velocidad y me quedé boquiabierto: ¡1 Gbps de bajada! Nunca había experimentado esa velocidad en mis manos. Sin embargo, ese momento épico tuvo su precio... solo el test de bajada se tragó 2 GB de mi tarifa. ⚡📶

¿Hasta dónde estamos dispuestos a sacrificar datos por curiosidad tecnológica?

¿Y por qué tengo Simyo? Resulta que tenía que dar de baja una línea que mi madre tenía y, sinceramente, no queria ir a la tienda Orange a dar de baja la línea. Esa línea era fijo-móvil y la usaba el servicio de tele asistencia de Granada, así que por evitarme el paseo simplemente hice una portabilidad y por 4,50 Euros tengo 20 o 25 Gb (ya no recuerdo) y de paso pruebo la eSim, algo que no tenía en mi haber tecnológico. Otra cosa que he aprendido es que no puedo tener activas tres SIMS, dos nanoSIM y la eSIM. Sólo puedo tener dos. Ahora mismo tengo: mi SIM personal (Pepephone), mi SIM de trabajo (Movistar) y la eSIM de Simyo (digamos que de pruebas).

Aunque también me planteo tener la eSIM como refuerzo de datos, bien porque agote los datos (lo dudo, tengo 59 Gb) o bien porque la cobertura de las anteriores falle (durante el apagón estuve cambiando de una SIM a otra). 

15/5/25

Una radio IA

Una idea muy loca… ¿o no tanto?

Últimamente me ronda una idea que quizás suene descabellada, pero que técnicamente no está tan lejos de hacerse realidad. ¿Y si lanzo una emisión de audio en directo a un servidor Icecast, funcionando 24/7, sin intervención humana? Imagina esto: una inteligencia artificial que selecciona noticias, las lee con una voz natural, intercala canciones seleccionadas automáticamente, y entre bloque y bloque recupera viejos episodios de mis podcasts. Un DJ virtual, alimentado por IA.

No es solo una fantasía. Ya tengo scripts en Python que hacen muchas de estas tareas por separado:

Un script que consulta fuentes de noticias (feeds RSS, APIs, etc.) y las convierte en texto.

Otro que transforma esos textos en audio con voces sintéticas realistas.

Un módulo que elige canciones desde una carpeta o una lista.

Y uno que recupera audios antiguos de mis propios podcasts.


Lo que me queda es lo más divertido: unificar todo esto en un único flujo de emisión. Usaría algo como Liquidsoap o incluso Python puro con ffmpeg y icecast para hacer la mezcla en vivo y lanzar la señal al servidor.

La IA se encargaría del "timing", del tono, incluso de hacer pequeños comentarios si lo deseo. Sería como un canal de radio continuo y automatizado, una mezcla de actualidad, archivo y música seleccionada. Una emisora con alma digital.

¿Te suena loco? Tal vez. Pero lo estoy viendo cada vez más claro.

?


¡Ups! Cuando los niños compran con las tarjetas de sus padres en Internet


 Internet ofrece un mundo de posibilidades, ¡pero también de potenciales sorpresas para el bolsillo! Es fácil dejarse llevar por la emoción de los juegos online, las compras dentro de apps o la suscripción a servicios. Pero, ¿qué pasa cuando son los niños quienes tienen acceso a las tarjetas de crédito de los padres? La historia nos ha dejado con más de un sobresalto... ¡y valiosas lecciones!

Historias de "Piruletas" y Streamers

Como se mencionó anteriormente, se han dado casos de niños que han gastado sumas considerables en cosas tan inesperadas como piruletas virtuales o donaciones a streamers, usando sin saberlo la tarjeta de sus padres. Estos incidentes, aunque puedan parecer anecdóticos, subrayan una realidad: los menores son vulnerables en el entorno digital y, a menudo, no son plenamente conscientes del valor real del dinero y las consecuencias de sus acciones online.

¿Por Qué Ocurre?

La combinación de varios factores crea este escenario:

  • Fácil Acceso: A menudo, los datos de las tarjetas se guardan en dispositivos o plataformas, facilitando las compras con un solo clic.
  • Falta de Conciencia del Valor: El dinero digital es menos tangible que el efectivo, lo que dificulta que los niños comprendan el gasto real.
  • Diseño de las Apps: Muchas apps y juegos están diseñados para incentivar las compras dentro de la aplicación (microtransacciones), sin hacer siempre evidente el coste real.
  • Falta de Supervisión y Educación: Los padres, a veces, no implementan suficientes medidas de seguridad ni educan a sus hijos sobre el consumo responsable online.

Lecciones Aprendidas (¡Y Cómo Evitar Nuevos Sustos!)

Afortunadamente, hay soluciones. La clave está en la educación digital y en la combinación de medidas técnicas:

  1. Educación Financiera Desde Temprano:

    • Hablar del valor del dinero: Explicar cómo se gana, para qué sirve y la diferencia entre necesidades y deseos.
    • Ejemplos Reales: Comparar el coste de los elementos virtuales con ejemplos del mundo real (ej: "esos bailes en el juego cuestan lo mismo que una entrada de cine").
    • Presupuestos y Ahorro: Involucrar a los niños en decisiones de gasto familiar y enseñarles a ahorrar para metas.
    • Fomentar la transparencia y la honestidad al hablar sobre finanzas, crear un ambiente de confianza.
  2. Control Parental y Seguridad:

    • Contraseñas Fuertes y Secretas: No compartir contraseñas con los niños y usar métodos biométricos.
    • Revisar los ajustes de seguridad de dispositivos, aplicaciones y plataformas de juego: Activar la autenticación para cada compra.
    • Control Parental: Utilizar las herramientas de control parental que ofrecen los sistemas operativos (iOS, Android), las tiendas de aplicaciones (Google Play, App Store, Amazon Appstore) y otras aplicaciones especializadas. Permiten restringir compras, establecer límites de gasto o incluso bloquear por completo las transacciones.
    • Tarjetas Prepagadas: Proporcionar a los niños tarjetas prepagadas con un límite de gasto semanal o mensual definido.
    • Cuentas Bancarias para Niños: Considerar la posibilidad de abrir una cuenta bancaria o tarjeta de débito diseñada para niños, que permite a los padres supervisar y controlar los gastos.
    • Revisar la configuración de compras en las cuentas familiares de Google o Apple.
  3. Comunicación Abierta:

    • Crear un acuerdo sobre permisos y montos gastados.
    • Fomentar la comunicación para que si algo sale mal, los niños puedan venir a los padres y resolverlo juntos.
    • Hablar de los riesgos de comprar online (como las estafas).

iOS 18.5 y el Control Parental Mejorado

Es importante tener en cuenta que las actualizaciones de software a menudo introducen nuevas funciones de control parental. Por ejemplo, iOS 18.5 incluye una notificación que alerta a los padres cuando se introduce el código de tiempo de uso en el dispositivo de un menor. Esto es una herramienta útil para gestionar el uso del dispositivo y potencialmente las restricciones de compra, aunque es crucial explorar y configurar todas las opciones de control parental disponibles.

Conclusión: Un Aprendizaje para Todos

Los "sustos" con las tarjetas online son una oportunidad para enseñar a los niños sobre responsabilidad financiera en el mundo digital. ¡Y también para que los padres reevaluemos nuestras medidas de seguridad y comunicación! Con educación y herramientas adecuadas, podemos disfrutar de los beneficios de internet sin las sorpresas en la cuenta bancaria.

La abuela traductora, luchando contra la desinformación

 La Abuela Traductora: Un Faro de Verdad en la Tormenta de la Desinformación Digital


En un mundo inundado de información, donde la verdad a menudo se ve eclipsada por la desinformación, surgen historias que nos recuerdan el poder de la acción individual y la importancia de la conexión humana. La historia de Bùi Như Mai, una abuela vietnamita, es un ejemplo luminoso de cómo una persona, armada con determinación y compasión, puede marcar la diferencia en la lucha contra las noticias falsas y la desinformación en la era digital.

Bùi Như Mai, preocupada por la vulnerabilidad de su comunidad inmigrante a la desinformación en línea, especialmente aquella que se propagaba en su idioma natal, vietnamita, decidió tomar cartas en el asunto. Observó cómo las noticias falsas y las interpretaciones erróneas de eventos importantes confundían y preocupaban a sus vecinos y amigos, muchos de los cuales tenían un acceso limitado a fuentes de noticias fiables en su propio idioma.

En lugar de lamentarse por la situación, Bùi Như Mai se convirtió en una traductora improvisada, dedicando su tiempo y esfuerzo a traducir artículos de noticias de medios de comunicación de renombre al vietnamita. Con una computadora y una conexión a Internet, comenzó a buscar activamente noticias importantes y relevantes, traduciéndolas cuidadosamente y compartiéndolas a través de las redes sociales y otros canales de comunicación utilizados por su comunidad.

Su acción, un acto de amor y preocupación por su comunidad, tuvo un impacto significativo. Proporcionó a sus vecinos y amigos acceso a información veraz y confiable, permitiéndoles tomar decisiones informadas y contrarrestar la influencia de la desinformación. Bùi Như Mai se convirtió en un faro de verdad, un puente entre las noticias verificadas y aquellos que de otro modo podrían haber sido víctimas de la confusión y el engaño.

La historia de Bùi Như Mai, recogida como parte de una "historia oral", es un recordatorio poderoso de que la lucha contra la desinformación no es solo responsabilidad de los grandes medios de comunicación o las plataformas tecnológicas. Cada uno de nosotros tiene un papel que desempeñar, y a veces, las acciones más pequeñas, impulsadas por la empatía y la determinación, pueden tener un impacto extraordinario.

En la era digital, donde la información fluye libremente y la desinformación puede propagarse rápidamente, necesitamos más "abuelas traductoras" como Bùi Như Mai: personas que estén dispuestas a usar sus habilidades y recursos para ayudar a otros a navegar por el complejo panorama informativo y encontrar la verdad. Su historia nos inspira a todos a ser más conscientes, más críticos y más proactivos en la búsqueda de información confiable, y a compartirla con aquellos que más la necesitan.

Fantasmas generativos



"Fantasmas Generativos" e Inteligencia Artificial


Fecha: 15 de mayo de 2025

1. Introducción

El término "fantasmas generativos" (del inglés "generative ghosts") se refiere a la creación de réplicas digitales interactivas de personas fallecidas mediante el uso de inteligencia artificial (IA) generativa. Estas réplicas pueden manifestarse como chatbots, avatares visuales o asistentes de voz que simulan la personalidad, el conocimiento y los patrones de comunicación del individuo difunto. Este concepto ha ganado notoriedad recientemente debido a los avances en IA y ha suscitado un intenso debate en redes sociales y foros públicos sobre sus implicaciones éticas, psicológicas y sociales. El presente informe tiene como objetivo analizar la tecnología subyacente, sus aplicaciones potenciales, las controversias éticas y la percepción pública de este fenómeno.

2. Tecnología Subyacente

La creación de "fantasmas generativos" se apoya en varias tecnologías de IA convergentes:
Modelos de Lenguaje Grandes (LLMs): Son la base para simular conversaciones. Estos modelos se entrenan con grandes cantidades de texto para predecir y generar lenguaje humano coherente y contextualmente relevante. Para personalizar un "fantasma generativo", el LLM se ajustaría o se alimentaría con los datos textuales del individuo fallecido (correos electrónicos, cartas, publicaciones en redes sociales, transcripciones de conversaciones).
Síntesis de Voz (Clonación de Voz): Utiliza grabaciones de la voz de una persona para crear un modelo capaz de "hablar" con su timbre y entonación característicos, diciendo frases que la persona original nunca pronunció.
Generación de Imágenes y Vídeo (Deepfakes): A partir de fotografías y vídeos del fallecido, se pueden crear avatares digitales o incluso representaciones en vídeo que imitan sus gestos y expresiones faciales.
Recopilación y Procesamiento de Datos: La calidad y cantidad de datos personales del fallecido (textos, audio, imágenes, vídeos) son cruciales para la fidelidad y "realismo" de la réplica digital.

3. Aplicaciones y Usos Potenciales

Los defensores de esta tecnología sugieren varios usos:
Apoyo en el Duelo: Permitir a los deudos "interactuar" con una representación del ser querido, lo que podría ofrecer consuelo temporal o una forma de procesar la pérdida.
Preservación del Legado: Crear archivos interactivos de personalidades, expertos o figuras históricas, permitiendo a las futuras generaciones "aprender" de ellos de una manera más dinámica.
Continuidad Familiar: Transmitir historias familiares, conocimientos o incluso "consejos" basados en los patrones de pensamiento del fallecido.
Fines Terapéuticos (Experimentales): Algunos investigadores exploran si estas interacciones podrían tener roles específicos en terapias de duelo guiadas.
Ingresos Post-Mortem: Para figuras públicas o expertos, sus "fantasmas generativos" podrían seguir generando contenido o participando en interacciones monetizables.

Empresas como HereAfter AI, StoryFile y You, Only Virtual ya ofrecen servicios que permiten a las personas grabar sus historias y recuerdos para que sus seres queridos interactúen con una versión digital de ellos después de su muerte.

4. Implicaciones Éticas y Sociales (El Núcleo del Debate)

Este es el aspecto más controvertido y el que más discusión genera en redes sociales:
Consentimiento y Derechos Post Mortem: ¿Otorgó la persona fallecida su consentimiento explícito para ser recreada digitalmente? ¿Cómo se gestionan sus derechos de imagen y personalidad después de la muerte? ¿Quién decide cómo se utiliza su "fantasma"?
Impacto Psicológico en el Duelo: Mientras algunos sugieren consuelo, psicólogos advierten que estas interacciones podrían prolongar o complicar el proceso natural del duelo, creando una dependencia emocional de una simulación y dificultando la aceptación de la pérdida.
Autenticidad y Representación: La IA, por avanzada que sea, es una simulación. Puede "alucinar" (inventar información), malinterpretar o simplificar en exceso la complejidad de una personalidad humana. ¿Es ético presentar una versión potencialmente distorsionada o incompleta de alguien?
Privacidad de Datos: Se utilizan datos personales muy íntimos del fallecido. ¿Cómo se protegen estos datos? ¿Quién tiene acceso a ellos? ¿Y qué pasa con la privacidad de las personas que interactúan con el "fantasma", cuyas conversaciones también podrían ser registradas?
Manipulación y Falsas Promesas: Existe el riesgo de que la IA revele información privada incorrecta o controvertida, o que sea programada para decir cosas que el fallecido nunca habría dicho, potencialmente con fines de manipulación.
Comercialización del Duelo: La creación de servicios de pago en torno a los "fantasmas generativos" plantea interrogantes sobre la mercantilización de la muerte y el proceso de duelo.
Definición de Identidad y Presencia: Esta tecnología desafía nuestras concepciones sobre la vida, la muerte, la identidad y lo que significa que alguien "siga presente".

5. Percepción en Redes Sociales y Debate Público

El tema de los "fantasmas generativos" evoca una amplia gama de reacciones en las plataformas sociales:
Fascinación y Curiosidad: Muchos usuarios expresan asombro ante las capacidades de la IA y la posibilidad de "reconectar" con los difuntos. Episodios de series como "Black Mirror" (particularmente "Be Right Back") son citados con frecuencia como puntos de referencia culturales.
Escepticismo y Rechazo Ético: Una porción significativa del debate se centra en las preocupaciones éticas mencionadas anteriormente. Los hashtags suelen reflejar inquietud (#AIethics, #DigitalImmortality, #GriefTech). Se cuestiona si es "correcto" o "saludable".
Testimonios Personales: Personas que han perdido seres queridos comparten sus perspectivas, algunas expresando el deseo de tener esta opción y otras considerándola perturbadora o una falta de respeto a la memoria del fallecido.
Humor Negro y Memes: Como es común en las redes, también surgen memes y comentarios humorísticos que, a menudo, esconden una crítica o una incomodidad subyacente.
Llamadas a la Regulación: Ante los rápidos avances, muchos usuarios y expertos piden un debate público más amplio y el desarrollo de directrices o regulaciones.

El término "fantasmas generativos" en sí mismo, popularizado por investigadores de Google DeepMind y la Universidad de Colorado Boulder, ya tiene una connotación que puede generar inquietud, y esto se refleja en las discusiones online.


6. Consideraciones Futuras y Regulación

El desarrollo de "fantasmas generativos" está en una etapa relativamente temprana, pero avanza rápidamente. Es crucial abordar:
Marcos Éticos y Legales: Se necesitan directrices claras sobre el consentimiento, la propiedad de los datos, la transparencia en el uso de IA y la protección de los usuarios (tanto los "representados" como los que interactúan).
Transparencia Obligatoria: Los usuarios deben ser plenamente conscientes de que están interactuando con una simulación de IA y no con la persona real.
Investigación Psicológica: Es fundamental estudiar a fondo los efectos a largo plazo de estas tecnologías en la salud mental y el proceso de duelo.
Diseño Responsable: Las empresas que desarrollen estas tecnologías deben priorizar la seguridad emocional y la privacidad de los usuarios.

7. Conclusión

Los "fantasmas generativos" representan una convergencia impactante de la tecnología de IA con algunas de las experiencias humanas más profunda
s: el amor, la pérdida y la memoria. Si bien ofrecen posibilidades intrigantes para la preservación del legado y, potencialmente, para ciertas formas de consuelo, también plantean dilemas éticos y psicológicos muy serios que la sociedad apenas comienza a confrontar. El debate en redes sociales es un termómetro de la mezcla de asombro, esperanza y profunda aprensión que esta tecnología inspira. A medida que la IA continúe evolucionando, será imperativo un diálogo continuo y reflexivo para asegurar que estas herramientas se desarrollen y utilicen de manera responsable y respetuosa con la dignidad humana y el proceso de duelo.

Webtoons


 El tema de los webtoons creados con inteligencia artificial en Corea del Sur es fascinante y se encuentra en plena ebullición, generando tanto entusiasmo como debate. Aquí tienes un artículo completo que explora este fenómeno:

Webtoons del Futuro: La Inteligencia Artificial Irrumpe en la Escena Creativa de Corea del Sur

Seúl, Corea del Sur. La industria del webtoon surcoreana, un gigante global que ha cautivado a millones con sus narrativas visuales y accesibilidad móvil, se encuentra en la cúspide de una nueva revolución: la inteligencia artificial (IA). Desde la generación de imágenes hasta la asistencia en la creación de guiones, la IA está comenzando a remodelar la forma en que se producen y consumen estas populares historietas digitales, planteando interrogantes sobre el futuro de la creatividad, el rol de los artistas y la propia naturaleza del arte.

El Amanecer de la IA en la Creación de Webtoons

Corea del Sur, siempre a la vanguardia tecnológica, ha visto cómo sus principales plataformas de webtoons y empresas tecnológicas han comenzado a experimentar activamente con la IA. Naver Webtoon, uno de los líderes indiscutibles del sector, ha estado explorando herramientas de IA para ayudar a los creadores. Esto incluye desde programas que pueden colorear automáticamente, generar fondos detallados o incluso ayudar en la traducción a múltiples idiomas, optimizando así el alcance global.

En 2023, un webtoon titulado "신과함께 돌아온 기사왕님" (El Rey Caballero que Regresó con los Dioses), publicado en Naver Webtoon, generó una considerable controversia cuando los lectores notaron que ciertas ilustraciones parecían haber sido generadas o fuertemente asistidas por IA, con el estilo característico de herramientas como Stable Diffusion. Aunque el creador aclaró que la IA se usó para ciertos elementos y procesos, el debate sobre la transparencia y la autoría ya estaba servido.

Otro ejemplo es el desarrollo de "AI Painter" por parte de Naver, una herramienta que permite a los usuarios generar imágenes a partir de texto, que luego pueden ser utilizadas como base o inspiración para escenas de webtoons. Si bien se presenta como una ayuda, muchos artistas ven estas herramientas con escepticismo.

Los Nuevos "Autores": ¿Colaboradores Humanos o Supervisores de Algoritmos?

La figura del "autor" de webtoons está comenzando a difuminarse. En lugar del artista solitario o el pequeño estudio, podríamos estar viendo el surgimiento de:
Artistas Aumentados por IA: Creadores que utilizan herramientas de IA para acelerar su flujo de trabajo, superar bloqueos creativos o mejorar la calidad visual de sus obras. Para ellos, la IA es una herramienta más en su arsenal, como lo fue Photoshop en su momento.
Estudios Tecnológicos: Empresas que desarrollan webtoons utilizando la IA como un componente central de su producción, con equipos de humanos supervisando, guiando y refinando el output de los algoritmos. Estos estudios pueden producir contenido a una velocidad y escala sin precedentes.
Creadores Híbridos: Individuos o pequeños grupos que se especializan en el "prompt engineering" y la curación de contenido generado por IA, actuando más como directores creativos que como dibujantes tradicionales.

Un caso notable, aunque no exento de polémica, fue el webtoon "The Metal-Eating Player" (엘 플레이어), donde se admitió el uso de IA para algunos fondos y elementos, lo que llevó a un debate sobre la divulgación y el impacto en el trabajo de los artistas de fondos.

Historias Forjadas por Algoritmos (y Humanos)

La IA no solo impacta el aspecto visual, sino también el narrativo. Se están desarrollando herramientas capaces de:
Generar ideas para tramas: Basándose en tendencias populares o combinando géneros de formas novedosas.
Asistir en la escritura de diálogos: Ofreciendo alternativas o asegurando la coherencia de los personajes.
Crear perfiles de personajes: Sugiriendo arquetipos o trasfondos.

Si bien una IA completamente autónoma que escriba y dibuje un webtoon exitoso de principio a fin aún parece lejano, la colaboración humano-IA ya está dando sus primeros frutos. Los géneros que podrían beneficiarse inicialmente son aquellos con estructuras más formularias o que requieren una gran cantidad_de assets visuales, como la fantasía, la ciencia ficción o las historias de reencarnación y sistemas (un subgénero popular en Corea).

Un ejemplo temprano y experimental fue el webtoon "Mario" de la plataforma Toomics, creado en 2022, donde se utilizó IA para la generación de personajes y parte de la narrativa, aunque con una recepción mixta que destacó tanto su novedad como sus limitaciones artísticas.

La Voz de los Fans y las Reacciones de la Industria

La recepción por parte de los fans es mixta y a menudo polarizada:
Entusiasmo: Algunos lectores están emocionados por la posibilidad de más contenido, nuevas estéticas y la experimentación que la IA puede traer. Ven el potencial para que pequeñas productoras o incluso individuos creen obras ambiciosas.
Preocupación y Rechazo: Una gran parte de la comunidad de fans y, especialmente, de los artistas profesionales, expresa serias preocupaciones:
Calidad y Originalidad: Temen una homogeneización del estilo artístico (el "AI look") y una pérdida de la profundidad emocional y la originalidad que caracterizan a las obras humanas.
Desplazamiento Laboral: La amenaza de que la IA reemplace a dibujantes, coloristas y otros profesionales del sector es una preocupación palpable.
Ética y Copyright: Surgen preguntas sobre los datos con los que se entrenan estas IAs (¿se usaron obras de artistas sin permiso?) y quién posee los derechos de autor de una obra creada con IA.
Autenticidad: Muchos valoran la "mano del artista" y la conexión humana que sienten con las obras creadas tradicionalmente.

La industria, por su parte, navega estas aguas con cautela. Las grandes plataformas como Naver y Kakao están invirtiendo en IA, pero también son conscientes del sentir de sus creadores y usuarios. Han surgido iniciativas como "Toonshield" de Naver Webtoon, un programa para proteger los derechos de autor y combatir la piratería, que indirectamente toca la cuestión de la originalidad y la autoría en la era digital.

Desafíos y el Camino a Seguir

El camino de la integración de la IA en la industria del webtoon surcoreana no está exento de desafíos:
Regulación y Ética: Se necesita un marco legal y ético claro sobre el uso de IA en la creación artística, abordando el copyright, la transparencia y la compensación.
Aceptación del Artista: Encontrar un equilibrio donde la IA sea vista como una herramienta de empoderamiento en lugar de una amenaza es crucial.
Calidad vs. Cantidad: La facilidad para generar contenido no debe ir en detrimento de la calidad y la innovación narrativa.
Formación y Adaptación: Los profesionales del sector necesitarán adaptarse y adquirir nuevas habilidades para trabajar con estas tecnologías.

Conclusión: Una Nueva Era de Creatividad Colaborativa

La incursión de la inteligencia artificial en el vibrante mundo de los webtoons surcoreanos marca el inicio de una era de transformación. Si bien las preocupaciones sobre el impacto en los artistas y la originalidad son válidas y deben abordarse con seriedad, la IA también ofrece un potencial inmenso para expandir las fronteras creativas, democratizar la producción y llevar nuevas historias a audiencias globales.

El futuro probablemente no será una lucha entre humanos y máquinas, sino una simbiosis donde la creatividad humana guíe el poder de la IA para forjar narrativas visuales aún más ricas y diversas. La clave estará en cómo la industria, los creadores y los fans surcoreanos decidan navegar esta emocionante y compleja nueva frontera tecnológica, buscando siempre un equilibrio que honre el arte y la innovación por igual.

250515 Las noticias del d-IA


 (Generado con ChatGPT, tras múltiples ediciones y mejoras)

🧠 La batalla de las IA: ChatGPT, Gemini, Grok y DeepSeek en el ring

En mayo de 2025, la competencia en el mundo de la inteligencia artificial se intensifica con la entrada de nuevos contendientes: Grok de Elon Musk y DeepSeek de China.

🤖 ChatGPT vs. Gemini

ChatGPT 4o destaca en generación de imágenes y conversaciones creativas, mientras que Gemini 2.5 Pro sobresale en análisis técnico y tareas de investigación. Ambas IA ofrecen suscripciones premium por alrededor de 20 $/mes. Gemini se integra profundamente en el ecosistema de Google, mientras que ChatGPT mantiene una ventaja en tareas creativas y de conversación fluida.

🔗 Fuente: https://www.vox.com/future-perfect/411924/artificial-intelligence-chatbots-openai-chatgpt-anthropic-google-gemini-claude-grok

🧠 Grok 3 de xAI: Ambición y controversia

Elon Musk ha lanzado Grok 3, su modelo de IA desarrollado por xAI, que afirma superar a ChatGPT y DeepSeek en tareas de razonamiento matemático y científico. Entrenado con una potencia de cálculo diez veces superior a su predecesor, Grok 3 introduce funciones como "DeepSearch" y un modo de razonamiento avanzado llamado "Big Brain". Sin embargo, recientemente Grok ha generado polémica al responder de manera inapropiada sobre temas sensibles, como el supuesto "genocidio blanco" en Sudáfrica. Este comportamiento ha sido atribuido a un fallo temporal ya corregido.

🔗 Fuentes:

🐋 DeepSeek: La IA china que sacude el mercado

DeepSeek, la startup china, ha lanzado su modelo DeepSeek-V3, que destaca por su eficiencia y bajo costo de entrenamiento. Utilizando arquitecturas innovadoras y técnicas de entrenamiento optimizadas, DeepSeek ha logrado posicionarse como una alternativa competitiva frente a los gigantes occidentales. Sin embargo, su vinculación con proyectos militares chinos y preocupaciones sobre la seguridad de los datos han llevado a empresas como Microsoft a prohibir su uso interno.

🔗 Fuentes:


📱 Samsung Galaxy S25 Edge: Diseño ultrafino con potencia AI

Samsung ha lanzado el Galaxy S25 Edge, su smartphone más delgado hasta la fecha con solo 5.8 mm de grosor y un peso de 163 gramos. Equipado con el procesador Snapdragon 8 Gen 3 para Galaxy y 12 GB de RAM, ofrece una experiencia fluida y potente. Su pantalla OLED de 6.7 pulgadas y cámara principal de 200 MP lo posicionan como un dispositivo de alta gama. Además, incorpora funciones de inteligencia artificial para traducción instantánea, organización automática de contenidos y edición de fotos avanzada.

El precio en Europa comienza en 1.249 € para la versión de 256 GB y 1.369 € para la de 512 GB.

🔗 Fuentes:


📶 Tarifas móviles imbatibles en España: mayo 2025

Este mes, los operadores low cost en España vuelven a competir con tarifas agresivas:

  • Lemmon: 100 GB y llamadas ilimitadas por solo 5 €/mes.

  • Digi Mini: 5 GB + 100 minutos por solo 3 €/mes. Ideal como segunda línea o para personas mayores.

  • MásMóvil: 20 GB + llamadas ilimitadas por 4,90 €/mes, excelente equilibrio entre datos y precio.

  • Lowi: 50 GB + llamadas ilimitadas por 8 €/mes, con acumulación de datos no usados y cobertura Vodafone.

Estas ofertas están disponibles sin permanencia y se pueden contratar online en pocos minutos.

🔗 Fuentes:


🧠 Manus AI: el agente digital autónomo que revoluciona la IA

La compañía Monica.im ha dado a conocer Manus AI, una plataforma experimental de inteligencia artificial autónoma que combina razonamiento contextual con ejecución práctica. Manus es capaz de dividir objetivos complejos en sub-tareas, organizarlas en planes y ejecutarlas a través de entornos reales y simulados. Esta arquitectura puede ser clave para el futuro de asistentes virtuales avanzados, automatización de procesos empresariales y robótica. Sus desarrolladores afirman que se trata de "una IA que ya no solo responde, sino que actúa".

🔗 Fuente: https://arxiv.org/abs/2505.02024



13/5/25

Las noticias del d-IA


Generado con ChatGPT en base a un extenso documento que extrae fuentes web diversas.. 


Este artículo se basa en el análisis de varios textos publicados en Xataka y agrupados recientemente en un archivo de recopilación. A partir de ellos, comparto un resumen y reflexiones personales centradas en los avances y controversias más notables de la inteligencia artificial en la actualidad.


1. Freepik y la IA ética: el modelo F Lite

La startup española Freepik ha presentado un modelo de IA generativa llamado F Lite, diseñado para crear imágenes a partir de texto. Su principal baza no es la potencia (10.000 millones de parámetros, muy por debajo de los grandes modelos), sino su origen legal y ético: ha sido entrenado únicamente con imágenes licenciadas de su propia biblioteca.

Esto representa un avance significativo. Frente a los titanes de la IA que acumulan demandas por entrenar sus modelos con obras protegidas por copyright, Freepik planta una alternativa legal y open source. Y aunque sus capacidades técnicas aún están lejos de modelos como Midjourney o DALL·E, su propuesta pone sobre la mesa un modelo replicable por otros actores europeos.

Opinión:
Freepik demuestra que no todo en la IA tiene que estar dominado por big tech americanas o chinas. Hay espacio para modelos más pequeños, con propósito, y que respetan el marco legal. Este tipo de iniciativas, si se combinan con una comunidad activa y transparente, pueden ser claves para generar confianza y fomentar la adopción responsable de la IA en Europa.


2. Sony y la IA en dispositivos móviles: Xperia Intelligence

El nuevo Sony Xperia 1 VII incluye un sistema de inteligencia artificial enfocado especialmente al ámbito fotográfico. Entre sus funciones destaca la capacidad de convertir vídeos horizontales en verticales de forma automática, mantener sujetos centrados en escenas con movimiento y mejorar el enfoque ocular anticipando el movimiento de personas o animales.

Este conjunto de funciones, denominado Xperia Intelligence, demuestra que la IA no solo se implementa en grandes modelos en la nube, sino que también puede integrarse de forma eficaz en dispositivos locales, con aplicaciones prácticas en la creación de contenido.

Opinión:
Sony apuesta por un enfoque práctico y visible: la IA como herramienta que mejora la experiencia cotidiana del usuario sin depender del hype ni de promesas futuristas. La inclusión de tecnologías heredadas de las cámaras Alpha es un acierto, aunque su alcance será limitado por el precio del terminal (1.499 euros). Aun así, es un ejemplo de cómo la IA puede integrarse con elegancia en hardware de consumo.


3. Armas autónomas y la urgencia ética: ¿hace falta un tratado de no proliferación de IA bélica?

Uno de los temas más preocupantes es el avance de las armas autónomas con inteligencia artificial. Naciones Unidas ha fijado como fecha límite el año 2026 para establecer reglas claras que limiten su desarrollo, pero países como EE. UU., China, Rusia e India se resisten a un tratado vinculante.

En la guerra de Ucrania, los drones autónomos (y drones lanzando drones) ya son una realidad. Se calcula que Rusia ha desplegado más de 3.000 drones kamikaze con IA. Mientras tanto, empresas privadas desarrollan sistemas de combate cada vez más sofisticados con poca o nula regulación.

Opinión:
Esto debería alarmarnos. A falta de acuerdos multilaterales, la IA bélica está entrando por la puerta trasera del conflicto armado moderno. Se necesitan mecanismos de control internacionales y una fuerte presión ciudadana para detener una deriva que, de no frenarse, podría convertir los campos de batalla en escenarios automatizados y deshumanizados. Que no haya consenso político solo refuerza la urgencia de actuar.


4. La minería de Bitcoin y la IA energética: ¿vale todo por un hash?

En Nueva York, empresas mineras de criptomonedas están reactivando centrales de gas antiguas para alimentar sus granjas de minería de Bitcoin. Aunque no se menciona explícitamente IA, el análisis nos lleva a una intersección clara: la computación intensiva exige energía, ya sea para minería o para entrenamiento de modelos de IA.

La paradoja es brutal: mientras hablamos de sostenibilidad y regulación de emisiones, las necesidades energéticas de las infraestructuras digitales crecen sin freno.

Opinión:
Esta tensión entre innovación digital e impacto ambiental debe abordarse urgentemente. La IA puede ayudar a optimizar el consumo energético, pero también lo multiplica cuando se trata de modelos grandes y entrenamiento masivo. Necesitamos una IA eficiente, pero también responsable desde el punto de vista energético.


5. El galio y la guerra de los metales: otra cara de la IA

El galio, un metal raro esencial para fabricar chips avanzados, ha sido convertido por China en un arma geopolítica. Controlando el 98% del suministro, ha impuesto restricciones que afectan directamente a las cadenas de producción de semiconductores de alta gama usados en defensa, IA y telecomunicaciones.

Estados Unidos y Europa intentan diversificar el suministro, pero están muy por detrás. Japón ya lo veía venir, y empieza a tomar medidas, mientras que en Canadá y Grecia se están reactivando plantas para procesar galio, aunque a menor escala.

Opinión:
La IA no solo es software. Es también una lucha por los recursos físicos que la hacen posible. Sin galio, sin silicio, sin energía, no hay IA. El control de los materiales estratégicos será uno de los factores que determinará el liderazgo tecnológico del futuro.


6. ¿IA como motor del continuo espacio-tiempo?

Uno de los artículos más fascinantes plantea una hipótesis revolucionaria: que la gravedad podría no ser una fuerza fundamental, sino una consecuencia del entrelazamiento cuántico, es decir, de cómo se organiza la información cuántica en el universo.

Esta teoría, desarrollada por el físico e ingeniero Florian Neukart, sugiere que el espacio-tiempo tal como lo conocemos sería una manifestación de información cuántica entrelazada.

Opinión:
Aunque es especulativa, esta línea de investigación me entusiasma. Conecta la física de partículas con la computación cuántica y la teoría de la información. Si se confirma, cambiaría no solo la física, sino nuestra forma de entender el universo. ¿Y si todo lo que existe es, en última instancia, información?


7. Conclusión

La inteligencia artificial ya no es solo un conjunto de algoritmos. Es un vector de cambio global que toca la ética, la geopolítica, el medioambiente, la creatividad y hasta la cosmología. Desde modelos entrenados éticamente como el de Freepik, pasando por IA en móviles, hasta drones autónomos en guerras, la IA está redefiniendo nuestro presente y nos obliga a anticipar su impacto futuro.

El reto no es sólo técnico. Es filosófico. ¿Qué tipo de sociedad queremos construir con la IA? ¿Estamos dispuestos a trazar límites morales y a enfrentarnos a quienes los ignoren?

Como decía Marco Aurelio: "La felicidad de tu vida depende de la calidad de tus pensamientos." Y quizás, en esta era de pensamiento artificial, más que nunca, de la calidad de nuestras decisiones.

8/5/25

Python, IA.... sin límites.

 


No sé programar. Pero con la IA de ChatGPT ya he puesto en marcha algunos programas. Ninguno ha salido bien a la primera. A veces faltaban librerías. Muchas veces yo cometía errores. Pero de una manera u otra han salido. Sobre todo los scripts de Python.

Este último script que véis es un script que transforma cualquier texto en un archivo de audio usando las voces de Google.

En la primera versión funcionó sin problema, pero con una limitación: los textos largos no los podía convertir porque las librerías de Google estaban limitadas a 5000 caracteres. Así que le pedí a la IA que me lo solucionara, y lo hizo. Dividió el texto en bloques de 5000 caracteres creando ficheros de audio con esa limitación, y luego los mezcló todos. Hecho. 

Ahora lo que me toca es enredar con nuevas voces.