Si ha estado prestando atención recientemente a YouTube, es posible que haya notado la tendencia creciente de llamados «canales de YouTube sin rostro» Eso nunca presenta a un humano visible que habla en el marco de video. Mientras que algunos de estos canales son simplemente escritos por humanos tímidos, muchos más son Totalmente automatizado a través de herramientas con AI Para elaborar todo, desde los guiones y las voces en off hasta las imágenes y la música. Como era de esperar, esto es a menudo vendido como una forma de Gente un dólar rápido en el algoritmo de YouTube con un esfuerzo humano mínimo.
No es difícil encontrar YouTubers quejumbroso sobre una avalancha de estos canales sin rostro Robar sus archivos de transcripción integrados y Ejecutándolos a través de los resúmenes de IA para generar sus propias imitaciones instantáneas. Pero un youtuber es Tratando de defenderseSembrando sus transcripciones con datos basura que son invisibles para los humanos pero venenoso para cualquier IA que se atreve a tratar de trabajar desde un archivo de transcripción escalfado.
El poder del .ass
Youtuber F4miquien crea Algunas excelentes inmersiones profundas en tecnología oscurarecientemente detalló sus esfuerzos «Para envenenar a cualquier resumen de IA que intentara robar mi contenido para hacer una pendiente». La clave del método de F4MI es el formato de subtítulo .s.Creado hace décadas como parte del software FanSubbing Advanced Substation Alpha. A diferencia de los formatos de subtítulos más simples y populares, admite características elegantes como fuentes, colores, posicionamiento, audaz, cursiva, subrayado y más.
Son estas características elegantes las que permiten que F4MI oculte basura que confunda AI en sus transcripciones de YouTube sin afectar la experiencia subtitular para sus espectadores humanos. Para cada parte del texto real en su archivo de subtítulo, también insertó «dos trozos de texto fuera de los límites utilizando la función de posicionamiento del formato .Ass, con su tamaño y transparencia establecidos en cero para que sean completamente invisibles».
En esos cuadros de subtítulos «invisibles», F4MI agregó texto de obras de dominio público (con ciertas palabras reemplazadas por sinónimos para evitar la detección) o sus propios scripts generados por LLM llenos de hechos completamente inventados. Cuando esos archivos de transcripción se alimentaron en sitios de resumen de IA populares, ese texto basura terminó abrumando el contenido real, creando un script totalmente no relacionado que sería inútil para cualquier canal sin rostro que intente explotarlo.