AI Biz Deepseek, con sede en China, puede haber desarrollado modelos generativos competitivos y rentables, pero sus habilidades de ciberseguridad son otra historia.

Wiz, una casa Infosec con sede en Nueva York, dice que poco después del Modelo de Deepseek R1 Getió atención generalizada, comenzó a investigar la postura de seguridad del equipo de aprendizaje automático. Lo que Wiz encontró es ese Speek, que no solo se desarrolla y distribuye Modelos capacitados abiertamente disponibles, pero también proporciona acceso en línea a esas redes neuronales en la nube: no aseguró la infraestructura de la base de datos de esos servicios.

Eso significa que las conversaciones con el chatbot en línea de Deepseek, y más datos además, fueron accesibles desde Internet público sin necesidad de contraseña.

«En cuestión de minutos, encontramos un accesible públicamente Clickhouse base de datos vinculada a Deepseek, completamente abierta y no autenticada, exponiendo datos confidenciales «, dijo la firma en un consultivo Miércoles. «Fue alojado en oauth2callback.deepseek.com:9000 y dev.deepseek.com:9000.

Esta base de datos contenía un volumen significativo de historial de chat, datos de back -end e información confidencial.

«Esta base de datos contenía un volumen significativo de historial de chat, datos de back -end e información confidencial, incluidos transmisiones de registros, secretos de API y detalles operativos».

Para empeorar las cosas, dijo Wiz, la exposición permitió el control total de la base de datos y la posible escalada de privilegios dentro del entorno de Deepseek, sin ninguna autenticación o barrera para el acceso externo.

Usando la interfaz HTTP de Clickhouse, los investigadores de seguridad pudieron presionar un /play Punto final y ejecuta consultas SQL arbitrarias desde el navegador. Con el SHOW TABLES; consulta, obtuvieron una lista de conjuntos de datos accesibles.

Una de esas tablas, log_streamSe dice que ha contenido todo tipo de datos confidenciales dentro de las más de un millón de entradas de registro.

Según Wiz, esto incluyó marcas de tiempo, referencias a puntos finales de API, historial de chat de texto sin formato de personas, claves API, detalles de backend y metadatos operativos, entre otras cosas.

Los investigadores especulan dependiendo de la configuración de Clickhouse de Deepseek, un atacante podría haber recuperado las contraseñas de texto sin formato, los archivos locales y los datos propietarios simplemente con el comando SQL apropiado, aunque no intentaron tales acciones.

«La rápida adopción de los servicios de IA sin seguridad correspondiente es inherentemente riesgosa», dijo a Gal Nagli, investigador de seguridad en la nube de Wiz. El riego.

«Si bien gran parte de la atención en torno a la seguridad de la IA se centra en las amenazas futuristas, los peligros reales a menudo provienen de riesgos básicos, como la exposición externa accidental de las bases de datos. La protección de los datos del cliente debe seguir siendo la principal prioridad para los equipos de seguridad, y es crucial que la seguridad sea crucial Los equipos trabajan en estrecha colaboración con los ingenieros de IA para salvaguardar los datos y evitar la exposición «.

Según Wiz, Deepseek solucionó rápidamente el problema cuando se informó al respecto.

Deepseek, que ofrece acceso web, de aplicación y API a sus modelos, no respondió de inmediato a una solicitud de comentarios.

Su política de privacidad para sus servicios en línea deja en claro que registra y almacena información de uso total sobre sus servidores en China. La aplicación Android e iOS no está disponible en Italia después de que el perro guardián de protección de datos de Euro Nation comenzó a hacer preguntas indicadas sobre el uso de los datos personales de las personas. Irlanda también es se dice que es investigando.

El negocio también molestó a OpenAi en más de un sentido; El laboratorio estadounidense famoso por raspar Internet para los datos de capacitación cree que Deepseek utilizó los modelos GPT de OpenAI para producir material para entrenar las redes neuronales de Deepseek. ®

Source link