miércoles, abril 24, 2024
InicioNoticiasControl de AccesosClearview y los límites del scraping

Clearview y los límites del scraping

Clearview AI es una empresa norteamericana que trabaja en el reconocimiento facial, desde sus inicios en 2017 ha mantenido un negocio muy específico: hacer scraping de toneladas de servicios donde encuentra fotos de personas junto con sus nombres o algunos detalles de sus identidades, y utilizarlas para crear una enorme base de datos de más de 20 mil millones de retratos. Si puede encontrar una foto suya en línea con su nombre, es probable que esté en la base de datos de Clearview (y algunas otras).

Reconocimiento facial: Acción contra Clearview

La idea de hacer scraping de la web en busca de todo tipo de datos es obviamente muy poderosa, y existen múltiples fallos que justifican el procedimiento. Sin embargo, Clearview es un claro ejemplo de hasta qué punto se puede abusar de un programa de este tipo y convertirlo en un programa que, si bien puede ser de origen legal al limitarse a recopilar datos disponibles en repositorios públicos, puede provocar que algunos sean el resultado. de una violación pública de cualquier protección razonable de la privacidad. De hecho, el problema con Clearview no es solo cómo obtiene sus datos, es cómo, a quién y con qué propósito los comercializa.

Las tecnologías de reconocimiento facial tienen un nivel relativamente alto de sofisticación, pero de ninguna manera están libres de errores, especialmente cuando se usan para grupos raciales distintos a los que pertenecen al grupo racial principal de su algoritmo.

Como tal, el uso de dicha tecnología puede ser problemático, especialmente cuando la herramienta se vende a agencias de seguridad y gobiernos autoritarios de todo el mundo o se usa como juguete para millonarios.

Empresas como Twitter, Meta (especialmente Facebook e Instagram) y muchas otras han intentado que Clearview deje de copiar las fotos de los usuarios, pero no ha sido hasta principios de este mes de mayo cuando la compañía ha cerrado extrajudicialmente una demanda de la American Civil Liberties Union (ACLU) solo evitará que venda el acceso a la base de datos a empresas privadas, no a agencias estatales o gubernamentales.

Países como Australia, Francia, Italia y el Reino Unido han multado a Clearview y exigido que se eliminen las imágenes de sus ciudadanos de su base de datos, pero la compañía y su CEO, Hoan Ton-That afirman que «Clearview AI no tiene sede en la UE, no tiene clientes en la UE, y no realiza ninguna actividad que implique que está sujeta a la GDPR», lo que plantea dudas sobre la validez de estas solicitudes de eliminación y debería llevar a los países demandantes a emitir una orden internacional de búsqueda y arresto en su contra, como así como una orden internacional de búsqueda y captura contra su empresa, todos los directores.

Detrás de la empresa, el nefasto Peter Thiel es el cofundador de PayPal, quien por razones similares usó la mayor parte de sus ganancias para crear otra empresa igualmente controvertida, y una que probablemente lo conozca mejor que usted: Palantir. Evidencia de que se debe limitar el uso del sitio web y de la información que contiene y no tanto la herramienta utilizada, sino con qué finalidad.

¿Qué es el web scraping?

El web scraping («raspado web» o «scrapear») es un proceso de ciencia de datos que se utiliza para extraer datos de páginas web, generalmente en el lenguaje de programación Python y, a través del machine learning, para simular cómo las personas navegan por sitios web específicos.

Los objetivos pueden ser la conversión de contenido, el almacenamiento de datos web, el reconocimiento de estructuras de código HTML únicas, la recopilación de información, la extracción y el análisis de datos, la automatización de la generación de enlaces, price mapping, la búsqueda de tendencias, el seguimiento de la competencia, la fijación de precios. Los usos son numerosos y en general son útiles para cualquier proyecto digital.

El popular captcha se creó para evitar el abuso de Web Scraping, como el autocompletado de formularios o la creación de cuentas falsas, por ejemplo.

¿Por qué es importante conocer del scraping?

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y los términos de servicio de Google.

LO MÁS LEÍDO