Yo, robot

Aunque se estima que en el mundo vivimos más de 7 billones y medio de personas, en realidad la mayoría no existimos. Al menos en Internet. Queridos amigos, reconoced conmigo que el captcha no es suficiente, vamos a acabar implantando el test de Voight-Kampff para cualquier click, like o submit que se precie (sí, el de Blade Runner) Veamos 3 ejemplos de negocios exitosos que alimentan ecosistemas emprendedores basados en el fraude.

1. El restaurante mejor valorado que no existía

Imagina que estás pasando unas apacibles vacaciones en el paradisíaco entorno del Lago de Garda y no sabes dónde ir a comer. Abres TipAdvisor y buscas los restaurantes mejor valorados de la zona, siguiendo la promesa de la red social de que son las personas como tú, con sus puntuaciones y comentarios, los que hacen los rankings (y no la maldita propaganda, o la inversión en publicidad). La verdad es que te llevarías una decepción, porque irías de cabeza al «Ristorante Scaletta» que no sólo no existía, sino que estaba en lo alto de un monte 😦

Ristorante Scaletta, vaya jeta

En efecto, todo era una invención de un diario italiano, que quería demostrar que TripAdvisor no sólo no valida ni comprueba las valoraciones de los usuarios, sino que le daba igual que los locales existiesen. En un mes, este restaurante se convirtió en una referencia de la zona. Puedes leer el experimento aquí (no hace falta italiano nivel Dante, se entiende por el contexto)

Precisamente en Italia, la autoridad Antimonopolio fijó una multa para TripAdvisor por la falsedad de sus reviews, de nada más y nada menos que de 500.000€ Al final, un juez resolvió este verano el caso, admitiendo la apelación de la empresa y desestimando la denuncia. El motivo:

«TripAdvisor never asserted that all the opinions were real, even mentioning that verification was impossible and to consider the trend rather than each comment one by one»

TripAdvisor tiene más de 250 millones de reviews. ¿Cuántas de ellas corresponden a personas que han pagado realmente por un servicio? NPI (No Puedo Intuirlo) Recientemente se ha lanzado una campaña en twitter (#noreceiptnoreview), en la que los hosteleros que no pagan por sus reviews (o sus bots amaestrados) quieren concienciar a TripAdvisor de la necesidad de que se verifique que los usuarios realmente están valorando servicios que han consumido. La empresa ya ha comunicado que de momento lo descarta.

Todo esto tiene que ver con que un estudio de la Harvard Business Review concluyó que una, una miserable estrella más en Yelp hacía que el volumen de ingresos de un restaurante independiente subiese entre un 5 y 9%.

Se lo que estás pensando: hagamos un ejército de bots y gestionemos esas reviews a cambio por ejemplo del 30% de aumento de facturación.

2. No te libras de tu cuñao ni en Amazon

Al igual que en TripAdvisor, también Amazon es un nido de cuñaos. Entendiendo como tal el término cariñoso con el que nos referimos a personas que opinan de cosas de las que no saben y sin tener el contexto. Y lo que es peor, a muchos les pagan y hay varias empresas que viven de ello.

¿Por qué? Porque por ejemplo en España 2 de cada 3 consumidores leen las recomendaciones antes de comprar, y en su día, la plataforma de revisión y valoración Reevoo estimó que los productos con más de 50 reviews incrementaban su tasa de conversión en un 4,6% Es más, la propuesta de valor de Reevoo a los retailers es aumentar sus ventas un 18%

Hago reviews por cerveza

Algunos datos que pueden interesar:

En internet te hacen por 5$ una valoración de 5 estrellas de tus artículos en la tienda de Amazon; por ejemplo en el sitio de micro empleos Fiverr (que por cierto levantó 30 millones de $ en rondas de financiación en 2014). Hay sitios, como BuyAzonReviews que te las venden por 22€, pero ojo, porque son revisiones de calidad
Precisamente Amazon acaba de demandar a 1.114 personas que desde Fiverr se ofrecían a escribir valoraciones falsas, alegando que están incumpliendo los términos de servicio. Si alguno tiene interés, puede leerse la demanda porque está subida a scribd. Ya lanzó otro proceso de demanda en abril contra cuatro empresas que ofrecían este servicio.

De hecho, Amazon anunció en junio que empezaría a usar sus modelos de Machine Learning desarrollados a medida para detectar recomendaciones falsas, preocupados por ese ecosistema que surge a su alrededor de gente que se lucra con las reviews falsas, y el impacto que esto tiene en la credibilidad que perciben los clientes. El objetivo del sistema es aprender qué reviews han sido útiles y valiosas para los usuarios, y se aplicará tanto a las estrellas como a los comentarios de texto; dando peso a las valoraciones de usuarios validados, tomando en cuenta las valoraciones de 5 estrellas de productos mediocres, etc.

¿Cuánto puede haber invertido Amazon en sus motores de ML? Ojalá lo supiera. Lo suficiente como para haber llegado a paquetizarlo y ofrecerlo como Machine Learning as a Service.

3. Nadie clickea en tus banners

Aunque algunos expertos de la cosa parece que acaban de darse cuenta, el modelo de pago por impresiones está robotizado que se sepa al menos desde marzo del año 2004.

Por aquél entonces, un señor llamado Michael A. Bradley intentó extorsionar a Google: si no le pagaban 100.000$ abriría masivamente un software de su inversión en el que había trabajado durante 5 años, capaz de generar 3.000$ al mes de ingresos para todos aquellos que quisieran montar modelos de estafa en publicidad. Entre los testimonios de su web, alegres apandadores reconocían haber generado 30.000$ al mes con sólo 10 cuentas de AdSense, con el irrisorio coste de 250$ en concepto de licencia.

Quizá el problema pase de castaño a oscuro cuando son los propios intermediarios del modelo de publicidad online quienes crean los esquemas de fraude. En 2013, The Wall Street Journal publicó que el 54% del tráfico publicitario que redes de anunciantes, brokers y agencias vendieron (y cobraron) entre Mayo de 2012 y Febrero de 2013 no lo vio ningún ser humano.

La Association of National Advertisers (ANA) publicó en Diciembre de 2014 datos demoledores sobre el dinero que se están gastando los anunciantes en conseguir que haya bots que vean sus anuncios. En particular, 6,3 mil millones de $. El estudio, que tuvo en cuenta las campañas online de 36 grandes empresas (como Ford, Nestlé o Pfizer) analizó 3 millones de dominios durante 60 días, contabilizando 5,5 mil millones de visitas. Algunos de los datos:

El 11% de las impresiones en display son generadas por bots
Lo que se dispara hasta el 23% en el caso de vídeos. Vamos, que si te quieres hacer Youtuber, monta una botnet
Por la noche todos los gatos son bots. El 28% del tráfico nocturno lo generan las máquinas
Hay dominios en los que el % de bots se sale de la media, relacionados con finanzas (22%), familia (18%) y hogar (16%)
En el caso del sourced traffic el % de bots llega hasta un deslumbrante 52%, cuando debería ser una garantía de mayor calidad de la visita

En fin, es un negocio redondo. La siguiente imagen os podrá dar una pista de toda la gente que puede llegar a lucrarse gracias a una sencilla red de bots.

Chain of fools

Como veis, el único que no sale es el anunciante, o como a muchas personas les gusta decir, «el que paga la fiesta»

4. Arañas contra Bots

Si estás pensando montar una estafa de publicidad en internet, ten en cuenta que los principales esquemas de fraude se simplifican en dos:

Creas una red de bots en sólo 15 minuos, te pones a infectar ordenadores y te acercas a algún eslabón de la cadena a vender tráfico. Siempre que alguien considere que puede meterle un markup a tu coste y vea los grandes números, hay mercado seguro.
Montas una red de sites donde coloques los anuncios, inviertes en SEO para justificar lo bien posicionado que estás, y sobre esos, generas tu propio tráfico.

Pero esto no es todo vino y rosas, hay gente ahí fuera que te va a intentar cazar. En Febrero de 2014, Google compró spider.io una startup con sede en Londres en la que un equipo de 7 personas llevaban 3 años desarrollando herramientas que detectasen esquemas de click fraud. Aunque los detalles de la operación no son públicos, el movimiento de Google iba encaminado a luchar contra la principal lacra de su negocio de publicidad. Las redes de bots perjudican la credibilidad de todos los actores de la cadena, afectan a los precios, pervierten el modelo y sobre todo, es una estafa para el paganini. Un año después de la compra de Google, el equipo Antifraude está formado por 100 personas. No es de extrañar si tenemos en cuenta que según la consultora Evidon (hoy Ghostery), Google sirvió más de 316 mil millones de impresiones de anuncios en 2013.

Precisamente, en 2013 spider.io desveló la red Chamaleon, una botnet de más de 120.000 equipos infectados que costaba a los anunciantes del orden de 6 milones de dólares al mes gracias a 9 millones de visitas ficticias. Estamos hablando de un CPM de 0,66$ El informe había detectado además que la red estaba entrenada para simular tráfico en 200 servidores diferentes.

Lo interesante, al menos para mí, era el por aquél entonces refinado funcionamiento de la botnet, cuyo primer rastro se remonta a 2012. Porque los ordenadores infectados simulaban comportamientos y patrones de navegación humanos.

Es su cumpleaños y le regalan una cartera de piel

Cada una de las máquinas de la red simulaba sesiones concurrentes en diferentes sitios web, creando peticiones de navegación que haría un ser humano. Por ejemplo, para no despertar sospechas, los bots eran conservadores: hacían click según patrones aleatorios en varias zonas de la página, hacían movimientos del cursor también al azar, mantenían el ratio de click through en los anuncios por debajo del 0,02%, y generaban patrones de movimiento de ratón sobre los banners del 11%.

Detectar el fraude no es sencillo, y muchas veces tiene que ver con la comparación estadística de la navegación y comportamiento de sesiones, zonas en las que se producen los clicks, la detección de operaciones masivas de destrucción de sesiones y creación de las mismas, etc. Aunque también incluye meterse en los foros del mercado negro, donde donde se compra y vende tráfico, y se gestionan rankings de reputación. Una vez que se identifica un patrón de una botnet, se sube a los servidores PowerDrill de Google, capaces de procesar medio trillón de datacells en menos de cinco segundos, de forma que procesan cantidades masivas de tráfico recibido en un site buscando esos patrones.

El patrón de comportamiento de Chamaleon que detectó spider.io

Cuando se identifican patrones de navegación robóticos, Google echa el freno: deja de pagar al publisher que publicó el anuncio, y no cobra al anunciante.

PS. Bot Data

Teniendo en cuenta que el 61,5% del tráfico de Internet es cosa de bots, a veces me pregunto cuántos data scientist hay por ahí analizando pautas generadas por máquinas.

PPS. Los bots de LinkedIn

Y en LinkedIn ¿también hay bots y cuentas fake?

Pues claro, ¿qué os habéis creído? Tened en cuenta que como dice el título del post, al contrario que en muchas redes sociales, en LinkedIn existimos de verdad. Y desde vuestra lista de contactos podéis exportar una bonita hoja Excel de direcciones de correos validadas de personas validadas.

Oro en paño para los reyes del spam. O las reinas.

Solamente di NO

RANDOMIZE USR 0

El blog de Carlos Guardiola

Yo, robot

1. El restaurante mejor valorado que no existía

2. No te libras de tu cuñao ni en Amazon

3. Nadie clickea en tus banners

4. Arañas contra Bots

PS. Bot Data

PPS. Los bots de LinkedIn

Deja un comentario Cancelar la respuesta

1. El restaurante mejor valorado que no existía

2. No te libras de tu cuñao ni en Amazon

3. Nadie clickea en tus banners

4. Arañas contra Bots

PS. Bot Data

PPS. Los bots de LinkedIn

Cuéntaselo a otros

Relacionado

Deja un comentario Cancelar la respuesta