CONTRATAPA

Oren Etzioni

 Por Adrián Paenza

Es muy posible que usted no haya escuchado nunca hablar de Oren Etzioni. Yo tampoco hasta hace un par de días.

Etzioni es profesor de Inteligencia Artificial en Seattle, y una de las personas con mayor prestigio en esa área de la ciencia. Hace unos días, fue contratado por Paul Allen, uno de los cofundadores con Bill Gates de Microsoft.

Corría el año 2003. Etzioni tenía un hermano que vivía en Los Angeles. Cuando fijó la fecha de su casamiento le avisó a Oren porque quería que fuera uno de los testigos. Faltaban casi ocho meses y Oren decidió comprar el pasaje con anticipación para que le saliera más barato.

Y llegó el día del viaje. No bien el avión alcanzó su altura de crucero le comentó al pasajero que tenía a su derecha lo feliz que estaba porque había logrado un precio tan barato por el boleto. Su compañero de fila no sólo no se inmutó, sino que le dijo que él había pagado casi un 40% menos. Etzioni quiso saber entonces si había comprado el pasaje por Internet (como había hecho él), y éste le contestó que sí. Peor aún: le dijo que como le avisaron que tenía que viajar con urgencia, había terminado comprando el boleto el día anterior. Oren estaba enfurecido. Pensó que quizás sería uno de los últimos pasajes y la compañía había decidido “rematarlos” para que el avión no saliera con asientos vacíos. Y comenzó a averiguar en las filas anteriores y posteriores. Ya desesperado, descubrió lo peor: todos habían pagado menos y todos habían comprado sus boletos después que él.

Si esto nos hubiera pasado a usted y/o a mí es posible que nos hubiéramos fastidiado también, pero las acciones que tomó Etzioni fueron ciertamente diferentes que las que hubiéramos tomado nosotros.

Oren Etzioni fue el primer graduado que Harvard tuvo en el año 1986 en ciencias de la computación. Como ya era profesor en la Universidad de Washington, aprovechó todos sus conocimientos (y contactos) científicos y se propuso tratar de averiguar cómo conseguir y usar bases de datos para poder predecir si los pasajes entre cada par de ciudades subirían o bajarían de precio en función del tiempo. De hecho, pensó a cada asiento como si fuera un objeto que se cotiza en alguna Bolsa de comercio. Naturalmente, las compañías aéreas no le darían la información de cómo determinan el precio de cada asiento, pero las variables para hacer lo que él quería son muchas: distancia temporal con la partida, lugar en la cabina, tipo de avión, frecuencia de los vuelos, épocas del año, días de la semana, horario del día, peso de la carga, precio del combustible en esa fecha, etc. Pero también hay que considerar que -como decía más arriba- cuando un avión está programado para salir, una vez que está garantizado un número mínimo de pasajeros, la compañía necesita llenar el espacio disponible. Cada asiento que sale vacío, implica una pérdida. Las compañías tienen su algoritmo para tomar esas decisiones, pero para nosotros, los pasajeros, esa información está vedada.

Etzioni sabía que él no podría asegurar con un 100% de certeza cualquier predicción que pudiera hacer su algoritmo. Podría, sí, hablar de probabilidad: en función de lo que había sucedido en otras situaciones equivalentes. Su objetivo no era reproducir lo que hacen las líneas aéreas, sino dar un servicio al cliente advirtiéndole qué probabilidad hay de que el precio suba o baje y sugerirle o bien que espere o bien que compre.

El problema era justo para ser abordado por un programador que debía diseñar un algoritmo que tomara la mayor cantidad de datos que pudiera recolectar y pudiera descubrir las tendencias que tenían encerradas. Y acá está la clave: Etzioni no quería competir con las compañías aéreas para saber “por qué” debería pasar algo sino, solo, poder predecir “qué y cuándo” habría de pasar en función de lo que había pasado antes.

Una pausa para incluir brevemente a dos actores más. Viktor MayerSchonberger nació en Austria, es doctor en abogacía y profesor en Inglaterra en la Universidad de Oxford. Por otro lado, Kenneth Cukier es periodista de origen inglés y editor del famoso semanario británico The Economist. ¿Por qué hablo de los dos en este lugar del relato? Porque ambos entrevistaron a Etzioni para saber qué y cómo hizo para lograr su propósito.

Etzioni les contó que –en principio– siguió el precio de 12 mil boletos rastreando información por Internet que había obtenido relevando los datos de un par de agencias de viajes. Usó para eso un período de 41 días. Eso le alcanzó para diseñar un modelo que podía predecir –aún modestamente– qué convenía hacer: comprar o esperar. El algoritmo sería efectivo si sus predicciones de comprar o esperar superaban el 50% de aciertos. Es decir, uno siempre parte con la alternativa de tirar una moneda: si sale cara, comprar. Si sale ceca, esperar. ¿Cómo hacer para mejorar ese algoritmo? O puesto en términos de Shakespeare: “¿comprar o no comprar?” A tal punto fue así que su proyecto se llamó Hamlet.

Lo que Etzioni necesitaba entonces era conseguir los siguientes datos: tomar dos ciudades cualesquiera. Elegir un vuelo que las uniera, en principio sin escalas. Fijar una compañía de las varias que ofrecían el servicio. Seleccionar cada asiento de la cabina. Detectar el primer día en el que era posible pagar un pasaje y empezar a llevar un registro de esos datos.

A medida que iba pasando el tiempo, analizar la fluctuación de cada uno de esos precios cuando se acercaba la fecha del viaje propiamente dicho. Incorporar el dato adicional de permitir escalas y determinar cómo alteraba el valor del asiento. Incluir también la posibilidad de utilizar días alternativos y considerar aeropuertos cercanos.

Como usted advierte, ya es abrumador el solo hecho de tratar de hacer una descripción exhaustiva de los datos a tener en cuenta. Pero si bien se necesitan una “tonelada” de datos, las computadoras pueden almacenarlos.

Después, hay otra historia: hay que comparar lo que sucedía con otras compañías que ofrecían el mismo servicio. Y finalmente, saber cuáles habían sido los precios reales pagados por cada asiento. Y no me quiero olvidar de algo importante: el número de asientos vacíos con el que salió el vuelo para poder interpretar y/o predecir lo que sucedería en el futuro.

Por supuesto, tener los datos es esencial, pero insuficiente. Después, hay que escribir un algoritmo que sepa qué hacer con ellos.

Bien, eso fue lo que hizo Etzioni.

Pero para hacerlo consiguió gente que puso dinero y se hizo socia de él. Formó una sociedad que llamó Farecast (algo así como un pronosticador de tarifas). El programa no sólo predecía cuál era la probabilidad de que los boletos subieran o bajaran, sino que Farecast anunciaba sus predicciones en forma pública. Además, dejaba un registro en la página Farecast.com para que el propio público pudiera seguir los vaivenes de los precios, como quien sigue el valor de una acción en la Bolsa. Como escribieron Schonberger y Cukier, el proyecto necesitaba –para mejorar el cálculo– conseguir más datos, muchos datos, “toneladas de datos”. Hasta que lo logró. Etzioni no revela en sus comentarios cómo, pero pudo finalmente tener acceso a la base de datos de una de las compañías aéreas más importantes de EE.UU. No le dieron el algoritmo, sino que consiguió la evolución de los precios. Eso fue suficiente.

A partir de allí, su sistema podría predecir con una probabilidad aceptable si convenía comprar o no un pasaje, basado en el valor de “todos los asientos de todos los vuelos” de la mayoría de las rutas norteamericanas de aeronavegación comercial en el curso de un año. Los datos involucrados son escalofriantes: el programa analiza casi 200 mil millones de números para hacer sus predicciones.

El éxito y el entusiasmo fueron instantáneos. Cuando Etzioni había decidido ampliar la compañía para hacer predicciones no sólo en la industria de los pasajes aéreos sino también anticipar si convenía reservar habitaciones de distintos hoteles o establecer la probabilidad de comprar o no autos usados... en ese momento, año 2008, apareció Microsoft y le compró el algoritmo y la idea. Eso sí: la compañía de Bill Gates le pagó 115 millones de dólares.

Schonberger y Cukier escribieron que en el año 2012 el sistema hizo predicciones correctas en tres de cada cuatro veces, o sea, un 75 por ciento. No es poco. Como suele suceder cuando un “grande” se come a un “chico”, Microsoft incorporó lo que fue Faredata a su “buscador” Bing. Ahora, usted y yo podemos acudir a Bing, obtener el servicio e ignorar el origen. Sin embargo, creo que la historia, esta historia, merecía ser contada.

Para el final, algo para pensar. Todos repetimos algo que es muy cierto: las computadoras actuales son cada vez más rápidas, cada vez tienen más capacidad de guardar datos y cada vez la memoria es más barata. Todo bien. Pero esa capacidad de almacenamiento y la rapidez para poder bucear y rastrear la información es la que está permitiendo descubrir mensajes escondidos en esos datos que ni siquiera sabíamos que existían. Lo notable es que todo esto es un campo “casi” virgen. El que llega primero se queda con todo. Y eso es lo que necesita el país (entre otras cosas, claro está): promover las llamadas ciencias “duras”. Hacen falta más matemáticos, programadores, analistas de sistemas, criptógrafos, físicos, químicos, nanotecnólogos, ingenieros, biólogos, geólogos, biogenetistas, analistas de sistemas, gente que se dedique a la aviónica, a la industria del videojuego (sí, el videojuego, de donde surgen “infinitas” ideas), al diseño de satélites, etc, etc. Aquí es donde están las mayores posibilidades para inventar y desarrollar. O, si usted prefiere, necesitamos capacitar cada vez más gente en estas áreas para estimular y facilitar el acceso a la información y educación de nuestros jóvenes pero, sobre todo, generar las condiciones para que puedan expresar su capacidad creativa de manera tal que aparezcan y florezcan nuestros Etzioni.

Compartir: 

Twitter
 

 

Logo de Página/12

© 2000-2019 www.pagina12.com.ar | República Argentina | Política de privacidad | Todos los Derechos Reservados

Sitio desarrollado con software libre GNU/Linux.