Resumen: El Doctor David Anderson, jefe de proyecto del programa SETI@home, habla sobre la historia y desafíos de trabajar con la supercomputadora virtual más grande del mundo. El proyecto busca anomalías en los datos del radiotelescopio que pudieran ser consideradas como fuentes no naturales de radio, o ser calificadas como comunicación.|
Una de las citas favoritas de David Anderson, jefe de proyecto del programa de distribución doméstica SETI@home, es del poeta alemán Rilke, que describe lo difícil que puede ser ver el futuro. 'Así como la gente estuvo durante mucho tiempo equivocada sobre el movimiento del sol, lo está aún sobre el movimiento de lo que ha de venir. El futuro permanece firme. . . pero nos movemos en un espacio infinito. ¿Cómo podría no sernos difícil? '
Cuando el proyecto del salvapantallas fue concebido en 1994 durante una fiesta de Navidad, el futuro a gran escala del trabajo computerizado distribuido parecía completamente improbable. En los nueve años siguientes el trabajo de su equipo fue demostrar que podía hacerse.
Para hacerlo, tuvieron que contestar a los cínicos, esperar al crecimiento explosivo de la informática personal como vehículo para reemplazar la propia red del sistema informático principal, y finalmente conseguir los fondos necesarios. Comparado con los aproximadamente dos millones de dólares recaudados hasta aquí--de la Sociedad Planetaria y una variedad de fuentes privadas y públicas—el costo de los supercomputadores equivalentes sería de cientos de millones de dólares. La base del éxito del proyecto ha sido utilizar una inmensa red de recursos no explotados en ordenadores personales-- la Red.
'En los años noventa hubo una transición gradual en que los ordenadores estaban ocupados... todo el tiempo... a cuando casi nunca estaban ocupados.' --David Anderson
|
Apoyando esta red hay 4.7 millones de voluntarios que poseen esos PCs. Los voluntarios donan ahora rutinariamente los tiempos muertos en sus procesadores para la búsqueda de señales de radio interesantes del espacio profundo. A partir de agosto, los voluntarios habían procesado su billonésimo trabajo (las llamadas unidades de trabajo). A primera vista, podría parecer que la andadura del proyecto va contra las predicciones de Rilke: a pesar de los retos, el equipo SETI@home, ha visto el futuro.
Distribuido por el U.C. del Laboratorio de Ciencia Espacial de Berkeley, los salvapantallas de SETI@home procesan en un solo día lo que de otro modo tomaría miles de años detectar en su búsqueda de inteligencia extraterrestre (SETI). Anderson describe la búsqueda como buscar “los débiles susurros de otra civilización”.
Desde su lanzamiento público en mayo de 1999, los propietarios de ordenadores en más de 226 países se han conectado. [Las Naciones Unidas sólo incluyen 191, y casi dos tercios son países en desarrollo, con pocos ordenadores de repuesto sin usar]. Anderson ha explorado partes del globo, y no pocas civilizaciones, sólo mediante contribuyentes a su proyecto. El mismo día en que SETI@home se lanzó en 1999 su servidor de archivos se saturó sólo por este inesperado estallido de la demanda: ¡Hola Mundo! Desde entonces, SETI@home ha realizado 1.6 millones de años de tiempo de proceso de computadora. Después de cuatro años y medio, esta capacidad de computación continúa duplicándose cada año.
Entre todas las formas de describir técnicamente cuántos datos se han analizado, un aspecto a menudo pasado por alto sobre su acercamiento a la red raramente se menciona--su aparente eficacia humana. Por ejemplo, pídale hoy a cualquier administrador de sistemas que provea de personal una red no probada para manejar 4.7 millones de nodos, y le propondrá una mano de obra equivalente a un batallón de programadores y especialistas de la red. Pero el hecho más notable de Anderson puede haber pasado inadvertido. El equipo puede manejar alrededor del 0.1% de la capacidad de informática total mundial, con tan sólo seis programadores y administradores de sistemas.
Emblemático en su tarea con SETI@home, Anderson está bien preparado como escalador. También es pianista, ocasionalmente organiza conciertos caseros (Chopin y Hugo Wolf), y sustenta hace largo tiempo interés por la música por ordenador. Por si descifrar las señales de telescopio del ruido de radio no fuera suficiente desafío a resolver, completó todos los Enigmas Mensuales del Atlántico con tinta durante algunos años.
La Revista Astrobiology tuvo la oportunidad de hablar con el Dr. David Anderson, sobre el modelo exitoso que el proyecto SETI@home ha demostrado ser y sus propios planes futuros en la informática científica.
La Revista Astrobiology (AM): David Gedye era un estudiante graduado de los suyos en Berkeley, cuando tuvo la oportunidad de contemplar más profundamente las viabilidades de la informática distribuida. ¿Alguna sinopsis de cómo el propio salvapantallas llegó a actuar como interfaz, cómo unos PCs se convierten en la supercomputadora virtual, y el principio del proyecto desde su perspectiva?
David Anderson (DA): En los años ochenta y a principios de los noventa hubo una transición gradual de una situación en la que los ordenadores estaban ocupados la mayoría o todo el tiempo – como los grandes sistemas informáticos (mainframe) compartidos, o los lentos primeros PC que trabajaban para mantenerse al ritmo de las tareas básicas - a una situación en la que casi nunca estaban ocupados. Teclear 90 palabras por minuto en Microsoft Word usa menos del 1% de incluso un chip Pentium lento. La economía de escala llevó a microprocesadores más rápidos en una proporción mayor que los computadores 'grandes', y en los 90 tomaron la primacía. Casi cada 'supercomputadora' construida desde entonces se ha basado en chips tipo Pentium.
David Gedye propuso la idea de la aplicación SETI durante una conversación en una fiesta de Navidad en 1994 en Seattle. Él es el primer responsable del despegue del proyecto – llevó varios años, y se estaba descorazonando, sabiendo que teníamos una gran idea pero siendo incapaz de conseguir algún apoyo.
AM: ¿Tiene usted algún momento en particular de la historia de SETI@home en que le sorprendiera lo activa que se había vuelto la red?
DA: La primera vez que conseguimos 1,000 años de tiempo de CPU en un día. Eso fue increíble, y aún lo es.
AM: ¿Qué es un mal día de computación en el servidor de Berkeley, algo así como un fallo del disco duro o de memoria? ¿Hay días malos?
DA: Los peores días han implicado la corrupción de la base de datos. Esto requiere, en algunos casos, restaurar la base de datos desde una cinta auxiliar e intentar reconstruir los datos perdidos; un trabajo muy laborioso que nos deja fuera de línea por un largo período.
Las unidades de trabajo van del radiotelescopio, la sala de computadoras de Arecibo (arriba) al servidor de distribución de unidades de Berkeley (centro) a algunos grandes usuarios corporativos (abajo), en este caso procesando los datos en un grupo de supercomputadoras Beowulf (Annexion).
|
AM: Usted dio una conferencia alrededor de 2001 en un seminario(conferencia) sobre informática puerto-a-puerto (P2P) en San Francisco, alrededor del momento en que SETI@home (y hasta cierto punto, el intercambio de música, Napster) empezó a demostrar el poder de las redes en modos diferentes. Mencionó dos cosas que destacaron sobre sus experiencias. Primero que usted se sorprendió sobre cómo la competición por el mayor número de unidades de datos procesadas se convirtió en el combustible para la adopción del software. ¿Podría comentar cómo despegó realmente ese componente de concurso?
DA: El crédito (total de unidades de trabajo) es importante por muchas razones. Un numeroso tipo de usuarios no es competitivo como tal, pero quiere evidencias de que su ayuda está representando una diferencia. Si nuestro software tiene un error que de vez en cuando les impide conseguir el crédito de una unidad de trabajo completada, ésto supone mucho para ellos, y nosotros damos alta prioridad a esos errores.
El “Top users” del tablón de usuarios siempre ha estado dominado por las organizaciones (por ejemplo las compañías de ordenadores) que poseen muchos ordenadores y los ejecutan todos bajo la misma cuenta. Por esta razón, la competición se enfocó por equipos; da una oportunidad a cada usuario de pertenecer a una entidad 'Top 10'.
Los equipos también han jugado un papel en la adopción - los miembros del equipo reclutan a nuevos usuarios para subir posiciones a su equipo.
AM: También mencionó usted algo sobre los sistemas operativos, que uno de los problemas tempranos más desafiantes era hacer funcionar el salvapantallas de Mac --y que uno de los programadores especializados [Charlie Fenton] que se metió en el proyecto pudo crear una “plataforma-cruce” de SETI@home para PCs y Macs. ¿Es correcto, y hay algún comentario sobre los desafíos desde el punto de vista del ordenador en cuanto a interoperabilidad en los proyectos de la red de hoy?
DA: Hay una norma llamada “Interfaz Portátil de Sistema Operativo” (POSIX) que proporciona un interfaz común del sistema operativo, para no tener que escribir una versión separada para cada sistema. Desgraciadamente, Windows y pre-OS X Mac implementan sólo una parte del POSIX, y hacen un trabajo pobre con ello. También desgraciadamente, POSIX incluye sólo cosas de bajo nivel como el archivo y comunicación de la red; las características de nivel superior como el interfaz gráfico de usuario (el GUI) y los salvapantallas son totalmente específicos del sistema.
AM: ¿Y eso cambiará con la Infraestructura Abierta para la Red de ordenadores de Berkeley, (Berkeley Open Infrastructure for Network Computer) BOINC, que ha sido diseñada para permitir que otros proyectos científicos accedan a la arquitectura única de SETI@home?
DA: Hay una mejora mayor en BOINC: los gráficos de la aplicación están hechos usando OpenGL que está estandarizado por las plataformas y también puede hacer uso de co-procesadores de gráficos. Así que SETI@home en BOINC tendrá gráficos de mucho mejor aspecto, y usarán menos tiempo de CPU
AM: ¿Qué es un día bueno en la Red? ¿Cuándo un manojo de nuevos datos se envía fuera para el análisis?
DA: Normalmente los datos se generan y distribuyen en una proporción constante. Los días buenos son cuando conseguimos que funcione algún nuevo software. Hemos tenido algunos días buenos con el BOINC recientemente.
AM: ¿Puede usted hablar sobre sus planes extender BOINC? En particular las posibilidades con la biología tales como la clasificación de proteínas y mapa genético, o la predicción del clima. ¿Qué más se ha sugerido?
DA: Hay otro proyecto que implica la detección de ondas de gravedad y LIGO. [Dos detectores de gravedad completamente independientes situados en los Estados de Washington y Louisiana, el Laser Interferometer Gravitational-wave Observatory (LIGO) es esencialmente una medida de tensión gigante, diseñada para detectar las ondas de gravedad por primera vez].
Personalmente estoy sumamente entusiasmado con las posibilidades de BOINC, tanto para los científicos (que ahora tienen oportunidad de hacer cómputos antes irrealizables) como para el público (que pronto tendrá un variado “buffet” de proyectos disponible).
AM: Usted ha tomado el concepto demostrado en SETI@home como un comienzo (Dispositivos Unidos). ¿Qué tipo de proyectos están planeados o se están llevando a cabo, que sean distintos a lo que una red de voluntarios puede proporcionar?
DA: Dispositivos Unidos y compañías similares (más notablemente Entropía) encontraron que no había un negocio revendiendo el tiempo de computación público. No hay suficientes clientes de pago para ello -las compañías farmacéuticas, por ejemplo, no están interesadas por razones de seguridad- y es difícil convencer a las personas de que cedan gratuitamente sus ordenadores para actividades lucrativas. Así que estas compañías han cambiado al mercado corporativo “Intranet' - permitiendo a las compañías de tecnología usar el escritorio de su propio PC para su propia informática de R&D.;
AM: Gateway Inc. tiene alguna clase de estructuración de la red (con Dispositivos Unidos) para procesos de venta en los ordenadores enganchada a las tiendas minoristas. Otra compañía muy exitosa en Houston estaba usando un almacén de computación para ejecutar los trabajos en ordenadores en pre-venta antes de su entrega. Durante 10 días o así,--mientras los ordenadores estaban únicamente almacenados--los usaban para procesar datos geofísicos para la industria del petróleo—principalmente material sísmico para encontrar pozos de petróleo a perforar. Su proyecto resolvió dos problemas: el viejo almacenaje en un rápido negocio de tecnología cambiante, y los cálculos innovadores de otro modo inasequibles—o sea, dos 'victorias. ¿Puede usted comentar la naturaleza en general de cómo usar PCs como componentes movibles, pidiendo prestado ciclos, y cómo eso cambia el mundo de las supercomputadoras como grandes dispositivos monolíticos, que cuestan cientos de millones de dólares?
Desde la gran pantalla en la Conferencia puerto a puerto O´Reilly 2001 en San Francisco, a muchos puertos humanos en el público.
|
DA: Hay un amplio espectro de problemas de supercomputación. Algunos de ellos requieren frecuente y elevado ancho de banda de comunicación entre procesadores. Para éstos, las supercomputadoras (como la Iniciativa de Computerización Estratégica Acelerada de IBM, series ASCI) siempre serán mejores.
La informática' distribuida 'pública (mi nombre para lo que hace SETI@home) sólo funciona cuando la proporción de datos a computar es baja, y altas latencias son tolerables.
AM: ¿Se sorprende usted por algunas de las ventajas de hacer este tipo de ciclos “a saltos” de esta manera—era esta especie de bazar lo soñado, cuando los investigadores empezaron primero a entender el poder de compartir la red, o fue en cierto modo un desarrollo?
DA: Cuando empecé a investigar la ciencia informática, en 1985 o así, estaba desconcertado por la obsesión del mundo de la investigación con multiprocesadores de memoria compartida, que eran caros de construir y difíciles de programar.
¿Por qué construir un nuevo hardware cuándo ya tenemos una red (Internet) y procesadores (los PCs de escritorio)?
Trabajar así en SETI@home - y ahora BOINC - es especialmente divertido para mí porque me permite poner en práctica las ideas que tenía hace aproximadamente 15-20 años.
Qué viene después
El equipo de SETI@home tiene planes para acabar la encarnación actual de SETI@home en aproximadamente un año, para ser seguido por una mejor capacidad. Resumieron el plan del proyecto para 2003 y más allá: 'Debido a la increíble respuesta podremos extender SETI@home, pasados sus iniciales dos años de vida. Estamos planeando ahora el SETI@home II. Podríamos aumentar nuestra cobertura de banda de radio en Arecibo agregando otro sistema grabador. Podríamos agregar un sistema de registro a un telescopio en el hemisferio sur para poder ver una parte completamente diferente del cielo. También añadiríamos nuevas características a nuestro sitio web que muestren más detalles del proceso de análisis, y muestren en más detalle su contribución personal a SETI@home.'
La Sociedad Planetaria ha sido un patrocinador fundamental de SETI@home desde 1998.