22 febrero 2006

Tercera sesión del ciclo Web 2.0 en Zentrum. Y si la semana pasada el aforo estaba lleno, en esta ocasión repetimos aforo. La verdad es que en cuanto a público estas sesiones están resultado un auténtico éxito. Y en cuanto a contenidos, por el momento, la cosa es de difícil superación. Hoy hemos podido disfrutar de una sesión de altísimo nivel a cargo de Asunción Gómez Pérez, que es Directora del Grupo de Ingeniería Ontológica de la Universidad Politécnica de Madrid.

Y para quien piense que el título de la charla se puede quedar en un contenido típico y tópico, pues se equivoca. Realmente hemos asistido a una sesión de esas de las que uno se alegra de haber estado ahí. Yo he salido impresionado del nivel, insisto, de la misma.

La presentación de la charla ha corrido a cabo de Alfredo Hernández, de Heraldo de Aragón.

Y la sesión se ha iniciado con una exposición rápida de la estructura que iba a tener, que puede dividirse en tres fases diferenciadas:

  1. La web semántica
  2. Ontologías
  3. Aplicaciones

Respecto de la web semántica

El primer argumento que se pone encima de la mesa es que en internet hay un exceso de información, hay cierta saturación de información. Hay muchos usuarios, éstos crecen rápidamente, y la información crece también. Ello suele desembocar en que la información que se nos ofrece cuando realizamos una búsqueda a través de un buscador es abundante y, por lo general, no responde del todo a nuestras espectativas. Digamos que las búsquedas son un tanto deficientes.

La ponente está todo el tiempo de pie, y no se sienta tras la mesa, con lo que la sensación de cercanía se presupone. Sin embargo, el ritmo de la charla es endiablado, y la dicción de la ponente no ayuda en exceso a perder la atención.

En este punto se hace un inciso, y las transparencias nos muestran varios modelos de código HTML cuyos contenidos están en varios idiomas. Dos de esos idiomas son el árabe y el japonés, que por normal general no son conocidos en nuestro entorno. Sin embargo, contar con una serie de etiquetas, en este caso HTML nos permite adivinar algo del a estructura del contenido que se quiere mostrar con ese HTML. Sin embargo, no adelantemos acontenicimientos. Lo que se quiere explicar con esto es que las personas entienden el contenido de una página si éste está en su idioma. Las etiquetas, HTML, XML u otras, son las que van a hacer comprensible a ojos de las máquinas los contenidos de la web.

No quiero dejar pasar la oportunidad de dejar constancia de que el marcado HTML que hemos visto en estos modelos de código no parecen las recomendadas. Unas etiquetas b y BR (así con mayúsculas) me han hecho un poco de daño en los ojos y, sinceramente, no lo esparaba así.

Pero bueno, en este amago de crónica de la charla ese tema queda un poco en anécdota. Sigamos. Vemos después cómo son las pantallas de resultados de una búsqueda en Google. Hay muchos resultados. No tendremos, pues, otro remedio que ir repasando una por una, todas las páginas que se ofrecen en los resultados para evaluarlas y decidir cuál o cuáles son las que mejor se ajustan a lo que hemos buscado, a nuestras espectativas. Y este análisis es tarea de las personas, y no de las máquinas. Son sólo las personas las que pueden discernir si Granada se refiere a una fruta, al nombre de un bar de mi barrio, a la ciudad andaluza, o a un arma de guerra. Ese análisis, en este contexto, lo deben realizar las personas.

Imaginemos ahora que ese mismo proceso y análisis hay que llevarlo a cabo cuando las páginas en las que se busca están en otro idioma diferente al nuestro, e incluso, en un idioma que usa un juego de caracteres diferente al nuestro. La cosa, como no es difícil imaginar, se antoja más complicada.

En este punto, Asunción cita a Tim Berners Lee cuando éste habla de delegar tareas en las máquinas para que hagan el trabajo por nosotros. De ahí parte la idea de la web semántica. Del mismo modo, la ponente pone el acento en que la web semántica es una extensión de la web tal y como la conocemos. El objetivo de la web semántica es hacer más comprensible la web actual. El esquema de este proceso vendría a ser algo asi: la comprensión va a ser posible por parte de las máquinas y no hará falta la intervención humana. Esto nos lleva a la delegación de conocimiento en las máquinas.

¿Y cómo se consigue? Pues a través de las ontologías, que nos llevan a los metadatos y éstos a una definción formal.

Se necesitarán las ontologías que modelan los conceptos, los definen y los hacen interpretables por las máquinas, para la posterior comprensión humana. En cierto modo lo que se va a hacer es añadir una capa inteligente a la web actual para que su información la puedan procesar las máquinas, los ordenadores.

Respecto de las ontologías

Son modelos de conocimiento que contextualizan un determinado dominio. ¿Qué quiere decir esto? Pues que son un modelo, una forma, una descripción que pone en contexto un determinado conocimiento o rango de conocimientos. Es decir, un modelo que describe cómo es una parte del conocimiento. Lo explica y lo conforma de modo que lo abarque por completo.

Es importante que haya consenso en la descripción de ese concepto, de ese dominio, de ese conocimiento. Y también es importante que sean formales. De ese modo podrán ser interpretadas por las máquinas.

Nos enseña cómo es una ontología propuesta para un vuelo aéreo. Es lo que estamos nombrando como una ontología de un dominio. Nos enseña los metadatos contruídos a partir de la ontología, o lo que es lo mismo, los metadatos construídos en base al modelo.

Después de eso nos paramos a observar cómo puede haber ontologías con diferentes densidades. La ponente habla de ontologías de dos tipos:

  • Ontologías ligeras
  • Ontologías pesadas

No obstante, no todo el mundo necesita el mismo grado de formalidad. Es un debate que, nos dice, tiene lugar en la actualidad. A ciertos grupos de usuarios les servirán unas ontologías ligeras, poco formales, y por ello no dejarán de ser ontologías válidas. En el extremo de las ontologías de este tipo, ligeras, se encuentran los modelos de vocabularios controlados. Los sistemas con más alto grado de fiabilidad deben usar ontologías más pesadas. Reconozco que esta última frase la tengo así apuntada en el cuaderno de notas pero ahora mismo no estoy seguro de si se ha dicho así o no. Tomadlo con pinzas, por si acaso.

Hay muchas operaciones que se pueden realizar con las ontologías: conceptualizar, importar, exportar, sumar, podar, etc. Esto nos lleva pensar y a hablar en uno de los rasgos de las ontología, cual es su ciclo de vida:

  1. Adoptar, si procede, otras ontologías
  2. Extender, podar, especializar la ontología
  3. Proceso de alineamiento: establecer equivalencias con otras ontologías
  4. Reingeniería: re-elaborar la ontología y recodificarla

Una vez explicado esto, que está apoyado en una diapositiva comprensible más que otras, pasamos a un llano en el transcurso de la conferencia. Hasta el momento, y si se me permite el símil ciclista, hemos estado subiendo un puerto duro, con lluvia y en solitario. Ahora toca levantar un poco el pie del pedal. Y lo hacemos viendo algunos pantallazos de editores de ontologías disponibles en la red. Vemos dos, OntoEdit y WebOde. Ambos cuentan con importadores y exportadores para los lenguajes propuestos por el W3C.

De los sistemas de consulta disponibles vemos la referencia de dos:

  • Para RDF: SPARQL (que va a ser próxima recomendación del W3C)
  • Para OWL: OWLQL

Respecto de las aplicaciones de edición de ontologías me llama la atención el bajo nivel de usabilidad percibida que advierto en un primer golpe de vista.

Respecto de las aplicaciones

Vamos a ver un total de cinco aplicaciones que tienen una relación directa con la web semántica:

  1. ODESeW: portal web semántico
    • Sirve para la generación y gestión de portales a partir de ontologías
    • Las capas de la estructura de los mismos siguen un proceso que empieza por la ontología, a la que le sigue una definición de permisos, que lleva asociadas varias interfaces de usuarios:
      • Administradores
      • Grupos de ususarios internos
      • Aplicaciones software
      • Usuarios externos
  2. MKBEEM: comercio electrónico multilingüe
    • Es un proyecto que data de 1999
    • Los proveedores deben incluir sus productos en sus idiomas nativos
    • Los consumidores realizan las compras en su idioma nativo
    • Hay una generación automática y comprensible de los catálogos
    • Se toma en consideración, aparte del idioma, las cuestiones culturales diferenciales pertinentes de los consumidores
  3. Recuperación semántica de la información
    • Se trata de una aplicación con extensiones en el e-government
    • Lo que se ha definido a través de ontologías es el dominio de la compra y venta de inmuebles, de modo que este conocimiento esté perfectamente descrito
    • El objetivo es integrar y recuperar documentos para los ciudadanos, las empresas y el gobierno
  4. Anotaciones
    • Tiene su base en la recolección de información y datos de una serie de satélites
    • Haciendo uso de ciertas ontologías, se quiere facilitar el procesado de esa información captada por los satélites
    • Un ejemplo de aplicación de las anotaciones se sustancia en una herramienta para contrastar partes de accidentes de coche, para las compañías de seguros, que son capaces de comparar y valorar la autenticidad de los datos aportados en los partes de accidente. Vemos un ejemplo real de dos partes de accidente de un coche con el mismo número de bastidor, fechados en días consecutivos y en países diferentes, como prueba del fraude que parece existir en el sector.
  5. SEEMP: agregación de contenidos
    • Se trata de intercambiar datos curriculares y de ofertas de empleo, de diferentes países, para poder analizar ambos datos y concluír en ofertas dirigidas a quienes puedan estar interesados, y fomentar así la movilidad geográfica.

En definitiva, ha sido una sesión tan dura, densa, compleja y arisca en la naturaleza de los contenidos, como interesante y brillante. Yo he salido encantado, sorprendido y con ganas de que llegue la sesión de la semana que viene.

En cuanto estén disponibles las transparencias de la presentación las pongo por aquí.

Como hoy no he podido hacer fotos del evento, se me ha ocurrido hacer fotos de las notas que he tomado 🙂

Fernand0 tiene una foto del evento.

En Torresburriel Estudio desarrollamos las capacidades técnicas de tu equipo en temas de usabilidad, experiencia de usuario y diseño de producto a través de nuestros cursos online y presencialesContacta con nosotros y cuéntanos tus necesidades.

Comentarios

  1. Genial, de nuevo gracias por tu trabajo, casi nos trasladan a la charla, je je.
    Si se me permiten algunos vínculos muy recomendables sobre esta charla…, uno relacionado con las ontologías Ontologías: qué son y para qué sirven, otro que hace referencia a un libro de unas cien páginas muy recomendable Reseña sobre el trabajo “El futuro de la Web: XML; RDF/RDFS, ontologías y la web semántica”, ambos escritos por Miguel Ángel Abian.
    Y ya para terminar, el mapa conceptual de la web semántica, que personalmente he impreso y colgado en el puesto de trabajo durante mucho tiempo, para no perderme en esa sopa de letras que es la web semántica.
    Ya por curiosidad, teniendo en cuenta las buenas que han sido las dos primeras charlas, ¿de qué va a tratar el próximo post para la semana que viene (espero que se note la indirecta, je je)?

  2. Jejejeje, la indirecta me ha dado de lleno 😛

    La semana que viene, por ir adelantando, la cosa irá sobre nuevas formas de periodismo digital.

    Y bueno, si el ritmo de posteo es más lento es porque la cosa no da más de sí, de momento. Aunque trataré de enmendarlo.

  3. Por cierto, había dejado para hoy los vínculos en el texto de la crónica, pero esos que aportas, Gonzalo, vienen de lujo.

    Gracias por enriquecer el post.

  4. No hay ninguna queja de tu ritmo de publicación, lo que me faltaba por oír, je je.
    Y viendo tus dos artículos sobre las charlas anteriores, y el título de la siguiente, lo cierto es que ha sido un programa envidiable, y los ponentes han sido excelentes. Seguro que en la tercera no se rompe la racha.
    Y sobre los vínculos que incluyo… me parecían muy oportunos, y no está mal promocionar web semántica hoy, je j.

  5. esto es un lujo, estar en la ponencia sin visitarla, (espero poder asistir a la proxima)muchas gracias dani y gonzalo 😉

  6. Pues hoy han puesto este artículo en El País, que acerca la web semántica a la gente de a pie.

    Hacia una web que entienda el usuario

  7. […] Decir que en esta ocasión el aforo es más moderado que la semana pasada. ¿Será que a las personas relacionadas con los medios en Zaragoza y alrededores les importa poco lo del 2.0? Veremos. Lo que está claro es que echando la vista atrás (me siento en la primera fila, en plan empollón) veo que la demografía de los asistentes es distinta que en las anteriores citas del ciclo. […]

  8. hola soy dinora
    estoy muy interesada em el tema ontologia.
    quiero hacer una aplicacion de una tienda virtual, pero tengo conocimiento de pocas lenguajes.
    domino mas Asp.net.,c#
    Me gustaria saber se es possible hacer una aplicacion con asp.net y usar el protégé-owl

En Torresburriel Estudio podemos ayudarte en el proceso de investigación con usuarios, aplicando técnicas como las entrevistas personalizadas o la investigación etnográfica.