[Qualipso-a4] aperture y las ontologias

Jose Gato Luis jgato en gsyc.es
Mar Feb 12 11:14:30 CET 2008


Buenas,

he estado "trasteando" un poco con Aperture para ver como trata el tema 
de las ontologias para ver como adaptarlo a las nuestras, básicamente 
funciona de la siguiente manera:

  * Contenedores RDF, con funciones para añadir y eliminar tripletas.
  * Cada ontología tiene un fichero .java con constantes de los 
predicados que definen esa ontología. Lo bueno de este punto, es que 
tienen una clase que pasándole un fichero RDF te genera el vocabulario 
que vas a necesitar, te genera constantes dentro de una clase: 
SIOC.java, NMO.java.
  * Cada crawler extrae información y añade tripletas RDF con los 
predicados extraídos anteriormente.
  * Cada extractor extrae información y añade tripeltas RDF con los 
predicados extraídos anteriormente.

             copyAddress(getRecipients(message, RecipientType.TO), 
NMO.to, result);
             copyAddress(getRecipients(message, RecipientType.CC), 
NMO.cc, result);
             copyAddress(getRecipients(message, RecipientType.BCC), 
NMO.bcc, result);

El problema es que todas estas etiquetas están fuertemente cableadas en 
muchas partes del código, y aperture es bastante modular, por lo que nos 
implicaría re-implementar cada implementación de los crawlers y los 
extractor.

Lo suyo, es que estos predicados fueran abstractos  MIME.to y que el 
valor de esa constante dependiera según uses una ontologia u otra, 
aunque esto se complicaría en que predicados iguales en distintas 
ontologias tuvieran posteriormente valores distiontos. POr ejemplo, el 
predicado que define un TO, para una ontología tendrá un valor literal y 
para otra sera una URI. Aunque tal vez eso podría ser solucionado 
facilmente.

Metiéndome en las tripas de Aperture, es fácil ver por que no soporta 
attachments, simplemente aún no analizan esta parte.

Teniendo en cuenta que no existen unos predicados genéricos, los 
crawlers y extractor son dependientes de la ontología, con lo que para 
nuevas ontologías necesitas nuevos crawlers/extractors :( .

O replicamos código, o hacemos un conversor de ontologías.


-- 
José Gato Luis                   | Libre Software Engineering Lab (GSyC)
Tel: (+34)-914 888 105           | Universidad Rey Juan Carlos
jgato en gsyc.escet.urjc.es         | Edif. Departamental II - Despacho 116
http://libresoft.urjc.es/        | c/Tulipán s/n 28933 Móstoles (Madrid)


Más información sobre la lista de distribución Qualipso-a4