[Qualipso-a4] Fwd: Re: API... sort of
Javier Pueyo
javier.pueyo en gmail.com
Jue Dic 17 16:22:23 CET 2009
El jue, 17-12-2009 a las 15:49 +0100, Jose Gato Luis escribió:
> Genial la noticia de telefónica, ojala nos salga algo ;)
>
> Probando tu nuevo código, después de un rato, he visto el siguiente error:
>
> ValueError: too many values to unpack
> Traceback (most recent call last):
> File
> "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_POST/floss_item_info_extractor.py",
> line 142, in <module>
> (item_info, extracted_entities) = extract_item_info(doc_item)
> File
> "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_POST/floss_item_info_extractor.py",
> line 131, in extract_item_info
> (ent_name, ent_cat) = entity.split("/NE/")
> ValueError: too many values to unpack
>
>
> ¿se te ocurre que puede ser? El programa no se interrumpe y sigue...
Pues parece que en el split de "entity" está encontrando la cadena
"/NE/" más de una vez. Esto es raro. Solo me ocurre que en el item que
está fallando haya alguna rara casualidad como que el path de algún
filename sea: "/home/user/NE/foo.c" y entonces tengamos una entidad
como:
/home/user/NE/foo.c/NE/PURL ("PURL" lo uso para entidades "URL del PATH
unix")
Si quieres enviarme los ítemes que fallan puedo mirar a ver qué está
pasando...
Un saludo,
Javier
>
> El 17/12/09 15:30, Javier Pueyo escribió:
> > El jue, 17-12-2009 a las 14:53 +0100, Jose Gato Luis escribió:
> >> Gracias por los cambios Javier. Ahora mismo estoy probándolo.
> >>
> >> De todos modos, yo estoy apunto de empezar mis vacaciones. Aun así,
> >> seguiré leyendo correos por si me necesitáis...
> >
> > Que tengas unas buenas fiestas y que empieces el año muy bien.
> >
> >> Javier, imagino que vas a seguir con el tema de los clasificadores,¿no?
> >
> > Sí, no te preocupes, aquí tengo la CPU dándole fuerte y echando
> > bufidos :-) Espero terminar los clasificadores en unos días.
> >
> > ¡Que lo paséis muy bien!
> >
> > Javier
> >
> > PD: hoy he hablado con Quiles y me dice que en telefónica están como
> > locos con lo que hemos hecho. Quieren lanzar un proyecto más grande el
> > año que viene y espero que cuenten con nosotros.
> >
> >>
> >> Un saludo y felices fiestas ;)
> >>
> >> El 16/12/09 16:11, Javier Pueyo escribió:
> >>> El mar, 15-12-2009 a las 12:50 -0500, Javier Pueyo escribió:
> >>>> El mar, 15-12-2009 a las 12:19 +0100, Jose Gato Luis escribió
> >>>>
> >>>>>
> >>>>> Podríamos llegar a una solución que devolviera las tripletas de esta manera:
> >>>>>
> >>>>> foo.h/SC/FILE-H
> >>>>> foo.py/SC/FILE-PY
> >>>>> foo.odt/DOC/FILE-ODT
> >>>>>
> >>>>> ¿sería complicado? Si es muy complicado, prefiero parsear lo que me
> >>>>> devuelves ahoras en plan FILE-[*]
> >>>>
> >>>> No, no parece complicado. Ya lo estoy implementando en la clase
> >>>> NLP_Process. Voy a mirar cuántas clases (SC, DOC, etc.) nos hacen falta.
> >>>> Las que no pertenezcan a esas clases quedarían como estaban, es decir,
> >>>> como entidades FILE genéricas:
> >>>>
> >>>> foo.mp3/NE/FILE-MP3
> >>>>
> >>>
> >>> Ya he subido una primera implementación de esto a SVN. Ahora las
> >>> entidades FILES se devuelven así
> >>>
> >>> [
> >>> 'foo.c/SC_FILE/FILE-c', 'foo.pl/SC_FILE/FILE-pl',
> >>> 'foo.java/SC_FILE/FILE-java', 'foo.mp3/MULT_FILE/FILE-mp3',
> >>> 'foo.ogg/MULT_FILE/FILE-ogg', 'foo.doc/DOC_FILE/FILE-doc',
> >>> 'foo.odt/DOC_FILE/FILE-odt', 'foo.pdf/DOC_FILE/FILE-pdf',
> >>> 'foo.wmv/MULT_FILE/FILE-wmv', 'foo.nose/NE/FILE-nose',
> >>> 'foo.conf/CONF_FILE/FILE-conf', 'foo.conf/CONF_FILE/FILE-conf',
> >>> 'foo.cf/CONF_FILE/FILE-cf', 'foo.py/SC_FILE/FILE-py',
> >>> 'foo.pm/NE/FILE-pm', 'foo.html/DOC_FILE/FILE-html',
> >>> 'foo.txt/DOC_FILE/FILE-txt'
> >>> ]
> >>>
> >>> De momento he hecho 4 categorías: SC_FILE (source code file), DOC_FILE
> >>> (documentation file), MULT_FILE (multimedia file), CONF_FILE
> >>> (configuration files). Solo son categorías de prueba y faltaría añadir
> >>> la mayor parte de las extensiones involucradas, pero así podéis ver si
> >>> sirve lo que devuelve.
> >>>
> >>> He subido también un script de prueba: sample-extensions.py
> >>>
> >>> Un saludo,
> >>>
> >>> Javier
> >>>
> >>>> Un saludo,
> >>>>
> >>>> Javier
> >>>>
> >>>>
> >>>>>
> >>>>>
> >>>>>
> >>>>>
> >>>>>>
> >>>>>>
> >>>>>>>
> >>>>>>> El 14/12/09 14:33, Javier Pueyo escribió:
> >>>>>>>>
> >>>>>>>> El lun, 14-12-2009 a las 12:20 +0100, Jose Gato Luis escribió:
> >>>>>>>>>
> >>>>>>>>> Javier, ¿qué significa el tipo NE?
> >>>>>>>>>
> >>>>>>>>
> >>>>>>>> Es el acrónimo para Named Entity. Por ejemplo:
> >>>>>>>>
> >>>>>>>> FSF/NE/FLoss_Company
> >>>>>>>>
> >>>>>>>> significa que hay una "Entity" (entidad) "Named" (llamada) "Free
> >>>>>>>> Software Foundation" que pertenece a la categoría de "Compañías o
> >>>>>>>> Instituciones de Software Libre").
> >>>>>>>>
> >>>>>>>>>
> >>>>>>>>> El 04/12/09 11:09, Jose Gato Luis escribió:
> >>>>>>>>>>
> >>>>>>>>>> nautilus-directory-async.c/NE/FILE-C
> >>>>>>>>>>
> >>>>>>>>>> valor: nautilus-directory-async.c
> >>>>>>>>>> tipo: FILE
> >>>>>>>>>> subtipo: C
> >>>>>>>>>
> >>>>>>>>
> >>>>>>>>
> >>>>>>>>
> >>>>>>>
> >>>>>>> --
> >>>>>>> José Gato Luis | Libre Software Engineering Lab (GSyC)
> >>>>>>> Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
> >>>>>>> jgato en libresoft.es | Edif. Departamental II - Despacho 121
> >>>>>>> http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
> >>>>>>>
> >>>>>> _______________________________________________
> >>>>>> Qualipso-a4 mailing list
> >>>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>
> >>>>
> >>>> _______________________________________________
> >>>> Qualipso-a4 mailing list
> >>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>
> >>> _______________________________________________
> >>> Qualipso-a4 mailing list
> >>> Qualipso-a4 en gsyc.escet.urjc.es
> >>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>
> >> --
> >> José Gato Luis | Libre Software Engineering Lab (GSyC)
> >> Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
> >> jgato en libresoft.es | Edif. Departamental II - Despacho 121
> >> http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
> >> _______________________________________________
> >> Qualipso-a4 mailing list
> >> Qualipso-a4 en gsyc.escet.urjc.es
> >> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >
> > _______________________________________________
> > Qualipso-a4 mailing list
> > Qualipso-a4 en gsyc.escet.urjc.es
> > http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>
More information about the Qualipso-a4
mailing list