[Qualipso-a4] Fwd: Re: API... sort of
Jose Gato Luis
jgato en libresoft.es
Jue Dic 17 15:49:05 CET 2009
Genial la noticia de telefónica, ojala nos salga algo ;)
Probando tu nuevo código, después de un rato, he visto el siguiente error:
ValueError: too many values to unpack
Traceback (most recent call last):
File
"/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_POST/floss_item_info_extractor.py",
line 142, in <module>
(item_info, extracted_entities) = extract_item_info(doc_item)
File
"/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_POST/floss_item_info_extractor.py",
line 131, in extract_item_info
(ent_name, ent_cat) = entity.split("/NE/")
ValueError: too many values to unpack
¿se te ocurre que puede ser? El programa no se interrumpe y sigue...
El 17/12/09 15:30, Javier Pueyo escribió:
> El jue, 17-12-2009 a las 14:53 +0100, Jose Gato Luis escribió:
>> Gracias por los cambios Javier. Ahora mismo estoy probándolo.
>>
>> De todos modos, yo estoy apunto de empezar mis vacaciones. Aun así,
>> seguiré leyendo correos por si me necesitáis...
>
> Que tengas unas buenas fiestas y que empieces el año muy bien.
>
>> Javier, imagino que vas a seguir con el tema de los clasificadores,¿no?
>
> Sí, no te preocupes, aquí tengo la CPU dándole fuerte y echando
> bufidos :-) Espero terminar los clasificadores en unos días.
>
> ¡Que lo paséis muy bien!
>
> Javier
>
> PD: hoy he hablado con Quiles y me dice que en telefónica están como
> locos con lo que hemos hecho. Quieren lanzar un proyecto más grande el
> año que viene y espero que cuenten con nosotros.
>
>>
>> Un saludo y felices fiestas ;)
>>
>> El 16/12/09 16:11, Javier Pueyo escribió:
>>> El mar, 15-12-2009 a las 12:50 -0500, Javier Pueyo escribió:
>>>> El mar, 15-12-2009 a las 12:19 +0100, Jose Gato Luis escribió
>>>>
>>>>>
>>>>> Podríamos llegar a una solución que devolviera las tripletas de esta manera:
>>>>>
>>>>> foo.h/SC/FILE-H
>>>>> foo.py/SC/FILE-PY
>>>>> foo.odt/DOC/FILE-ODT
>>>>>
>>>>> ¿sería complicado? Si es muy complicado, prefiero parsear lo que me
>>>>> devuelves ahoras en plan FILE-[*]
>>>>
>>>> No, no parece complicado. Ya lo estoy implementando en la clase
>>>> NLP_Process. Voy a mirar cuántas clases (SC, DOC, etc.) nos hacen falta.
>>>> Las que no pertenezcan a esas clases quedarían como estaban, es decir,
>>>> como entidades FILE genéricas:
>>>>
>>>> foo.mp3/NE/FILE-MP3
>>>>
>>>
>>> Ya he subido una primera implementación de esto a SVN. Ahora las
>>> entidades FILES se devuelven así
>>>
>>> [
>>> 'foo.c/SC_FILE/FILE-c', 'foo.pl/SC_FILE/FILE-pl',
>>> 'foo.java/SC_FILE/FILE-java', 'foo.mp3/MULT_FILE/FILE-mp3',
>>> 'foo.ogg/MULT_FILE/FILE-ogg', 'foo.doc/DOC_FILE/FILE-doc',
>>> 'foo.odt/DOC_FILE/FILE-odt', 'foo.pdf/DOC_FILE/FILE-pdf',
>>> 'foo.wmv/MULT_FILE/FILE-wmv', 'foo.nose/NE/FILE-nose',
>>> 'foo.conf/CONF_FILE/FILE-conf', 'foo.conf/CONF_FILE/FILE-conf',
>>> 'foo.cf/CONF_FILE/FILE-cf', 'foo.py/SC_FILE/FILE-py',
>>> 'foo.pm/NE/FILE-pm', 'foo.html/DOC_FILE/FILE-html',
>>> 'foo.txt/DOC_FILE/FILE-txt'
>>> ]
>>>
>>> De momento he hecho 4 categorías: SC_FILE (source code file), DOC_FILE
>>> (documentation file), MULT_FILE (multimedia file), CONF_FILE
>>> (configuration files). Solo son categorías de prueba y faltaría añadir
>>> la mayor parte de las extensiones involucradas, pero así podéis ver si
>>> sirve lo que devuelve.
>>>
>>> He subido también un script de prueba: sample-extensions.py
>>>
>>> Un saludo,
>>>
>>> Javier
>>>
>>>> Un saludo,
>>>>
>>>> Javier
>>>>
>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>>
>>>>>>
>>>>>>>
>>>>>>> El 14/12/09 14:33, Javier Pueyo escribió:
>>>>>>>>
>>>>>>>> El lun, 14-12-2009 a las 12:20 +0100, Jose Gato Luis escribió:
>>>>>>>>>
>>>>>>>>> Javier, ¿qué significa el tipo NE?
>>>>>>>>>
>>>>>>>>
>>>>>>>> Es el acrónimo para Named Entity. Por ejemplo:
>>>>>>>>
>>>>>>>> FSF/NE/FLoss_Company
>>>>>>>>
>>>>>>>> significa que hay una "Entity" (entidad) "Named" (llamada) "Free
>>>>>>>> Software Foundation" que pertenece a la categoría de "Compañías o
>>>>>>>> Instituciones de Software Libre").
>>>>>>>>
>>>>>>>>>
>>>>>>>>> El 04/12/09 11:09, Jose Gato Luis escribió:
>>>>>>>>>>
>>>>>>>>>> nautilus-directory-async.c/NE/FILE-C
>>>>>>>>>>
>>>>>>>>>> valor: nautilus-directory-async.c
>>>>>>>>>> tipo: FILE
>>>>>>>>>> subtipo: C
>>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>
>>>>>>> --
>>>>>>> José Gato Luis | Libre Software Engineering Lab (GSyC)
>>>>>>> Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
>>>>>>> jgato en libresoft.es | Edif. Departamental II - Despacho 121
>>>>>>> http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
>>>>>>>
>>>>>> _______________________________________________
>>>>>> Qualipso-a4 mailing list
>>>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>>
>>>>
>>>> _______________________________________________
>>>> Qualipso-a4 mailing list
>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>
>>> _______________________________________________
>>> Qualipso-a4 mailing list
>>> Qualipso-a4 en gsyc.escet.urjc.es
>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>
>> --
>> José Gato Luis | Libre Software Engineering Lab (GSyC)
>> Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
>> jgato en libresoft.es | Edif. Departamental II - Despacho 121
>> http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
>> _______________________________________________
>> Qualipso-a4 mailing list
>> Qualipso-a4 en gsyc.escet.urjc.es
>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
--
José Gato Luis | Libre Software Engineering Lab (GSyC)
Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
jgato en libresoft.es | Edif. Departamental II - Despacho 121
http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
More information about the Qualipso-a4
mailing list