[Qualipso-a4] instalación y pruebas de las herramientas de NLP

Javier Pueyo jpueyo en gsyc.es
Mar Dic 8 14:28:29 CET 2009


Hola Jose,

El mar, 08-12-2009 a las 00:31 +0100, Jose Gato Luis escribió:
> Acabo de darme cuenta, que existen unas variables para configurar 
> ciertos paths, por defecto están pensadas para ejecutar programas dentro 
> de donde tenemos todo lo de NLP:
> 
> config_FLOSS_NLP_PATH = sys.path[0] + "/"
> 
> config_FLOSS_NLP_PATH_NLP_FLOSS = config_FLOSS_NLP_PATH + "floss_nlp/"
> 
> si ejecuto el programa desde cualquier otro directorio, sys.path no va a 
> tener el valor esperado. De momento he puesto el valor que quiero a 
> pelo, estaría bien, que al crear la clase NLP, puedas configurar esos 
> valores.

Sí. Lo cierto es que config.py asumía erróneamente que los programas se
ejecutarían en un lugar determinado. La solución que se me ocurre es
colocar el directorio floss_nlp/ bajo la raiz de python, es decir, aquí:

/usr/lib/python2.5/site-packages/floss_nlp

Y modificar el fichero config.py de esta manera:

- config_FLOSS_NLP_PATH = sys.path[0] + "/"
+ config_FLOSS_NLP_PATH = "/usr/lib/python2.5/site-packages/"

¿Qué te parece? Si te parece bien, "cometo" ese cambio al SVN.


> Por otro lado, aparece un nuevo error:

Buff. Llevo peleando con bugs de NLTK desde hace meses... Lo mejor es
volver de momento a la versión 0.9.9b1 y ver si conseguimos avanzar. Ya
iré yo mirando si puedo corregir los bugs de la 2.0. He subido al SVN un
paquete RPM y un DEB (este lo he creado a partir del rpm, pero parece
funcionar bien). Después de instalarlo hay que volver a integrar los
files de NLTK_additions, (y si aún lo tenéis en vuestras copias locales,
hay borrar el file modificado "probability.py" que ya no sirve... yo ya
lo he quitado del SVN). A mí un simple:

sudo cp -R NLTK_additions/nltk/* /usr/lib/python2.5/site-packages/nltk/

me funciona bien.

Un saludo,

Javier

> *** Traceback (most recent call last):
>    File 
> "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_POST/floss_item_classifier.py", 
> line 213, in <module>
>      (topics, extracted_entities_clean) = classify_item(doc_item)
>    File 
> "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_POST/floss_item_classifier.py", 
> line 207, in classify_item
>      topic = classifier.classify(item_features(item_info,dictionary_info))
>    File "/usr/lib/python2.5/site-packages/nltk/classify/naivebayes.py", 
> line 89, in classify
>      return self.prob_classify(featureset).max()
>    File "/usr/lib/python2.5/site-packages/nltk/classify/naivebayes.py", 
> line 122, in prob_classify
>      return DictionaryProbDist(logprob, normalize=True, log=True)
>    File "/usr/lib/python2.5/site-packages/nltk/probability.py", line 
> 638, in __init__
>      value_sum = sum_logs(self._prob_dict.values())
>    File "/usr/lib/python2.5/site-packages/nltk/probability.py", line 
> 1791, in sum_logs
>      return reduce(add_logs, logs[1:], logs[0])
> AttributeError: 'module' object has no attribute 'reduce'
> *****
> 
> Javier, si ves que va a ser más fácil, podemos volver a una versión 
> anterior de nltk ;)
> 
> Saludos,
> 
> El 07/12/09 19:03, Jose Gato Luis escribió:
> > Ahora estoy integrando de verdad las herramientas, dentro del extractor
> > de correos y....
> >
> >
> > Traceback (most recent call last):
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/plugins/MailingLists/mlFeedery.py",
> > line 320, in<module>
> >       analizeResourcesFromMbox (project, emailList)
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/plugins/MailingLists/mlFeedery.py",
> > line 257, in analizeResourcesFromMbox
> >       subjectBugs = searchBugInMessage (emailResource.email['subject'])
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/plugins/MailingLists/mlFeedery.py",
> > line 179, in searchBugInMessage
> >       print nlp.getItemTopics(message,True)
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_Process.py",
> > line 116, in getItemTopics
> >       topics = self.getItemTopicsEntities(doc_item, is_mail, only_topics)
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_Process.py",
> > line 103, in getItemTopicsEntities
> >       doc_item = self.tagItem(doc_item, is_mail)
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_Process.py",
> > line 74, in tagItem
> >       doc_item = self.getItemContents(doc_item, is_mail)
> >     File
> > "/home/jgato/proyectos/Qualipso/A4/svn/qualipso/private/work/A4/3rdIteration/src/jpueyo/floss_nlp/NLP_Process.py",
> > line 56, in getItemContents
> >       p = Popen([FLOSS_NLP_PATH_PRE + 'item_processor_1.pl', doc_item],
> > stdout=PIPE, stderr=STDOUT)
> >     File "/usr/lib/python2.5/subprocess.py", line 594, in __init__
> >       errread, errwrite)
> >     File "/usr/lib/python2.5/subprocess.py", line 1153, in _execute_child
> >
> >
> > ¿tiene algo que ver, el hecho de que este usando eclipse?
> >
> >
> > El 07/12/09 18:21, Jose Gato Luis escribió:
> >> Genial Javier, funciona ;)
> >>
> >> El 07/12/09 17:27, Javier Pueyo escribió:
> >>> Copiando ese fichero en nuestra instalación de NLTK 2.0b5 debería
> >>> solucionar el problema... I hope...
> >>
> >
> 
> -- 
> José Gato Luis                   | Libre Software Engineering Lab (GSyC)
> Tel: (+34)-914 888 105           | Universidad Rey Juan Carlos
> jgato en libresoft.es               | Edif. Departamental II - Despacho 121
> http://libresoft.urjc.es/        | c/Tulipán s/n 28933 Móstoles (Madrid)



More information about the Qualipso-a4 mailing list