[Qualipso-a4] bugs en las herramientas de búsqueda de patrones
Jose Gato Luis
jgato en gsyc.es
Mie Feb 25 11:19:08 CET 2009
Madre mía Javier, que puesto te veo en esto!!! Miguel, ¿puedes probar
poner la exp reg de Javier? El jueves por la noche haré una prueba
completa en el servidor y vemos que tal funciona ;)
Algunos resources que he capturado esta noche, después de los últimos
cambios:
<RS:mailAboutSourceCode>org.morfeo.mymw.pl</RS:mailAboutSourceCode>
<RS:mailAboutSourceCode>file:/opt/eclipse/plugins/org.morfeo.mymw.pl</RS:mailAboutSourceCode>
<RS:mailAboutSourceCode>org.morfeo.tidmobile.server.DriverHTTP.doGet(DriverHTTP.java</RS:mailAboutSourceCode>
Se pillan muchas clases java, por que la gente pega trazas de
excepciones en los correos.
<RS:mailAboutDocument>"doc/design-notes.txt</RS:mailAboutDocument>
<RS:mailAboutDocument>'revs-summary-s.txt</RS:mailAboutDocument>
<RS:mailAboutDocument>(ATT00001.txt</RS:mailAboutDocument>
Este último creo que se resolvería con las ideas de Javier.
Un saludo,
Javier Pueyo escribió:
> Hola,
>
> El mar, 24-02-2009 a las 18:13 +0100, Miguel Angel Tinte Garcia
> escribió:
>> Acabo de hacer unas modificaciones en los patrones para resolver estos
>> errores.
>
> Quizá no tenga importancia, pero por si acaso lo comento, la solución
> que hay ahora: '\S*\.c ' tiene varios problemas:
>
> 1) no matchea cadenas como: "he visto el fichero xxxx.c" (es decir, en
> final de cadena, ya que exigimos que haya un espacio detrás de c)
>
> 2) no matchea ficheros entre comillas. Ejemplos:
>
> se llama 'xxxx.c' en el repositorio
> se llama "xxxx.c" en el repositorio
>
> (ya que exigimos que haya un espacio detrás de c)
>
> 3) no matchea ficheros con puntuación detrás. Ejemplos:
>
> se llaman xxxx.c, xxxx.java, xxxx.pl
> se llama xxxx.c; pero no lo veo en el repositorio
> y se llama xxxx.c. Hablando de otra cosa
> se llama xxxx.c: y sí está en el repositorio
>
> Seguramente no son casos tan importantes. Pero si se quieren usar regex
> para localizar nombres de ficheros en cadenas arbitrarias más amplias,
> se podría cambiar las varias regex por una más compleja.
>
> '(^|\s|\"|\')([^\s\/\"\']*?\.(c|py|java|pl))([\s\"\'\.\,\;\:]+?|$)'
>
> Es decir, "Start of string OR Whitespace OR Quotation marks" + cualquier
> número de caracteres que NOT incluyan "Space OR Slash" + ".c OR .py
> OR .java OR .pl" + "Whitespace OR Quatation marks OR Punctuation OR End
> of string".
>
> El resultado limpio, es decir xxxx.c, quedaría en el grupo 2 de los
> paréntesis de la regex: \2
>
> Os adjunto el script con el que he hecho las pruebas, por si queréis
> probar más posibilidades.
>
>> Están subidas al repositorio
>
> Si es suficiente con la solución de Miguel, cuidado que los ficheros
> perl y java siguen sin espacio en el repositorio.
>
> Saludos
>
>
>
>> Ciao
>>
>>
>> El mar, 24-02-2009 a las 17:08 +0100, Jose Gato Luis escribió:
>>> Buenas,
>>>
>>> he encontrado algún nuevo bug, buscando patrones de ficheros de código
>>> fuente me devuelve esto:
>>>
>>> " voy a hablar de un par de ficheros de codigo fuente el library.c y el
>>> test.py"
>>>
>>> en vez de library.c y test.py ;)
>>>
>>> Un saludo,
>>>
>>> p.d: Miguel no corre prisa ;)
>>>
>>> Jose Gato Luis escribió:
>>>> Buenas,
>>>>
>>>> estoy probando la herramienta de búsqueda de patrones para ficheros de
>>>> código fuente y me devuelve los siguientes ejemplos:
>>>>
>>>> *** ['[cjwatson en ubuntu.c']
>>>> *** ['https://wiki.ubuntu.c']
>>>> *** ['<martin.pitt en ubuntu.c', 'https://wiki.ubuntu.c',
>>>> 'http://www.ubuntu.c', 'ubuntu-devel en lists.ubuntu.c',
>>>> 'https://lists.ubuntu.c']
>>>> *** ['https://help.ubuntu.c', 'www.c', '<http://www.c',
>>>> 'https://wiki.ubuntu.c', 'h.u.c', 'w.u.c']
>>>>
>>>> como acaban en ".c" se cree que es un fichero de código en c, ¿ideas
>>>> para unas búsquedas más refinadas?, supongo que habrá que buscar por
>>>> patrones fichero.ext, aunque un fichero se podría llamar cjwatson en ubuntu.c.
>>>>
>>>> Por otro lado, en la búsqueda de bugs, me gustaría que cuando encuentra
>>>> un bug, en vez de devolver la cadena completa (#bug 345), me devuelva
>>>> sólo el identificador (345)
>>>>
>>>> Saludos,
>>>>
>>>>
>>>>
>>>
--
José Gato Luis | Libre Software Engineering Lab (GSyC)
Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
jgato en gsyc.escet.urjc.es | Edif. Departamental II - Despacho 121
http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
More information about the Qualipso-a4
mailing list