[Qualipso-a4] bugs en las herramientas de búsqueda de patrones
Javier Pueyo
jpueyo en gsyc.es
Mar Feb 24 20:33:03 CET 2009
Hola,
El mar, 24-02-2009 a las 18:13 +0100, Miguel Angel Tinte Garcia
escribió:
> Acabo de hacer unas modificaciones en los patrones para resolver estos
> errores.
Quizá no tenga importancia, pero por si acaso lo comento, la solución
que hay ahora: '\S*\.c ' tiene varios problemas:
1) no matchea cadenas como: "he visto el fichero xxxx.c" (es decir, en
final de cadena, ya que exigimos que haya un espacio detrás de c)
2) no matchea ficheros entre comillas. Ejemplos:
se llama 'xxxx.c' en el repositorio
se llama "xxxx.c" en el repositorio
(ya que exigimos que haya un espacio detrás de c)
3) no matchea ficheros con puntuación detrás. Ejemplos:
se llaman xxxx.c, xxxx.java, xxxx.pl
se llama xxxx.c; pero no lo veo en el repositorio
y se llama xxxx.c. Hablando de otra cosa
se llama xxxx.c: y sà está en el repositorio
Seguramente no son casos tan importantes. Pero si se quieren usar regex
para localizar nombres de ficheros en cadenas arbitrarias más amplias,
se podrÃa cambiar las varias regex por una más compleja.
'(^|\s|\"|\')([^\s\/\"\']*?\.(c|py|java|pl))([\s\"\'\.\,\;\:]+?|$)'
Es decir, "Start of string OR Whitespace OR Quotation marks" + cualquier
número de caracteres que NOT incluyan "Space OR Slash" + ".c OR .py
OR .java OR .pl" + "Whitespace OR Quatation marks OR Punctuation OR End
of string".
El resultado limpio, es decir xxxx.c, quedarÃa en el grupo 2 de los
paréntesis de la regex: \2
Os adjunto el script con el que he hecho las pruebas, por si queréis
probar más posibilidades.
> Están subidas al repositorio
Si es suficiente con la solución de Miguel, cuidado que los ficheros
perl y java siguen sin espacio en el repositorio.
Saludos
>
> Ciao
>
>
> El mar, 24-02-2009 a las 17:08 +0100, Jose Gato Luis escribió:
> > Buenas,
> >
> > he encontrado algún nuevo bug, buscando patrones de ficheros de código
> > fuente me devuelve esto:
> >
> > " voy a hablar de un par de ficheros de codigo fuente el library.c y el
> > test.py"
> >
> > en vez de library.c y test.py ;)
> >
> > Un saludo,
> >
> > p.d: Miguel no corre prisa ;)
> >
> > Jose Gato Luis escribió:
> > > Buenas,
> > >
> > > estoy probando la herramienta de búsqueda de patrones para ficheros de
> > > código fuente y me devuelve los siguientes ejemplos:
> > >
> > > *** ['[cjwatson en ubuntu.c']
> > > *** ['https://wiki.ubuntu.c']
> > > *** ['<martin.pitt en ubuntu.c', 'https://wiki.ubuntu.c',
> > > 'http://www.ubuntu.c', 'ubuntu-devel en lists.ubuntu.c',
> > > 'https://lists.ubuntu.c']
> > > *** ['https://help.ubuntu.c', 'www.c', '<http://www.c',
> > > 'https://wiki.ubuntu.c', 'h.u.c', 'w.u.c']
> > >
> > > como acaban en ".c" se cree que es un fichero de código en c, ¿ideas
> > > para unas búsquedas más refinadas?, supongo que habrá que buscar por
> > > patrones fichero.ext, aunque un fichero se podrÃa llamar cjwatson en ubuntu.c.
> > >
> > > Por otro lado, en la búsqueda de bugs, me gustarÃa que cuando encuentra
> > > un bug, en vez de devolver la cadena completa (#bug 345), me devuelva
> > > sólo el identificador (345)
> > >
> > > Saludos,
> > >
> > >
> > >
> >
> >
------------ próxima parte ------------
Se ha borrado un mensaje que no está en formato texto plano...
Nombre : filenames_regex.py
Tipo : text/x-python
Tamaño : 1194 bytes
Descripción: no disponible
Url : http://gsyc.escet.urjc.es/pipermail/qualipso-a4/attachments/20090224/8ae9a67c/attachment.py
More information about the Qualipso-a4
mailing list