[Qualipso-a4] cambios necesarios para almacenar topics

Miguel Angel Tinte García matinte en libresoft.es
Lun Feb 8 10:43:15 CET 2010


El lun, 08-02-2010 a las 10:37 +0100, José Antonio Quiles escribió:
> Otra cosa, Miguel Angel.
> Los items de tipo "instant message" tienen todos la fecha a cero. 
> ¿Podrías poner la fecha correcta?
> Por otro lado, no veo ninguna tabla donde se almacenen los "instant 
> messages", sólo se está almacenando en info_items.
Sí, es que no tenemos ninguna tabla para los instant messages pero como
sí son items pues los he agregado en info_items. Si lo crees necesario
podemos ver la posibilidad de añadir una tabla para IM.

> Vai
> 
> 
> JOSE ANTONIO QUILES FOLLANA escribió:
> > Hola,
> > ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> > Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de 
> > ellos, 225 están "vacíos", realmente pone en el body algo así como:
> >     [<email.message.Message instance at 0x92022ac>, 
> > <email.message.Message instance at 0x91fba0c>]
> > Podrías mirar esto?
> > Gracias,
> > Vai
> >
> >
> > JOSE ANTONIO QUILES FOLLANA escribió:
> >   
> >> Hola Miguel Angel,
> >> si puedes mándamelo en un zip, porque no lo puedo salvar.
> >> Gracias
> >>
> >>
> >> Miguel Angel Tinte García escribió:
> >>   
> >>     
> >>> Perdona que no te había puesto en cc
> >>>
> >>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
> >>> escribió:
> >>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
> >>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
> >>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
> >>> conversations creados por nosotros mismos.
> >>>
> >>> Te adjunto el fichero .sql Jose
> >>>
> >>> Saludos
> >>>   
> >>>     
> >>>       
> >>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
> >>>>     
> >>>>       
> >>>>         
> >>>>> Gracias Miguel Angel.
> >>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
> >>>>> Vai
> >>>>>
> >>>>>
> >>>>> Miguel Angel Tinte García escribió:
> >>>>>       
> >>>>>         
> >>>>>           
> >>>>>> Hola Jose,
> >>>>>>
> >>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
> >>>>>> mañana decente. Además ya almaceno información de mensajería
> >>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
> >>>>>> tablas para evitar errores y duplicados:
> >>>>>>
> >>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
> >>>>>> mysql> desc floss_sources;
> >>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>> | Field   | Type    | Null | Key | Default | Extra |
> >>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>> | itemid  | int(10) | NO   | MUL | NULL    |       | 
> >>>>>> | topicid | int(10) | NO   | MUL | NULL    |       | 
> >>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>> 2 rows in set (0.00 sec)
> >>>>>>
> >>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
> >>>>>> mysql> desc floss_topics;
> >>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>> | Field       | Type        | Null | Key | Default | Extra          |
> >>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment | 
> >>>>>> | description | mediumtext  | NO   |     | NULL    |                | 
> >>>>>> | label       | varchar(80) | YES  | UNI | NULL    |                | 
> >>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>> 3 rows in set (0.00 sec)
> >>>>>>
> >>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
> >>>>>> item:
> >>>>>> mysql> desc info_items;
> >>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>> | Field    | Type          | Null | Key | Default | Extra          |
> >>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment | 
> >>>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                | 
> >>>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                | 
> >>>>>> | language | varchar(20)   | YES  |     | NULL    |                | 
> >>>>>> | title    | varchar(2000) | YES  |     | NULL    |                | 
> >>>>>> | creation | datetime      | NO   |     | NULL    |                | 
> >>>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                | 
> >>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>> 7 rows in set (0.00 sec)
> >>>>>>
> >>>>>>
> >>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
> >>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
> >>>>>>
> >>>>>> Saludos
> >>>>>>
> >>>>>>
> >>>>>>   
> >>>>>>         
> >>>>>>           
> >>>>>>             
> >>>>> _______________________________________________
> >>>>> Qualipso-a4 mailing list
> >>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>       
> >>>>>         
> >>>>>           
> >>>> _______________________________________________
> >>>> Qualipso-a4 mailing list
> >>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>     
> >>>>       
> >>>>         
-- 
Miguel Ángel Tinte García        
Libre Software Engineering Lab (GSyC)  | Universidad Rey Juan Carlos
matinte en libresoft.es         
http://libresoft.urjc.es/   



More information about the Qualipso-a4 mailing list