[Qualipso-a4] cambios necesarios para almacenar topics

Miguel Angel Tinte García matinte en libresoft.es
Lun Feb 8 14:59:45 CET 2010


Hola Jose,

ya está resuelto el error del body en mail_mails y el de creation para
los instant messages. Te adjunto la bbdd con los emails de evince de
2009 analizados.

Saludos 


El lun, 08-02-2010 a las 08:55 +0100, José Antonio Quiles escribió:
> Hola,
> ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de 
> ellos, 225 están "vacíos", realmente pone en el body algo así como:
>     [<email.message.Message instance at 0x92022ac>, 
> <email.message.Message instance at 0x91fba0c>]
> Podrías mirar esto?
> Gracias,
> Vai
> 
> 
> JOSE ANTONIO QUILES FOLLANA escribió:
> > Hola Miguel Angel,
> > si puedes mándamelo en un zip, porque no lo puedo salvar.
> > Gracias
> >
> >
> > Miguel Angel Tinte García escribió:
> >   
> >> Perdona que no te había puesto en cc
> >>
> >> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
> >> escribió:
> >> Bueno, ha tardado un poco en procesar todos los mbox además de dar
> >> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
> >> todos los mbox de evince de 2009 analizados y unos pocos bugs y
> >> conversations creados por nosotros mismos.
> >>
> >> Te adjunto el fichero .sql Jose
> >>
> >> Saludos
> >>   
> >>     
> >>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
> >>>     
> >>>       
> >>>> Gracias Miguel Angel.
> >>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
> >>>> Vai
> >>>>
> >>>>
> >>>> Miguel Angel Tinte García escribió:
> >>>>       
> >>>>         
> >>>>> Hola Jose,
> >>>>>
> >>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
> >>>>> mañana decente. Además ya almaceno información de mensajería
> >>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
> >>>>> tablas para evitar errores y duplicados:
> >>>>>
> >>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
> >>>>> mysql> desc floss_sources;
> >>>>> +---------+---------+------+-----+---------+-------+
> >>>>> | Field   | Type    | Null | Key | Default | Extra |
> >>>>> +---------+---------+------+-----+---------+-------+
> >>>>> | itemid  | int(10) | NO   | MUL | NULL    |       | 
> >>>>> | topicid | int(10) | NO   | MUL | NULL    |       | 
> >>>>> +---------+---------+------+-----+---------+-------+
> >>>>> 2 rows in set (0.00 sec)
> >>>>>
> >>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
> >>>>> mysql> desc floss_topics;
> >>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>> | Field       | Type        | Null | Key | Default | Extra          |
> >>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment | 
> >>>>> | description | mediumtext  | NO   |     | NULL    |                | 
> >>>>> | label       | varchar(80) | YES  | UNI | NULL    |                | 
> >>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>> 3 rows in set (0.00 sec)
> >>>>>
> >>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
> >>>>> item:
> >>>>> mysql> desc info_items;
> >>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>> | Field    | Type          | Null | Key | Default | Extra          |
> >>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment | 
> >>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                | 
> >>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                | 
> >>>>> | language | varchar(20)   | YES  |     | NULL    |                | 
> >>>>> | title    | varchar(2000) | YES  |     | NULL    |                | 
> >>>>> | creation | datetime      | NO   |     | NULL    |                | 
> >>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                | 
> >>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>> 7 rows in set (0.00 sec)
> >>>>>
> >>>>>
> >>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
> >>>>> analizadas y almacenadas en la bbdd que te enviaré después.
> >>>>>
> >>>>> Saludos
> >>>>>
> >>>>>
> >>>>>   
> >>>>>         
> >>>>>           
> >>>> _______________________________________________
> >>>> Qualipso-a4 mailing list
> >>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>       
> >>>>         
> >>> _______________________________________________
> >>> Qualipso-a4 mailing list
> >>> Qualipso-a4 en gsyc.escet.urjc.es
> >>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>     
> >>>       
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
-- 
Miguel Ãngel Tinte García        
Libre Software Engineering Lab (GSyC)  | Universidad Rey Juan Carlos
matinte en libresoft.es         
http://libresoft.urjc.es/   
------------ próxima parte ------------
Se ha borrado un mensaje que no está en formato texto plano...
Nombre     : qualipso_ML_BTS_IM.sql
Tipo       : text/x-sql
Tamaño     : 757959 bytes
Descripción: no disponible
Url        : http://gsyc.escet.urjc.es/pipermail/qualipso-a4/attachments/20100208/390c0a79/attachment-0001.bin 


More information about the Qualipso-a4 mailing list