[Qualipso-a4] cambios necesarios para almacenar topics

Miguel Angel Tinte García matinte en libresoft.es
Lun Feb 8 18:17:51 CET 2010


El lun, 08-02-2010 a las 15:57 +0100, José Antonio Quiles escribió:
> Gracias Miguel Angel.
> Ya veo que también has corregido lo de las fechas en los IM.
> Sólo una cosa, la próxima vez que me envíes una BD, mételo en un zip, 
> porque si no, tengo que hacer copy/paste a un fichero, y me da miedo 
> romper alguna línea.
Acabo de analizar las mbox de evince de 2008. Ahí va el zip con el sql
dentro, espero que te sirva
> Vai
> 
> 
> Miguel Angel Tinte García escribió:
> > Hola Jose,
> >
> > ya está resuelto el error del body en mail_mails y el de creation para
> > los instant messages. Te adjunto la bbdd con los emails de evince de
> > 2009 analizados.
> >
> > Saludos 
> >
> >
> > El lun, 08-02-2010 a las 08:55 +0100, José Antonio Quiles escribió:
> >   
> >> Hola,
> >> ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> >> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de 
> >> ellos, 225 están "vacíos", realmente pone en el body algo así como:
> >>     [<email.message.Message instance at 0x92022ac>, 
> >> <email.message.Message instance at 0x91fba0c>]
> >> Podrías mirar esto?
> >> Gracias,
> >> Vai
> >>
> >>
> >> JOSE ANTONIO QUILES FOLLANA escribió:
> >>     
> >>> Hola Miguel Angel,
> >>> si puedes mándamelo en un zip, porque no lo puedo salvar.
> >>> Gracias
> >>>
> >>>
> >>> Miguel Angel Tinte García escribió:
> >>>   
> >>>       
> >>>> Perdona que no te había puesto en cc
> >>>>
> >>>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
> >>>> escribió:
> >>>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
> >>>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
> >>>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
> >>>> conversations creados por nosotros mismos.
> >>>>
> >>>> Te adjunto el fichero .sql Jose
> >>>>
> >>>> Saludos
> >>>>   
> >>>>     
> >>>>         
> >>>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
> >>>>>     
> >>>>>       
> >>>>>           
> >>>>>> Gracias Miguel Angel.
> >>>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
> >>>>>> Vai
> >>>>>>
> >>>>>>
> >>>>>> Miguel Angel Tinte García escribió:
> >>>>>>       
> >>>>>>         
> >>>>>>             
> >>>>>>> Hola Jose,
> >>>>>>>
> >>>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
> >>>>>>> mañana decente. Además ya almaceno información de mensajería
> >>>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
> >>>>>>> tablas para evitar errores y duplicados:
> >>>>>>>
> >>>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
> >>>>>>> mysql> desc floss_sources;
> >>>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>>> | Field   | Type    | Null | Key | Default | Extra |
> >>>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>>> | itemid  | int(10) | NO   | MUL | NULL    |       | 
> >>>>>>> | topicid | int(10) | NO   | MUL | NULL    |       | 
> >>>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>>> 2 rows in set (0.00 sec)
> >>>>>>>
> >>>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
> >>>>>>> mysql> desc floss_topics;
> >>>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>>> | Field       | Type        | Null | Key | Default | Extra          |
> >>>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment | 
> >>>>>>> | description | mediumtext  | NO   |     | NULL    |                | 
> >>>>>>> | label       | varchar(80) | YES  | UNI | NULL    |                | 
> >>>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>>> 3 rows in set (0.00 sec)
> >>>>>>>
> >>>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
> >>>>>>> item:
> >>>>>>> mysql> desc info_items;
> >>>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>>> | Field    | Type          | Null | Key | Default | Extra          |
> >>>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment | 
> >>>>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                | 
> >>>>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                | 
> >>>>>>> | language | varchar(20)   | YES  |     | NULL    |                | 
> >>>>>>> | title    | varchar(2000) | YES  |     | NULL    |                | 
> >>>>>>> | creation | datetime      | NO   |     | NULL    |                | 
> >>>>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                | 
> >>>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>>> 7 rows in set (0.00 sec)
> >>>>>>>
> >>>>>>>
> >>>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
> >>>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
> >>>>>>>
> >>>>>>> Saludos
> >>>>>>>
> >>>>>>>
> >>>>>>>   
> >>>>>>>         
> >>>>>>>           
> >>>>>>>               
> >>>>>> _______________________________________________
> >>>>>> Qualipso-a4 mailing list
> >>>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>>       
> >>>>>>         
> >>>>>>             
> >>>>> _______________________________________________
> >>>>> Qualipso-a4 mailing list
> >>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>     
> >>>>>       
> >>>>>           
> >> _______________________________________________
> >> Qualipso-a4 mailing list
> >> Qualipso-a4 en gsyc.escet.urjc.es
> >> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>     
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
-- 
Miguel Ãngel Tinte García        
Libre Software Engineering Lab (GSyC)  | Universidad Rey Juan Carlos
matinte en libresoft.es         
http://libresoft.urjc.es/   
------------ próxima parte ------------
Se ha borrado un mensaje que no está en formato texto plano...
Nombre     : qualipso_ML_BTS_IM.sql.zip
Tipo       : application/zip
Tamaño     : 322662 bytes
Descripción: no disponible
Url        : http://gsyc.escet.urjc.es/pipermail/qualipso-a4/attachments/20100208/0771760e/attachment-0001.zip 


More information about the Qualipso-a4 mailing list