[Qualipso-a4] cambios necesarios para almacenar topics

José Antonio Quiles quiles en tid.es
Lun Feb 8 08:55:45 CET 2010


Hola,
ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de 
ellos, 225 están "vacíos", realmente pone en el body algo así como:
    [<email.message.Message instance at 0x92022ac>, 
<email.message.Message instance at 0x91fba0c>]
Podrías mirar esto?
Gracias,
Vai


JOSE ANTONIO QUILES FOLLANA escribió:
> Hola Miguel Angel,
> si puedes mándamelo en un zip, porque no lo puedo salvar.
> Gracias
>
>
> Miguel Angel Tinte García escribió:
>   
>> Perdona que no te había puesto en cc
>>
>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
>> escribió:
>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
>> conversations creados por nosotros mismos.
>>
>> Te adjunto el fichero .sql Jose
>>
>> Saludos
>>   
>>     
>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
>>>     
>>>       
>>>> Gracias Miguel Angel.
>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
>>>> Vai
>>>>
>>>>
>>>> Miguel Angel Tinte García escribió:
>>>>       
>>>>         
>>>>> Hola Jose,
>>>>>
>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
>>>>> mañana decente. Además ya almaceno información de mensajería
>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
>>>>> tablas para evitar errores y duplicados:
>>>>>
>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
>>>>> mysql> desc floss_sources;
>>>>> +---------+---------+------+-----+---------+-------+
>>>>> | Field   | Type    | Null | Key | Default | Extra |
>>>>> +---------+---------+------+-----+---------+-------+
>>>>> | itemid  | int(10) | NO   | MUL | NULL    |       | 
>>>>> | topicid | int(10) | NO   | MUL | NULL    |       | 
>>>>> +---------+---------+------+-----+---------+-------+
>>>>> 2 rows in set (0.00 sec)
>>>>>
>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
>>>>> mysql> desc floss_topics;
>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>> | Field       | Type        | Null | Key | Default | Extra          |
>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment | 
>>>>> | description | mediumtext  | NO   |     | NULL    |                | 
>>>>> | label       | varchar(80) | YES  | UNI | NULL    |                | 
>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>> 3 rows in set (0.00 sec)
>>>>>
>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
>>>>> item:
>>>>> mysql> desc info_items;
>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>> | Field    | Type          | Null | Key | Default | Extra          |
>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment | 
>>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                | 
>>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                | 
>>>>> | language | varchar(20)   | YES  |     | NULL    |                | 
>>>>> | title    | varchar(2000) | YES  |     | NULL    |                | 
>>>>> | creation | datetime      | NO   |     | NULL    |                | 
>>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                | 
>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>> 7 rows in set (0.00 sec)
>>>>>
>>>>>
>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
>>>>>
>>>>> Saludos
>>>>>
>>>>>
>>>>>   
>>>>>         
>>>>>           
>>>> _______________________________________________
>>>> Qualipso-a4 mailing list
>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>       
>>>>         
>>> _______________________________________________
>>> Qualipso-a4 mailing list
>>> Qualipso-a4 en gsyc.escet.urjc.es
>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>     
>>>       


More information about the Qualipso-a4 mailing list