[Qualipso-a4] cambios necesarios para almacenar topics
José Antonio Quiles
quiles en tid.es
Lun Feb 8 08:55:45 CET 2010
Hola,
ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de
ellos, 225 están "vacíos", realmente pone en el body algo así como:
[<email.message.Message instance at 0x92022ac>,
<email.message.Message instance at 0x91fba0c>]
Podrías mirar esto?
Gracias,
Vai
JOSE ANTONIO QUILES FOLLANA escribió:
> Hola Miguel Angel,
> si puedes mándamelo en un zip, porque no lo puedo salvar.
> Gracias
>
>
> Miguel Angel Tinte García escribió:
>
>> Perdona que no te había puesto en cc
>>
>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
>> escribió:
>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
>> conversations creados por nosotros mismos.
>>
>> Te adjunto el fichero .sql Jose
>>
>> Saludos
>>
>>
>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
>>>
>>>
>>>> Gracias Miguel Angel.
>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
>>>> Vai
>>>>
>>>>
>>>> Miguel Angel Tinte García escribió:
>>>>
>>>>
>>>>> Hola Jose,
>>>>>
>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
>>>>> mañana decente. Además ya almaceno información de mensajería
>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
>>>>> tablas para evitar errores y duplicados:
>>>>>
>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
>>>>> mysql> desc floss_sources;
>>>>> +---------+---------+------+-----+---------+-------+
>>>>> | Field | Type | Null | Key | Default | Extra |
>>>>> +---------+---------+------+-----+---------+-------+
>>>>> | itemid | int(10) | NO | MUL | NULL | |
>>>>> | topicid | int(10) | NO | MUL | NULL | |
>>>>> +---------+---------+------+-----+---------+-------+
>>>>> 2 rows in set (0.00 sec)
>>>>>
>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
>>>>> mysql> desc floss_topics;
>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>> | Field | Type | Null | Key | Default | Extra |
>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>> | topicid | int(10) | NO | PRI | NULL | auto_increment |
>>>>> | description | mediumtext | NO | | NULL | |
>>>>> | label | varchar(80) | YES | UNI | NULL | |
>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>> 3 rows in set (0.00 sec)
>>>>>
>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
>>>>> item:
>>>>> mysql> desc info_items;
>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>> | Field | Type | Null | Key | Default | Extra |
>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>> | itemid | int(11) | NO | PRI | NULL | auto_increment |
>>>>> | uri | varchar(250) | YES | UNI | NULL | |
>>>>> | url | varchar(250) | YES | UNI | NULL | |
>>>>> | language | varchar(20) | YES | | NULL | |
>>>>> | title | varchar(2000) | YES | | NULL | |
>>>>> | creation | datetime | NO | | NULL | |
>>>>> | typeid | int(11) | NO | MUL | NULL | |
>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>> 7 rows in set (0.00 sec)
>>>>>
>>>>>
>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
>>>>>
>>>>> Saludos
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>> _______________________________________________
>>>> Qualipso-a4 mailing list
>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>
>>>>
>>> _______________________________________________
>>> Qualipso-a4 mailing list
>>> Qualipso-a4 en gsyc.escet.urjc.es
>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>
>>>
More information about the Qualipso-a4
mailing list