[Qualipso-a4] cambios necesarios para almacenar topics

Jose Gato Luis jgato en libresoft.es
Lun Feb 8 10:26:35 CET 2010


Miguel, esto me suena a un Bug en mlstat, una libresoft tool que 
utilizamos para parsear correos. Está en el directorio de tools. Creo 
que Isra arregló ese bug, prueba a bajar una nueva versión (está en 
libresoft tools de morfeo) y prueba con ella, pero no borres la antigua, 
por si acaso ha cambiado mucho y ya no nos vale ;)

El 08/02/10 08:55, José Antonio Quiles escribió:
> Hola,
> ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de
> ellos, 225 están "vacíos", realmente pone en el body algo así como:
>      [<email.message.Message instance at 0x92022ac>,
> <email.message.Message instance at 0x91fba0c>]
> Podrías mirar esto?
> Gracias,
> Vai
>
>
> JOSE ANTONIO QUILES FOLLANA escribió:
>> Hola Miguel Angel,
>> si puedes mándamelo en un zip, porque no lo puedo salvar.
>> Gracias
>>
>>
>> Miguel Angel Tinte García escribió:
>>
>>> Perdona que no te había puesto en cc
>>>
>>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
>>> escribió:
>>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
>>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
>>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
>>> conversations creados por nosotros mismos.
>>>
>>> Te adjunto el fichero .sql Jose
>>>
>>> Saludos
>>>
>>>
>>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
>>>>
>>>>
>>>>> Gracias Miguel Angel.
>>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
>>>>> Vai
>>>>>
>>>>>
>>>>> Miguel Angel Tinte García escribió:
>>>>>
>>>>>
>>>>>> Hola Jose,
>>>>>>
>>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
>>>>>> mañana decente. Además ya almaceno información de mensajería
>>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
>>>>>> tablas para evitar errores y duplicados:
>>>>>>
>>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
>>>>>> mysql>  desc floss_sources;
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> | Field   | Type    | Null | Key | Default | Extra |
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> | itemid  | int(10) | NO   | MUL | NULL    |       |
>>>>>> | topicid | int(10) | NO   | MUL | NULL    |       |
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> 2 rows in set (0.00 sec)
>>>>>>
>>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
>>>>>> mysql>  desc floss_topics;
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> | Field       | Type        | Null | Key | Default | Extra          |
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment |
>>>>>> | description | mediumtext  | NO   |     | NULL    |                |
>>>>>> | label       | varchar(80) | YES  | UNI | NULL    |                |
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> 3 rows in set (0.00 sec)
>>>>>>
>>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
>>>>>> item:
>>>>>> mysql>  desc info_items;
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> | Field    | Type          | Null | Key | Default | Extra          |
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment |
>>>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                |
>>>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                |
>>>>>> | language | varchar(20)   | YES  |     | NULL    |                |
>>>>>> | title    | varchar(2000) | YES  |     | NULL    |                |
>>>>>> | creation | datetime      | NO   |     | NULL    |                |
>>>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                |
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> 7 rows in set (0.00 sec)
>>>>>>
>>>>>>
>>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
>>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
>>>>>>
>>>>>> Saludos
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>> _______________________________________________
>>>>> Qualipso-a4 mailing list
>>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>>
>>>>>
>>>> _______________________________________________
>>>> Qualipso-a4 mailing list
>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>
>>>>
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4

-- 
José Gato Luis                   | Libre Software Engineering Lab (GSyC)
Tel: (+34)-914 888 105           | Universidad Rey Juan Carlos
jgato en libresoft.es               | Edif. Departamental II - Despacho 121
http://libresoft.urjc.es/        | c/Tulipán s/n 28933 Móstoles (Madrid)


More information about the Qualipso-a4 mailing list