[Qualipso-a4] cambios necesarios para almacenar topics
Jose Gato Luis
jgato en libresoft.es
Lun Feb 8 10:26:35 CET 2010
Miguel, esto me suena a un Bug en mlstat, una libresoft tool que
utilizamos para parsear correos. Está en el directorio de tools. Creo
que Isra arregló ese bug, prueba a bajar una nueva versión (está en
libresoft tools de morfeo) y prueba con ella, pero no borres la antigua,
por si acaso ha cambiado mucho y ya no nos vale ;)
El 08/02/10 08:55, José Antonio Quiles escribió:
> Hola,
> ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de
> ellos, 225 están "vacíos", realmente pone en el body algo así como:
> [<email.message.Message instance at 0x92022ac>,
> <email.message.Message instance at 0x91fba0c>]
> Podrías mirar esto?
> Gracias,
> Vai
>
>
> JOSE ANTONIO QUILES FOLLANA escribió:
>> Hola Miguel Angel,
>> si puedes mándamelo en un zip, porque no lo puedo salvar.
>> Gracias
>>
>>
>> Miguel Angel Tinte García escribió:
>>
>>> Perdona que no te había puesto en cc
>>>
>>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
>>> escribió:
>>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
>>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
>>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
>>> conversations creados por nosotros mismos.
>>>
>>> Te adjunto el fichero .sql Jose
>>>
>>> Saludos
>>>
>>>
>>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
>>>>
>>>>
>>>>> Gracias Miguel Angel.
>>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
>>>>> Vai
>>>>>
>>>>>
>>>>> Miguel Angel Tinte García escribió:
>>>>>
>>>>>
>>>>>> Hola Jose,
>>>>>>
>>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
>>>>>> mañana decente. Además ya almaceno información de mensajería
>>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
>>>>>> tablas para evitar errores y duplicados:
>>>>>>
>>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
>>>>>> mysql> desc floss_sources;
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> | Field | Type | Null | Key | Default | Extra |
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> | itemid | int(10) | NO | MUL | NULL | |
>>>>>> | topicid | int(10) | NO | MUL | NULL | |
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> 2 rows in set (0.00 sec)
>>>>>>
>>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
>>>>>> mysql> desc floss_topics;
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> | Field | Type | Null | Key | Default | Extra |
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> | topicid | int(10) | NO | PRI | NULL | auto_increment |
>>>>>> | description | mediumtext | NO | | NULL | |
>>>>>> | label | varchar(80) | YES | UNI | NULL | |
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> 3 rows in set (0.00 sec)
>>>>>>
>>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
>>>>>> item:
>>>>>> mysql> desc info_items;
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> | Field | Type | Null | Key | Default | Extra |
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> | itemid | int(11) | NO | PRI | NULL | auto_increment |
>>>>>> | uri | varchar(250) | YES | UNI | NULL | |
>>>>>> | url | varchar(250) | YES | UNI | NULL | |
>>>>>> | language | varchar(20) | YES | | NULL | |
>>>>>> | title | varchar(2000) | YES | | NULL | |
>>>>>> | creation | datetime | NO | | NULL | |
>>>>>> | typeid | int(11) | NO | MUL | NULL | |
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> 7 rows in set (0.00 sec)
>>>>>>
>>>>>>
>>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
>>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
>>>>>>
>>>>>> Saludos
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>> _______________________________________________
>>>>> Qualipso-a4 mailing list
>>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>>
>>>>>
>>>> _______________________________________________
>>>> Qualipso-a4 mailing list
>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>
>>>>
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
--
José Gato Luis | Libre Software Engineering Lab (GSyC)
Tel: (+34)-914 888 105 | Universidad Rey Juan Carlos
jgato en libresoft.es | Edif. Departamental II - Despacho 121
http://libresoft.urjc.es/ | c/Tulipán s/n 28933 Móstoles (Madrid)
More information about the Qualipso-a4
mailing list