[Qualipso-a4] cambios necesarios para almacenar topics

José Antonio Quiles quiles en tid.es
Lun Feb 8 10:37:40 CET 2010


Otra cosa, Miguel Angel.
Los items de tipo "instant message" tienen todos la fecha a cero. 
¿Podrías poner la fecha correcta?
Por otro lado, no veo ninguna tabla donde se almacenen los "instant 
messages", sólo se está almacenando en info_items.
Vai


JOSE ANTONIO QUILES FOLLANA escribió:
> Hola,
> ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de 
> ellos, 225 están "vacíos", realmente pone en el body algo así como:
>     [<email.message.Message instance at 0x92022ac>, 
> <email.message.Message instance at 0x91fba0c>]
> Podrías mirar esto?
> Gracias,
> Vai
>
>
> JOSE ANTONIO QUILES FOLLANA escribió:
>   
>> Hola Miguel Angel,
>> si puedes mándamelo en un zip, porque no lo puedo salvar.
>> Gracias
>>
>>
>> Miguel Angel Tinte García escribió:
>>   
>>     
>>> Perdona que no te había puesto en cc
>>>
>>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
>>> escribió:
>>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
>>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
>>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
>>> conversations creados por nosotros mismos.
>>>
>>> Te adjunto el fichero .sql Jose
>>>
>>> Saludos
>>>   
>>>     
>>>       
>>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
>>>>     
>>>>       
>>>>         
>>>>> Gracias Miguel Angel.
>>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
>>>>> Vai
>>>>>
>>>>>
>>>>> Miguel Angel Tinte García escribió:
>>>>>       
>>>>>         
>>>>>           
>>>>>> Hola Jose,
>>>>>>
>>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
>>>>>> mañana decente. Además ya almaceno información de mensajería
>>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
>>>>>> tablas para evitar errores y duplicados:
>>>>>>
>>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
>>>>>> mysql> desc floss_sources;
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> | Field   | Type    | Null | Key | Default | Extra |
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> | itemid  | int(10) | NO   | MUL | NULL    |       | 
>>>>>> | topicid | int(10) | NO   | MUL | NULL    |       | 
>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>> 2 rows in set (0.00 sec)
>>>>>>
>>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
>>>>>> mysql> desc floss_topics;
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> | Field       | Type        | Null | Key | Default | Extra          |
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment | 
>>>>>> | description | mediumtext  | NO   |     | NULL    |                | 
>>>>>> | label       | varchar(80) | YES  | UNI | NULL    |                | 
>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>> 3 rows in set (0.00 sec)
>>>>>>
>>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
>>>>>> item:
>>>>>> mysql> desc info_items;
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> | Field    | Type          | Null | Key | Default | Extra          |
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment | 
>>>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                | 
>>>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                | 
>>>>>> | language | varchar(20)   | YES  |     | NULL    |                | 
>>>>>> | title    | varchar(2000) | YES  |     | NULL    |                | 
>>>>>> | creation | datetime      | NO   |     | NULL    |                | 
>>>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                | 
>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>> 7 rows in set (0.00 sec)
>>>>>>
>>>>>>
>>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
>>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
>>>>>>
>>>>>> Saludos
>>>>>>
>>>>>>
>>>>>>   
>>>>>>         
>>>>>>           
>>>>>>             
>>>>> _______________________________________________
>>>>> Qualipso-a4 mailing list
>>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>>       
>>>>>         
>>>>>           
>>>> _______________________________________________
>>>> Qualipso-a4 mailing list
>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>     
>>>>       
>>>>         


More information about the Qualipso-a4 mailing list