[Qualipso-a4] cambios necesarios para almacenar topics

José Antonio Quiles quiles en tid.es
Lun Feb 8 15:57:34 CET 2010


Gracias Miguel Angel.
Ya veo que también has corregido lo de las fechas en los IM.
Sólo una cosa, la próxima vez que me envíes una BD, mételo en un zip, 
porque si no, tengo que hacer copy/paste a un fichero, y me da miedo 
romper alguna línea.
Vai


Miguel Angel Tinte García escribió:
> Hola Jose,
>
> ya está resuelto el error del body en mail_mails y el de creation para
> los instant messages. Te adjunto la bbdd con los emails de evince de
> 2009 analizados.
>
> Saludos 
>
>
> El lun, 08-02-2010 a las 08:55 +0100, José Antonio Quiles escribió:
>   
>> Hola,
>> ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
>> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de 
>> ellos, 225 están "vacíos", realmente pone en el body algo así como:
>>     [<email.message.Message instance at 0x92022ac>, 
>> <email.message.Message instance at 0x91fba0c>]
>> Podrías mirar esto?
>> Gracias,
>> Vai
>>
>>
>> JOSE ANTONIO QUILES FOLLANA escribió:
>>     
>>> Hola Miguel Angel,
>>> si puedes mándamelo en un zip, porque no lo puedo salvar.
>>> Gracias
>>>
>>>
>>> Miguel Angel Tinte García escribió:
>>>   
>>>       
>>>> Perdona que no te había puesto en cc
>>>>
>>>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
>>>> escribió:
>>>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
>>>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
>>>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
>>>> conversations creados por nosotros mismos.
>>>>
>>>> Te adjunto el fichero .sql Jose
>>>>
>>>> Saludos
>>>>   
>>>>     
>>>>         
>>>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
>>>>>     
>>>>>       
>>>>>           
>>>>>> Gracias Miguel Angel.
>>>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
>>>>>> Vai
>>>>>>
>>>>>>
>>>>>> Miguel Angel Tinte García escribió:
>>>>>>       
>>>>>>         
>>>>>>             
>>>>>>> Hola Jose,
>>>>>>>
>>>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
>>>>>>> mañana decente. Además ya almaceno información de mensajería
>>>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
>>>>>>> tablas para evitar errores y duplicados:
>>>>>>>
>>>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
>>>>>>> mysql> desc floss_sources;
>>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>>> | Field   | Type    | Null | Key | Default | Extra |
>>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>>> | itemid  | int(10) | NO   | MUL | NULL    |       | 
>>>>>>> | topicid | int(10) | NO   | MUL | NULL    |       | 
>>>>>>> +---------+---------+------+-----+---------+-------+
>>>>>>> 2 rows in set (0.00 sec)
>>>>>>>
>>>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
>>>>>>> mysql> desc floss_topics;
>>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>>> | Field       | Type        | Null | Key | Default | Extra          |
>>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>>> | topicid     | int(10)     | NO   | PRI | NULL    | auto_increment | 
>>>>>>> | description | mediumtext  | NO   |     | NULL    |                | 
>>>>>>> | label       | varchar(80) | YES  | UNI | NULL    |                | 
>>>>>>> +-------------+-------------+------+-----+---------+----------------+
>>>>>>> 3 rows in set (0.00 sec)
>>>>>>>
>>>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
>>>>>>> item:
>>>>>>> mysql> desc info_items;
>>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>>> | Field    | Type          | Null | Key | Default | Extra          |
>>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>>> | itemid   | int(11)       | NO   | PRI | NULL    | auto_increment | 
>>>>>>> | uri      | varchar(250)  | YES  | UNI | NULL    |                | 
>>>>>>> | url      | varchar(250)  | YES  | UNI | NULL    |                | 
>>>>>>> | language | varchar(20)   | YES  |     | NULL    |                | 
>>>>>>> | title    | varchar(2000) | YES  |     | NULL    |                | 
>>>>>>> | creation | datetime      | NO   |     | NULL    |                | 
>>>>>>> | typeid   | int(11)       | NO   | MUL | NULL    |                | 
>>>>>>> +----------+---------------+------+-----+---------+----------------+
>>>>>>> 7 rows in set (0.00 sec)
>>>>>>>
>>>>>>>
>>>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
>>>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
>>>>>>>
>>>>>>> Saludos
>>>>>>>
>>>>>>>
>>>>>>>   
>>>>>>>         
>>>>>>>           
>>>>>>>               
>>>>>> _______________________________________________
>>>>>> Qualipso-a4 mailing list
>>>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>>>       
>>>>>>         
>>>>>>             
>>>>> _______________________________________________
>>>>> Qualipso-a4 mailing list
>>>>> Qualipso-a4 en gsyc.escet.urjc.es
>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>>>>     
>>>>>       
>>>>>           
>> _______________________________________________
>> Qualipso-a4 mailing list
>> Qualipso-a4 en gsyc.escet.urjc.es
>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
>>     


More information about the Qualipso-a4 mailing list