[Qualipso-a4] cambios necesarios para almacenar topics
Miguel Angel Tinte García
matinte en libresoft.es
Lun Feb 8 18:17:51 CET 2010
El lun, 08-02-2010 a las 15:57 +0100, José Antonio Quiles escribió:
> Gracias Miguel Angel.
> Ya veo que también has corregido lo de las fechas en los IM.
> Sólo una cosa, la próxima vez que me envÃes una BD, mételo en un zip,
> porque si no, tengo que hacer copy/paste a un fichero, y me da miedo
> romper alguna lÃnea.
Acabo de analizar las mbox de evince de 2008. Ahà va el zip con el sql
dentro, espero que te sirva
> Vai
>
>
> Miguel Angel Tinte GarcÃa escribió:
> > Hola Jose,
> >
> > ya está resuelto el error del body en mail_mails y el de creation para
> > los instant messages. Te adjunto la bbdd con los emails de evince de
> > 2009 analizados.
> >
> > Saludos
> >
> >
> > El lun, 08-02-2010 a las 08:55 +0100, José Antonio Quiles escribió:
> >
> >> Hola,
> >> ya he conseguido importarlo, no hace falta que me lo envÃes en un zip.
> >> Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de
> >> ellos, 225 están "vacÃos", realmente pone en el body algo asà como:
> >> [<email.message.Message instance at 0x92022ac>,
> >> <email.message.Message instance at 0x91fba0c>]
> >> PodrÃas mirar esto?
> >> Gracias,
> >> Vai
> >>
> >>
> >> JOSE ANTONIO QUILES FOLLANA escribió:
> >>
> >>> Hola Miguel Angel,
> >>> si puedes mándamelo en un zip, porque no lo puedo salvar.
> >>> Gracias
> >>>
> >>>
> >>> Miguel Angel Tinte GarcÃa escribió:
> >>>
> >>>
> >>>> Perdona que no te habÃa puesto en cc
> >>>>
> >>>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte GarcÃa
> >>>> escribió:
> >>>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
> >>>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
> >>>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
> >>>> conversations creados por nosotros mismos.
> >>>>
> >>>> Te adjunto el fichero .sql Jose
> >>>>
> >>>> Saludos
> >>>>
> >>>>
> >>>>
> >>>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
> >>>>>
> >>>>>
> >>>>>
> >>>>>> Gracias Miguel Angel.
> >>>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
> >>>>>> Vai
> >>>>>>
> >>>>>>
> >>>>>> Miguel Angel Tinte GarcÃa escribió:
> >>>>>>
> >>>>>>
> >>>>>>
> >>>>>>> Hola Jose,
> >>>>>>>
> >>>>>>> hoy he dedicado el dÃa a depurar errores de bbdd para enviarte un dump
> >>>>>>> mañana decente. Además ya almaceno información de mensajerÃa
> >>>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
> >>>>>>> tablas para evitar errores y duplicados:
> >>>>>>>
> >>>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
> >>>>>>> mysql> desc floss_sources;
> >>>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>>> | Field | Type | Null | Key | Default | Extra |
> >>>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>>> | itemid | int(10) | NO | MUL | NULL | |
> >>>>>>> | topicid | int(10) | NO | MUL | NULL | |
> >>>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>>> 2 rows in set (0.00 sec)
> >>>>>>>
> >>>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
> >>>>>>> mysql> desc floss_topics;
> >>>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>>> | Field | Type | Null | Key | Default | Extra |
> >>>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>>> | topicid | int(10) | NO | PRI | NULL | auto_increment |
> >>>>>>> | description | mediumtext | NO | | NULL | |
> >>>>>>> | label | varchar(80) | YES | UNI | NULL | |
> >>>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>>> 3 rows in set (0.00 sec)
> >>>>>>>
> >>>>>>> * Otros cambios útiles bien serÃan hacer UNIQUE las uri y url de los
> >>>>>>> item:
> >>>>>>> mysql> desc info_items;
> >>>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>>> | Field | Type | Null | Key | Default | Extra |
> >>>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>>> | itemid | int(11) | NO | PRI | NULL | auto_increment |
> >>>>>>> | uri | varchar(250) | YES | UNI | NULL | |
> >>>>>>> | url | varchar(250) | YES | UNI | NULL | |
> >>>>>>> | language | varchar(20) | YES | | NULL | |
> >>>>>>> | title | varchar(2000) | YES | | NULL | |
> >>>>>>> | creation | datetime | NO | | NULL | |
> >>>>>>> | typeid | int(11) | NO | MUL | NULL | |
> >>>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>>> 7 rows in set (0.00 sec)
> >>>>>>>
> >>>>>>>
> >>>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
> >>>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
> >>>>>>>
> >>>>>>> Saludos
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>> _______________________________________________
> >>>>>> Qualipso-a4 mailing list
> >>>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>>
> >>>>>>
> >>>>>>
> >>>>> _______________________________________________
> >>>>> Qualipso-a4 mailing list
> >>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>
> >>>>>
> >>>>>
> >> _______________________________________________
> >> Qualipso-a4 mailing list
> >> Qualipso-a4 en gsyc.escet.urjc.es
> >> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
--
Miguel Ãngel Tinte GarcÃa
Libre Software Engineering Lab (GSyC) | Universidad Rey Juan Carlos
matinte en libresoft.es
http://libresoft.urjc.es/
------------ próxima parte ------------
Se ha borrado un mensaje que no está en formato texto plano...
Nombre : qualipso_ML_BTS_IM.sql.zip
Tipo : application/zip
Tamaño : 322662 bytes
Descripción: no disponible
Url : http://gsyc.escet.urjc.es/pipermail/qualipso-a4/attachments/20100208/0771760e/attachment-0001.zip
More information about the Qualipso-a4
mailing list