[Qualipso-a4] cambios necesarios para almacenar topics
Miguel Angel Tinte García
matinte en libresoft.es
Lun Feb 8 10:43:15 CET 2010
El lun, 08-02-2010 a las 10:37 +0100, José Antonio Quiles escribió:
> Otra cosa, Miguel Angel.
> Los items de tipo "instant message" tienen todos la fecha a cero.
> ¿Podrías poner la fecha correcta?
> Por otro lado, no veo ninguna tabla donde se almacenen los "instant
> messages", sólo se está almacenando en info_items.
Sí, es que no tenemos ninguna tabla para los instant messages pero como
sí son items pues los he agregado en info_items. Si lo crees necesario
podemos ver la posibilidad de añadir una tabla para IM.
> Vai
>
>
> JOSE ANTONIO QUILES FOLLANA escribió:
> > Hola,
> > ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> > Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de
> > ellos, 225 están "vacíos", realmente pone en el body algo así como:
> > [<email.message.Message instance at 0x92022ac>,
> > <email.message.Message instance at 0x91fba0c>]
> > Podrías mirar esto?
> > Gracias,
> > Vai
> >
> >
> > JOSE ANTONIO QUILES FOLLANA escribió:
> >
> >> Hola Miguel Angel,
> >> si puedes mándamelo en un zip, porque no lo puedo salvar.
> >> Gracias
> >>
> >>
> >> Miguel Angel Tinte García escribió:
> >>
> >>
> >>> Perdona que no te había puesto en cc
> >>>
> >>> El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
> >>> escribió:
> >>> Bueno, ha tardado un poco en procesar todos los mbox además de dar
> >>> algunos errores durante dicho proceso pero finalmente tengo una bbdd con
> >>> todos los mbox de evince de 2009 analizados y unos pocos bugs y
> >>> conversations creados por nosotros mismos.
> >>>
> >>> Te adjunto el fichero .sql Jose
> >>>
> >>> Saludos
> >>>
> >>>
> >>>
> >>>> El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
> >>>>
> >>>>
> >>>>
> >>>>> Gracias Miguel Angel.
> >>>>> En cuanto tenga los nuevos datos me pongo a indexarlos.
> >>>>> Vai
> >>>>>
> >>>>>
> >>>>> Miguel Angel Tinte García escribió:
> >>>>>
> >>>>>
> >>>>>
> >>>>>> Hola Jose,
> >>>>>>
> >>>>>> hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
> >>>>>> mañana decente. Además ya almaceno información de mensajería
> >>>>>> instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
> >>>>>> tablas para evitar errores y duplicados:
> >>>>>>
> >>>>>> * Quitar PRIMARY KEY a itemid en floss_sources:
> >>>>>> mysql> desc floss_sources;
> >>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>> | Field | Type | Null | Key | Default | Extra |
> >>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>> | itemid | int(10) | NO | MUL | NULL | |
> >>>>>> | topicid | int(10) | NO | MUL | NULL | |
> >>>>>> +---------+---------+------+-----+---------+-------+
> >>>>>> 2 rows in set (0.00 sec)
> >>>>>>
> >>>>>> * Hacer topicid auto_increment y label UNIQUE en floss_topics:
> >>>>>> mysql> desc floss_topics;
> >>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>> | Field | Type | Null | Key | Default | Extra |
> >>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>> | topicid | int(10) | NO | PRI | NULL | auto_increment |
> >>>>>> | description | mediumtext | NO | | NULL | |
> >>>>>> | label | varchar(80) | YES | UNI | NULL | |
> >>>>>> +-------------+-------------+------+-----+---------+----------------+
> >>>>>> 3 rows in set (0.00 sec)
> >>>>>>
> >>>>>> * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
> >>>>>> item:
> >>>>>> mysql> desc info_items;
> >>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>> | Field | Type | Null | Key | Default | Extra |
> >>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>> | itemid | int(11) | NO | PRI | NULL | auto_increment |
> >>>>>> | uri | varchar(250) | YES | UNI | NULL | |
> >>>>>> | url | varchar(250) | YES | UNI | NULL | |
> >>>>>> | language | varchar(20) | YES | | NULL | |
> >>>>>> | title | varchar(2000) | YES | | NULL | |
> >>>>>> | creation | datetime | NO | | NULL | |
> >>>>>> | typeid | int(11) | NO | MUL | NULL | |
> >>>>>> +----------+---------------+------+-----+---------+----------------+
> >>>>>> 7 rows in set (0.00 sec)
> >>>>>>
> >>>>>>
> >>>>>> Mañana tengo las listas de correo de evince de 2009 preparadas para ser
> >>>>>> analizadas y almacenadas en la bbdd que te enviaré después.
> >>>>>>
> >>>>>> Saludos
> >>>>>>
> >>>>>>
> >>>>>>
> >>>>>>
> >>>>>>
> >>>>>>
> >>>>> _______________________________________________
> >>>>> Qualipso-a4 mailing list
> >>>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>>
> >>>>>
> >>>>>
> >>>> _______________________________________________
> >>>> Qualipso-a4 mailing list
> >>>> Qualipso-a4 en gsyc.escet.urjc.es
> >>>> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> >>>>
> >>>>
> >>>>
--
Miguel Ángel Tinte García
Libre Software Engineering Lab (GSyC) | Universidad Rey Juan Carlos
matinte en libresoft.es
http://libresoft.urjc.es/
More information about the Qualipso-a4
mailing list