[Qualipso-a4] cambios necesarios para almacenar topics
Miguel Angel Tinte García
matinte en libresoft.es
Mar Feb 9 10:27:28 CET 2010
El mar, 09-02-2010 a las 10:16 +0100, José Antonio Quiles escribió:
> Hola Miguel Angel,
> ¿esta BD sobreescribe la anterior o es un añadido?
> Si es un añadido, ¿cómo la importo en mysql sin destrozar los datos
> anteriores?
Es la misma bbdd más los mails de evince de 2008. Yo te recomiendo que
machaques la anterior ya que están todos los datos en ésta.
Si lo haces desde un terminal es muy fácil:
mysql -u root -proot qualipso < qualipso_BTS_ML_IM.sql
> Vai
Ciao
>
> Miguel Angel Tinte García escribió:
> > El lun, 08-02-2010 a las 15:57 +0100, José Antonio Quiles escribió:
> >
> > > Gracias Miguel Angel.
> > > Ya veo que también has corregido lo de las fechas en los IM.
> > > Sólo una cosa, la próxima vez que me envíes una BD, mételo en un zip,
> > > porque si no, tengo que hacer copy/paste a un fichero, y me da miedo
> > > romper alguna línea.
> > >
> > Acabo de analizar las mbox de evince de 2008. Ahí va el zip con el sql
> > dentro, espero que te sirva
> >
> > > Vai
> > >
> > >
> > > Miguel Angel Tinte García escribió:
> > >
> > > > Hola Jose,
> > > >
> > > > ya está resuelto el error del body en mail_mails y el de creation para
> > > > los instant messages. Te adjunto la bbdd con los emails de evince de
> > > > 2009 analizados.
> > > >
> > > > Saludos
> > > >
> > > >
> > > > El lun, 08-02-2010 a las 08:55 +0100, José Antonio Quiles escribió:
> > > >
> > > >
> > > > > Hola,
> > > > > ya he conseguido importarlo, no hace falta que me lo envíes en un zip.
> > > > > Pero estoy mirando los datos y veo un problema: hay 410 mails, pero de
> > > > > ellos, 225 están "vacíos", realmente pone en el body algo así como:
> > > > > [<email.message.Message instance at 0x92022ac>,
> > > > > <email.message.Message instance at 0x91fba0c>]
> > > > > Podrías mirar esto?
> > > > > Gracias,
> > > > > Vai
> > > > >
> > > > >
> > > > > JOSE ANTONIO QUILES FOLLANA escribió:
> > > > >
> > > > >
> > > > > > Hola Miguel Angel,
> > > > > > si puedes mándamelo en un zip, porque no lo puedo salvar.
> > > > > > Gracias
> > > > > >
> > > > > >
> > > > > > Miguel Angel Tinte García escribió:
> > > > > >
> > > > > >
> > > > > >
> > > > > > > Perdona que no te había puesto en cc
> > > > > > >
> > > > > > > El vie, 05-02-2010 a las 15:17 +0100, Miguel Angel Tinte García
> > > > > > > escribió:
> > > > > > > Bueno, ha tardado un poco en procesar todos los mbox además de dar
> > > > > > > algunos errores durante dicho proceso pero finalmente tengo una bbdd con
> > > > > > > todos los mbox de evince de 2009 analizados y unos pocos bugs y
> > > > > > > conversations creados por nosotros mismos.
> > > > > > >
> > > > > > > Te adjunto el fichero .sql Jose
> > > > > > >
> > > > > > > Saludos
> > > > > > >
> > > > > > >
> > > > > > >
> > > > > > >
> > > > > > > > El vie, 05-02-2010 a las 08:23 +0100, José Antonio Quiles escribió:
> > > > > > > >
> > > > > > > >
> > > > > > > >
> > > > > > > >
> > > > > > > > > Gracias Miguel Angel.
> > > > > > > > > En cuanto tenga los nuevos datos me pongo a indexarlos.
> > > > > > > > > Vai
> > > > > > > > >
> > > > > > > > >
> > > > > > > > > Miguel Angel Tinte García escribió:
> > > > > > > > >
> > > > > > > > >
> > > > > > > > >
> > > > > > > > >
> > > > > > > > > > Hola Jose,
> > > > > > > > > >
> > > > > > > > > > hoy he dedicado el día a depurar errores de bbdd para enviarte un dump
> > > > > > > > > > mañana decente. Además ya almaceno información de mensajería
> > > > > > > > > > instantanea. Hay algunas pequeñas modificaciones que hay que hacer a las
> > > > > > > > > > tablas para evitar errores y duplicados:
> > > > > > > > > >
> > > > > > > > > > * Quitar PRIMARY KEY a itemid en floss_sources:
> > > > > > > > > > mysql> desc floss_sources;
> > > > > > > > > > +---------+---------+------+-----+---------+-------+
> > > > > > > > > > | Field | Type | Null | Key | Default | Extra |
> > > > > > > > > > +---------+---------+------+-----+---------+-------+
> > > > > > > > > > | itemid | int(10) | NO | MUL | NULL | |
> > > > > > > > > > | topicid | int(10) | NO | MUL | NULL | |
> > > > > > > > > > +---------+---------+------+-----+---------+-------+
> > > > > > > > > > 2 rows in set (0.00 sec)
> > > > > > > > > >
> > > > > > > > > > * Hacer topicid auto_increment y label UNIQUE en floss_topics:
> > > > > > > > > > mysql> desc floss_topics;
> > > > > > > > > > +-------------+-------------+------+-----+---------+----------------+
> > > > > > > > > > | Field | Type | Null | Key | Default | Extra |
> > > > > > > > > > +-------------+-------------+------+-----+---------+----------------+
> > > > > > > > > > | topicid | int(10) | NO | PRI | NULL | auto_increment |
> > > > > > > > > > | description | mediumtext | NO | | NULL | |
> > > > > > > > > > | label | varchar(80) | YES | UNI | NULL | |
> > > > > > > > > > +-------------+-------------+------+-----+---------+----------------+
> > > > > > > > > > 3 rows in set (0.00 sec)
> > > > > > > > > >
> > > > > > > > > > * Otros cambios útiles bien serían hacer UNIQUE las uri y url de los
> > > > > > > > > > item:
> > > > > > > > > > mysql> desc info_items;
> > > > > > > > > > +----------+---------------+------+-----+---------+----------------+
> > > > > > > > > > | Field | Type | Null | Key | Default | Extra |
> > > > > > > > > > +----------+---------------+------+-----+---------+----------------+
> > > > > > > > > > | itemid | int(11) | NO | PRI | NULL | auto_increment |
> > > > > > > > > > | uri | varchar(250) | YES | UNI | NULL | |
> > > > > > > > > > | url | varchar(250) | YES | UNI | NULL | |
> > > > > > > > > > | language | varchar(20) | YES | | NULL | |
> > > > > > > > > > | title | varchar(2000) | YES | | NULL | |
> > > > > > > > > > | creation | datetime | NO | | NULL | |
> > > > > > > > > > | typeid | int(11) | NO | MUL | NULL | |
> > > > > > > > > > +----------+---------------+------+-----+---------+----------------+
> > > > > > > > > > 7 rows in set (0.00 sec)
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > > Mañana tengo las listas de correo de evince de 2009 preparadas para ser
> > > > > > > > > > analizadas y almacenadas en la bbdd que te enviaré después.
> > > > > > > > > >
> > > > > > > > > > Saludos
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > >
> > > > > > > > > _______________________________________________
> > > > > > > > > Qualipso-a4 mailing list
> > > > > > > > > Qualipso-a4 en gsyc.escet.urjc.es
> > > > > > > > > http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> > > > > > > > >
> > > > > > > > >
> > > > > > > > >
> > > > > > > > >
> > > > > > > > _______________________________________________
> > > > > > > > Qualipso-a4 mailing list
> > > > > > > > Qualipso-a4 en gsyc.escet.urjc.es
> > > > > > > > http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> > > > > > > >
> > > > > > > >
> > > > > > > >
> > > > > > > >
> > > > > _______________________________________________
> > > > > Qualipso-a4 mailing list
> > > > > Qualipso-a4 en gsyc.escet.urjc.es
> > > > > http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> > > > >
> > > > >
> > > _______________________________________________
> > > Qualipso-a4 mailing list
> > > Qualipso-a4 en gsyc.escet.urjc.es
> > > http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
> > >
> _______________________________________________
> Qualipso-a4 mailing list
> Qualipso-a4 en gsyc.escet.urjc.es
> http://gsyc.escet.urjc.es/cgi-bin/mailman/listinfo/qualipso-a4
--
Miguel Ángel Tinte García
Libre Software Engineering Lab (GSyC) | Universidad Rey Juan Carlos
matinte en libresoft.es
http://libresoft.urjc.es/
More information about the Qualipso-a4
mailing list