Hi everybody,
Does anybody know any tool to get a list of deleted images under a category in commons, and any other tool to get a list of a category users details such as user name and registration date?
I'm appointing to get some management tasks and internal metrics for "Wikiviajes por Venezuela 2014" a photo contest run by Wikimedia Venezuela currently.
This is the category: https://commons.wikimedia.org/wiki/Category:Wikiviajes_por_Venezuela_2014
Any help is appreciated,
Thanks,
*Fhaidel Domínguez* Portavoz / Spokesperson Wikimedia Venezuela www.wikimedia.org.ve
*ES: "Imagina un mundo* en el que cada ser humano tiene la posibilidad de acceder a la suma de todo el conocimiento. Ese es nuestro compromiso" *GUC: *"*Jülüjain wanee mmakat *ein kapülain tü alijunakalirua jee wayuukanairua junain ekerolaa alümüin supüshuwayale etijaanaka. Ayatashi waya junain"
On 06/05/14 12:40, Fhaidel Domínguez wrote:
Hi everybody,
Does anybody know any tool to get a list of deleted images under a category in commons,
You can't. Once a page is deleted, it no longer belongs to any category. If you know a time frame you could check (categorylinks) on an old dump for images that were in that category, and then filter out those who still exist.
and any other tool to get a list of a category users details such as user name and registration date?
I'm appointing to get some management tasks and internal metrics for "Wikiviajes por Venezuela 2014" a photo contest run by Wikimedia Venezuela currently.
This is the category: https://commons.wikimedia.org/wiki/Category:Wikiviajes_por_Venezuela_2014
Assuming you want the user that uploaded the first version of each of the images on that category, what you want is:
SELECT DISTINCT user_name, user_registration FROM categorylinks LEFT JOIN logging ON (log_page = cl_from AND log_type='upload' and log_action='upload') LEFT JOIN user ON (user_id = log_user) WHERE cl_to ='Wikiviajes_por_Venezuela_2014';
I've left the list of 398 users at http://toolserver.org/~platonides/sandbox/Usuarios-Wikiviajes_por_Venezuela_...
As expected, most are new users:
2014 370 92.9648% (1 in March, 187 in April, 182 in May) 2013 6 1.50754% 2012 6 1.50754% 2011 3 0.753769% 2010 6 1.50754% 2009 2 0.502513% 2008 2 0.502513% 2007 1 0.251256% 2006 2 0.502513%
Fun fact: you are the second oldest participant. ☺
Any help is appreciated,
Thanks,
You're welcome
:) ¡Gracias, Platonides!
Ya yo estaba pensando que no era posible, pero esa idea tuya es buena para lo que busco:
El período que quisiera revisar es del 1ero de abril al 31 de mayo de 2014
Ahora, si sé eso... ¿cómo puedo sacar ese volcado de las imágenes que estuvieron en esa categoría? Con CatScan podría comparar después y sacar el número así como tú dices.
La segunda pregunta es para sacar eso mismo que tienes en ese link. ¡Está perfecto!
Y bueno, así son las cosas :) Pero para que conste en los registros, yo no participo. Solo contribuyo como usuario. Lamentablemente, según las bases, yo no puedo participar. :( Pero hay algo más interesante: el usuario más antiguo ha sido de hecho el primer participante.
¡Muchas gracias!
Fhaidel.-
-------- English for the community --------
Thanks Platonides,
I already was thinking it wasn't possible but your idea is good for what I'm looking for:
I know the time frame I would like to check: Apr 1st - May 31st 2014
Now, if I know it... how can I get an old dump for images that were in that category? Then, using CatScan I can compare and get the number in the way you comment.
My second question was looking for what you exactly got in your link. That's great!
And well... facts are facts :) Just for the records, I'm not a participant but a contributor user. Sadly I'm not a participant according to the contest rules. :( But there's something more interesting: the oldest user is in fact the first participant.
Thank you so much!
Fhaidel.-
2014-05-11 22:07 GMT+02:00 Platonides platonides@gmail.com:
On 06/05/14 12:40, Fhaidel Domínguez wrote:
Hi everybody,
Does anybody know any tool to get a list of deleted images under a category in commons,
You can't. Once a page is deleted, it no longer belongs to any category. If you know a time frame you could check (categorylinks) on an old dump for images that were in that category, and then filter out those who still exist.
and any other tool to get a list of a category
users details such as user name and registration date?
I'm appointing to get some management tasks and internal metrics for "Wikiviajes por Venezuela 2014" a photo contest run by Wikimedia Venezuela currently.
This is the category: https://commons.wikimedia.org/wiki/Category:Wikiviajes_por_Venezuela_2014
Assuming you want the user that uploaded the first version of each of the images on that category, what you want is:
SELECT DISTINCT user_name, user_registration FROM categorylinks LEFT JOIN logging ON (log_page = cl_from AND log_type='upload' and log_action='upload') LEFT JOIN user ON (user_id = log_user) WHERE cl_to ='Wikiviajes_por_Venezuela_2014';
I've left the list of 398 users at http://toolserver.org/~ platonides/sandbox/Usuarios-Wikiviajes_por_Venezuela_2014- 20140511200000.txt
As expected, most are new users:
2014 370 92.9648% (1 in March, 187 in April, 182 in May) 2013 6 1.50754% 2012 6 1.50754% 2011 3 0.753769% 2010 6 1.50754% 2009 2 0.502513% 2008 2 0.502513% 2007 1 0.251256% 2006 2 0.502513%
Fun fact: you are the second oldest participant. ☺
Any help is appreciated,
Thanks,
You're welcome
Wiki Loves Monuments mailing list WikiLovesMonuments@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikilovesmonuments http://www.wikilovesmonuments.org
(English below)
On 12/05/14 00:06, Fhaidel Domínguez wrote:
:) ¡Gracias, Platonides!
Ya yo estaba pensando que no era posible, pero esa idea tuya es buena para lo que busco:
El período que quisiera revisar es del 1ero de abril al 31 de mayo de 2014
Ahora, si sé eso... ¿cómo puedo sacar ese volcado de las imágenes que estuvieron en esa categoría? Con CatScan podría comparar después y sacar el número así como tú dices.
Hay volcados de commons del 20140401, 20140421 y 20140508, lo que nos permite saber qué ficheros estaban en la categoría *en esa fecha*. Pero no detectar un fichero añadido y eliminado en otra intermedia.
Si podemos ignorar las imágenes borradas (por ejemplo, porque no pueden participar), se podría escanear un volcado buscando todos los ficheros que tuvieron la plantilla en alguna revisión.
Sin embargo, si quisiéramos además incluir las borradas, habría que mirar los ficheros subidos y borrados en ese rango y comprobar todas y cada una de sus revisiones.
Para resolver este problema en WLM, lo que hacía era vigilar la categoría, registrando cada pocos minutos las imágenes que se iban añadiendo, resultando en una aproximación bastante buena. Pero lógicamente no podemos usar esta estrategia para las imágenes de hace un mes :(
La segunda pregunta es para sacar eso mismo que tienes en ese link. ¡Está perfecto!
Gracias :)
Y bueno, así son las cosas :) Pero para que conste en los registros, yo no participo. Solo contribuyo como usuario. Lamentablemente, según las bases, yo no puedo participar. :( Pero hay algo más interesante: el usuario más antiguo ha sido de hecho el primer participante.
¡Muchas gracias!
Fhaidel.-
-------- English for the community --------
Thanks Platonides,
I already was thinking it wasn't possible but your idea is good for what I'm looking for:
I know the time frame I would like to check: Apr 1st - May 31st 2014
Now, if I know it... how can I get an old dump for images that were in that category? Then, using CatScan I can compare and get the number in the way you comment.
There are commonswiki dumps for dates 20140401, 20140421, 20140508. This allows to know which files where there *at that specific date*. But not for a file added and removed at an intermediate date.
If you don't mind about deleted files (eg, they can't participate), you can scan a dump for all files that contained the template on any revision.
However, for including deleted files you would need to view the files uploaded and deleted in that timeframe and check each of their revisions‼
In order to solve this very same problem at WLM, what I did was to follow the category, registering every few minutes the images that were added, producing a quite good approximation. But we obviously can't do the same thing for images uploaded last month :/
My second question was looking for what you exactly got in your link. That's great!
Thanks :)
And well... facts are facts :) Just for the records, I'm not a participant but a contributor user. Sadly I'm not a participant according to the contest rules. :( But there's something more interesting: the oldest user is in fact the first participant.
Thank you so much!
Fhaidel.-
Ok, entonces será mejor espera que llegue junio para intentar sacar los volcados y revisar. En todo caso, gracias. De seguro te molesto luego.
------------- en --------------
Ok, so we better wait till June to try to get the dumps and check. Anyway, thanks a lot. I'll surely be bothering you later about this.
El 12 de mayo de 2014, 1:27, Platonides platonides@gmail.com escribió:
(English below)
On 12/05/14 00:06, Fhaidel Domínguez wrote:
:) ¡Gracias, Platonides!
Ya yo estaba pensando que no era posible, pero esa idea tuya es buena para lo que busco:
El período que quisiera revisar es del 1ero de abril al 31 de mayo de 2014
Ahora, si sé eso... ¿cómo puedo sacar ese volcado de las imágenes que estuvieron en esa categoría? Con CatScan podría comparar después y sacar el número así como tú dices.
Hay volcados de commons del 20140401, 20140421 y 20140508, lo que nos permite saber qué ficheros estaban en la categoría *en esa fecha*. Pero no detectar un fichero añadido y eliminado en otra intermedia.
Si podemos ignorar las imágenes borradas (por ejemplo, porque no pueden participar), se podría escanear un volcado buscando todos los ficheros que tuvieron la plantilla en alguna revisión.
Sin embargo, si quisiéramos además incluir las borradas, habría que mirar los ficheros subidos y borrados en ese rango y comprobar todas y cada una de sus revisiones.
Para resolver este problema en WLM, lo que hacía era vigilar la categoría, registrando cada pocos minutos las imágenes que se iban añadiendo, resultando en una aproximación bastante buena. Pero lógicamente no podemos usar esta estrategia para las imágenes de hace un mes :(
La segunda pregunta es para sacar eso mismo que tienes en ese link.
¡Está perfecto!
Gracias :)
Y bueno, así son las cosas :) Pero para que conste en los registros, yo
no participo. Solo contribuyo como usuario. Lamentablemente, según las bases, yo no puedo participar. :( Pero hay algo más interesante: el usuario más antiguo ha sido de hecho el primer participante.
¡Muchas gracias!
Fhaidel.-
-------- English for the community --------
Thanks Platonides,
I already was thinking it wasn't possible but your idea is good for what I'm looking for:
I know the time frame I would like to check: Apr 1st - May 31st 2014
Now, if I know it... how can I get an old dump for images that were in that category? Then, using CatScan I can compare and get the number in the way you comment.
There are commonswiki dumps for dates 20140401, 20140421, 20140508. This allows to know which files where there *at that specific date*. But not for a file added and removed at an intermediate date.
If you don't mind about deleted files (eg, they can't participate), you can scan a dump for all files that contained the template on any revision.
However, for including deleted files you would need to view the files uploaded and deleted in that timeframe and check each of their revisions‼
In order to solve this very same problem at WLM, what I did was to follow the category, registering every few minutes the images that were added, producing a quite good approximation. But we obviously can't do the same thing for images uploaded last month :/
My second question was looking for what you exactly got in your link.
That's great!
Thanks :)
And well... facts are facts :) Just for the records, I'm not a
participant but a contributor user. Sadly I'm not a participant according to the contest rules. :( But there's something more interesting: the oldest user is in fact the first participant.
Thank you so much!
Fhaidel.-
Wiki Loves Monuments mailing list WikiLovesMonuments@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikilovesmonuments http://www.wikilovesmonuments.org
Saludos,
Recomiendo buscar los archivos Borrados por la usuaria Beria durante ese período en sus contribuciones.
2014-05-12 17:10 GMT-04:30 Fhaidel Domínguez fhaidel@wikimedia.org.ve:
Ok, entonces será mejor espera que llegue junio para intentar sacar los volcados y revisar. En todo caso, gracias. De seguro te molesto luego.
------------- en --------------
Ok, so we better wait till June to try to get the dumps and check. Anyway, thanks a lot. I'll surely be bothering you later about this.
El 12 de mayo de 2014, 1:27, Platonides platonides@gmail.com escribió:
(English below)
On 12/05/14 00:06, Fhaidel Domínguez wrote:
:) ¡Gracias, Platonides!
Ya yo estaba pensando que no era posible, pero esa idea tuya es buena para lo que busco:
El período que quisiera revisar es del 1ero de abril al 31 de mayo de 2014
Ahora, si sé eso... ¿cómo puedo sacar ese volcado de las imágenes que estuvieron en esa categoría? Con CatScan podría comparar después y sacar el número así como tú dices.
Hay volcados de commons del 20140401, 20140421 y 20140508, lo que nos permite saber qué ficheros estaban en la categoría *en esa fecha*. Pero no detectar un fichero añadido y eliminado en otra intermedia.
Si podemos ignorar las imágenes borradas (por ejemplo, porque no pueden participar), se podría escanear un volcado buscando todos los ficheros que tuvieron la plantilla en alguna revisión.
Sin embargo, si quisiéramos además incluir las borradas, habría que mirar los ficheros subidos y borrados en ese rango y comprobar todas y cada una de sus revisiones.
Para resolver este problema en WLM, lo que hacía era vigilar la categoría, registrando cada pocos minutos las imágenes que se iban añadiendo, resultando en una aproximación bastante buena. Pero lógicamente no podemos usar esta estrategia para las imágenes de hace un mes :(
La segunda pregunta es para sacar eso mismo que tienes en ese link.
¡Está perfecto!
Gracias :)
Y bueno, así son las cosas :) Pero para que conste en los registros, yo
no participo. Solo contribuyo como usuario. Lamentablemente, según las bases, yo no puedo participar. :( Pero hay algo más interesante: el usuario más antiguo ha sido de hecho el primer participante.
¡Muchas gracias!
Fhaidel.-
-------- English for the community --------
Thanks Platonides,
I already was thinking it wasn't possible but your idea is good for what I'm looking for:
I know the time frame I would like to check: Apr 1st - May 31st 2014
Now, if I know it... how can I get an old dump for images that were in that category? Then, using CatScan I can compare and get the number in the way you comment.
There are commonswiki dumps for dates 20140401, 20140421, 20140508. This allows to know which files where there *at that specific date*. But not for a file added and removed at an intermediate date.
If you don't mind about deleted files (eg, they can't participate), you can scan a dump for all files that contained the template on any revision.
However, for including deleted files you would need to view the files uploaded and deleted in that timeframe and check each of their revisions‼
In order to solve this very same problem at WLM, what I did was to follow the category, registering every few minutes the images that were added, producing a quite good approximation. But we obviously can't do the same thing for images uploaded last month :/
My second question was looking for what you exactly got in your link.
That's great!
Thanks :)
And well... facts are facts :) Just for the records, I'm not a
participant but a contributor user. Sadly I'm not a participant according to the contest rules. :( But there's something more interesting: the oldest user is in fact the first participant.
Thank you so much!
Fhaidel.-
Wiki Loves Monuments mailing list WikiLovesMonuments@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikilovesmonuments http://www.wikilovesmonuments.org
-- Saludos,
*Fhaidel Domínguez* Portavoz Wikimedia Venezuela www.wikimedia.org.ve
*ES: "Imagina un mundo* en el que cada ser humano tiene la posibilidad de acceder a la suma de todo el conocimiento. Ese es nuestro compromiso" *GUC: *"*Jülüjain wanee mmakat *ein kapülain tü alijunakalirua jee wayuukanairua junain ekerolaa alümüin supüshuwayale etijaanaka. Ayatashi waya junain"
Wiki Loves Monuments mailing list WikiLovesMonuments@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikilovesmonuments http://www.wikilovesmonuments.org
wikilovesmonuments@lists.wikimedia.org