Доброе!
2014-08-17 19:53 GMT+04:00 rubin.happy rubin.happy@gmail.com:
По статистике я еще попробую что-нибудь сделать (например, поговорить с разработчиком stats.grok.se),
А что с грок? Просто внешний сервер, который парсит дамп WMF. Это любой может делать. Вопрос же не к ним. Кстати сейчас модный другой: http://tools.wmflabs.org/wikiviewstats/
просто значительная часть того, что нас интересует, упирается в конфиденциальность читателей:
Это такая отмазка, не имеющая под собой оснований. Чтобы убедиться, нужно выписать виды обычной групповой статистики и задать по каждому пункту вопрос: Каким конкретно нашим условиям он противоречит и каким образом.
Например, групповые отчёты по: - количество хостов/идентифицированных посетивших страницу (а не хитов, как всю дорогу демонстрируют) - конкретный урл, с которого юзер зашёл на страниц (а не просто домен, по которому найти урл где на нас стоит ссылка не составляет труда, но это лишние танцы с бубнами) - пути по сайту (точки входа, переходы, точки выхода) - страны из которых заходили на проект - браузеры которыми пользуются ... и т.д. просто берёшь гугль аналитик и по списку спрашиваешь...
Несколько раз в сеть попадали крупные дампы анализа статистики больших сайтов. Они анонимизируют IP (куки, если есть) на первом этапе - ставя ему в соответствие некий ID с общими параметрами (страна, свойства браузера, например язык, и т.д). Далее же они хранят в базе подробную инфу только по этому ID. Теоретически, имея доступ к базе теоретически можно деанонимизировать ID, но речь идёт о групповых отчётах, т.е. если ты смотришь количество ID, посетивших страницу, деанонимизировать отдельный ID проблематично, аналогично, если смотреть какие поисковые запросы и сколько ID их делало, также вытащить кто это был в реальном мире крайне сложно.
Большую часть из этой информации можно выдавать в дампе сгруппированных отчётов, но в идеале это нужно делать через собственный интервейс, тогда больше всего можно отразить без опаски раскрыть информацию о конкретных ID.
поэтому нам не дадут информацию, откуда конкретно пришли на конкретную страницу читатели, куда они потом ушли,
зачем абстракции, нужно задавать конкретные вопросы по каждому пункту - какому условию это противоречит и каким образом, а если не противоречит, значит нужно делать
мне, например, непонятно, как конкретные урлы, с которых к нам переходили (потому, что на них стоят прямые ссылки), как-то противоречат нашим условиям...
если аккуратно анализировать, то получится, что в наших условиях нет ничего, что бы противоречило созданию практически полнофункциональной групповой статистики...
что-то аналитического характера о самих пользователях, и многое другое, что могло бы быть интересно.
Ладно, давай тогда в принципе. То что можно сделать сейчас написал выше, а эта часть не для практических действий - она запросто утонет в обсуждениях, но понимать её нужно. Может в будущем что-то прорастёт.
Политика ВМ по конфиденциальности, как впрочем и подавляющего большинства других проектов, - это обман пользователей и предоставление им ложного чувства анонимности. Более того, ВМ - первейший враг анонимности. Но дальше хуже - политика "конфиденциальности" мало того, что является обманом и самообманом, она противоречит нашим целям. Обосную.
Например, я утверждаю, что любой админ Википроекта путём нехитрых манипуляций может получить всю информацию о пользователях и это непрерывно делается, чаще всего случайно, практически не выявляемо, и всем на это плевать. Я сам однажды по запросу создал фичу, которую потом на голубом глазу с благодарностью прикрутили без необходимой коррекции и только через год сообразил, что могу через неё деанонимизировать вообще всех. Т.к. мне эта информация не была нужна, я просто тихо поофигевал и забыл. Через некоторое время её случайно "исправили", но не потому, что поняли в чём прикол, а лишь в качестве "оптимизации". Сейчас той моей возможности нет, но повторить её может каждый в любой момент.
Или вот ещё более наглядно AddThis и любое "поделись" не теряет ни единого байта информации за всю свою историю и открыто этими данными торгует, а у нас оно иногда вообще в теле страницы появляется. Но даже если это лишь ссылка, о какой анонимизации можно говорить, если мы сознательно подсовываем юзеру брешь в его безопасности на всех страницах.
Или ещё больший разрыв шаблона - мы навечно сохраняем IP правки, из-за которой его обладатель, например, в России может быть обвинён по любому из массы законов (экстремизм, распространение, призывы и т.д.) и тупо посажен за решётку. Но при этом мы стыдимся сохранить IP при чтении страницы.
Или с ником... вона НОВОРОССа (другие буквы) деанонимизировали недавно по характеру его правок и кросс-информации, вообще вчистую. Через пару часов не вставая с места теперь о нём можно узнать вообще всё. Хоть письма бумажные по адресу с благодарностями посылай, за всё то где он наследил и что сеть бережно сохранила. Ну и зачем этот цирк? Зачем этот обман пользователей?
Мы вообще первейшие враги анонимности и конфиденциальности, если уж на то пошло. В каком ещё месте с таким упорством идиота ставят препоны любым попыткам анонимизации, вместо того, чтобы придумать как с ними жить.
Google прав - ни о какой анонимности при регулярной работе в сети речи вестись не может. Если хочешь анонимности, ходи со специально заточенного для этого гаджета не из места своей основной локации и после использования уничтожай его. В любом другом случае получить всю информацию о пользователе дело лишь идей и времени.
Поэтому вместо обмана юзеров на счёт их анонимности, следовало бы менять политику конфиденциальности и общую политику (хотя бы по тем же открытым проксям). Хочешь быть анонимным - будь, но на нашей стороне это обеспечить невозможно. Мы и так навечно записываем и распространяем IP при каждой правке, ничему не противоречит быть последовательными и записывать IP при каждом посещении сохраняя это в дампе. Ну а для зарегистрированных пользователей можно выдавать ник, чего уж там. Или пойти по пути псевдоанонимного ID, что внешне будет выглядеть благопристойней, а для обывателя менее напряжно.
Вообще говоря, мы занимаемся свободным созданием и распространением знаний. Статистика посещений - это кладез информации, необходимой и в бизнес и научных целях. Её сбор и распространение запросто принесли бы человечеству пользы, проектам - ориентировок и оптимизации, а ВМ - дополнительного дохода. А мы с ней так безобразно обходимся.
А про количество/качество еще философы говорили :) https://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%BF%D0%B5%D1...
Поэтому совсем отрекаться от количественной нагонки просмотров при отсутствии прямого эффекта в донорах/участниках я не буду, авось что-то хорошее из этого выйдет - особых усилий от нас это не требует.
Позволь выдвинуть следующую гипотезу, что реклама в Google даёт в целом положительную отдачу заказчикам, иначе в конкурентной среде она бы просто перестала существовать. Т.е. вложив 100 рублей, её использователь должен получить назад как минимум 101 - т.е. какую-то "копеечку" чистого профита. Но мы не возвращаем даже 10% от вложенного, иначе это было бы заметно в отчётах. У нас практически 100% бумажный убыток.
Таким образом напрашивается вывод, что мы делаем что-то совершенно не то и требуются принципиальные изменения. Например, для меня стало откровением, когда узнал, что ты посылаешь пользователей не на форму, где они могут без лишних хлопот расстаться со своими кровными ради благих целей, а на какое-то бла-бла на вики ВМ РУ, и т.д.
Нам дали неслабый в нашем положении ресурс, а мы его целиком спускаем, по-другому результат оценить сложно.
Если сами не умеем, давай привлечём специалистов, хоть за половину с принесённого в результате этого дохода, но просто сидеть, ожидать чуда и смотреть на выбрасывание таких шайб нельзя.
саша.
Линар
17 августа 2014 г., 19:42 пользователь Alexander N Krassotkin krassotkin@gmail.com написал:
Доброе!
2014-08-17 17:39 GMT+04:00 rubin.happy rubin.happy@gmail.com: ...
PS: А реклама в поисковике Гугла дает нам львиную долю переходов на сайт...
Ну это ещё отсюда было понятно (давал на форуме): http://www.similarweb.com/website/ru.wikimedia.org
Только толку? Денег это не приносит, людей, желающих принять участие в деятельности тоже.
А статистика, конечно, да... даже в прошлом веке у всех лучше была, чем нам удётся выклянчить.
саша.
Линар
Wikimedia-RU mailing list Wikimedia-RU@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
Wikimedia-RU mailing list Wikimedia-RU@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru