Линар
18.08.2014 12:54 пользователь "Alexander N Krassotkin"
<krassotkin(a)gmail.com> написал:
Доброе!
2014-08-17 19:53 GMT+04:00 rubin.happy <rubin.happy(a)gmail.com>om>:
По статистике я еще попробую что-нибудь сделать
(например, поговорить с
разработчиком stats.grok.se),
А что с грок? Просто внешний сервер, который парсит дамп WMF. Это
любой может делать. Вопрос же не к ним. Кстати сейчас модный другой:
http://tools.wmflabs.org/wikiviewstats/
просто значительная часть того, что нас
интересует, упирается в конфиденциальность читателей:
Это такая отмазка, не имеющая под собой оснований. Чтобы убедиться,
нужно выписать виды обычной групповой статистики и задать по каждому
пункту вопрос: Каким конкретно нашим условиям он противоречит и каким
образом.
Например, групповые отчёты по:
- количество хостов/идентифицированных посетивших страницу (а не
хитов, как всю дорогу демонстрируют)
- конкретный урл, с которого юзер зашёл на страниц (а не просто домен,
по которому найти урл где на нас стоит ссылка не составляет труда, но
это лишние танцы с бубнами)
- пути по сайту (точки входа, переходы, точки выхода)
- страны из которых заходили на проект
- браузеры которыми пользуются
... и т.д. просто берёшь гугль аналитик и по списку спрашиваешь...
Несколько раз в сеть попадали крупные дампы анализа статистики
больших сайтов. Они анонимизируют IP (куки, если есть) на первом этапе
- ставя ему в соответствие некий ID с общими параметрами (страна,
свойства браузера, например язык, и т.д). Далее же они хранят в базе
подробную инфу только по этому ID. Теоретически, имея доступ к базе
теоретически можно деанонимизировать ID, но речь идёт о групповых
отчётах, т.е. если ты смотришь количество ID, посетивших страницу,
деанонимизировать отдельный ID проблематично, аналогично, если
смотреть какие поисковые запросы и сколько ID их делало, также
вытащить кто это был в реальном мире крайне сложно.
Большую часть из этой информации можно выдавать в дампе
сгруппированных отчётов, но в идеале это нужно делать через
собственный интервейс, тогда больше всего можно отразить без опаски
раскрыть информацию о конкретных ID.
поэтому нам не дадут
информацию, откуда конкретно пришли на конкретную страницу читатели,
куда
они потом ушли,
зачем абстракции, нужно задавать конкретные вопросы по каждому
пункту - какому условию это противоречит и каким образом, а если не
противоречит, значит нужно делать
мне, например, непонятно, как конкретные урлы, с которых к нам
переходили (потому, что на них стоят прямые ссылки), как-то
противоречат нашим условиям...
если аккуратно анализировать, то получится, что в наших условиях нет
ничего, что бы противоречило созданию практически полнофункциональной
групповой статистики...
что-то аналитического характера о самих
пользователях, и
многое другое, что могло бы быть интересно.
Ладно, давай тогда в принципе.
То что можно сделать сейчас написал выше, а эта часть не для
практических действий - она запросто утонет в обсуждениях, но понимать
её нужно. Может в будущем что-то прорастёт.
Политика ВМ по конфиденциальности, как впрочем и подавляющего
большинства других проектов, - это обман пользователей и
предоставление им ложного чувства анонимности. Более того, ВМ -
первейший враг анонимности. Но дальше хуже - политика
"конфиденциальности" мало того, что является обманом и самообманом,
она противоречит нашим целям. Обосную.
Например, я утверждаю, что любой админ Википроекта путём нехитрых
манипуляций может получить всю информацию о пользователях и это
непрерывно делается, чаще всего случайно, практически не выявляемо, и
всем на это плевать.
Я сам однажды по запросу создал фичу, которую потом на голубом глазу
с благодарностью прикрутили без необходимой коррекции и только через
год сообразил, что могу через неё деанонимизировать вообще всех. Т.к.
мне эта информация не была нужна, я просто тихо поофигевал и забыл.
Через некоторое время её случайно "исправили", но не потому, что
поняли в чём прикол, а лишь в качестве "оптимизации". Сейчас той моей
возможности нет, но повторить её может каждый в любой момент.
Или вот ещё более наглядно AddThis и любое "поделись" не теряет ни
единого байта информации за всю свою историю и открыто этими данными
торгует, а у нас оно иногда вообще в теле страницы появляется. Но даже
если это лишь ссылка, о какой анонимизации можно говорить, если мы
сознательно подсовываем юзеру брешь в его безопасности на всех
страницах.
Или ещё больший разрыв шаблона - мы навечно сохраняем IP правки,
из-за которой его обладатель, например, в России может быть обвинён по
любому из массы законов (экстремизм, распространение, призывы и т.д.)
и тупо посажен за решётку. Но при этом мы стыдимся сохранить IP при
чтении страницы.
Или с ником... вона НОВОРОССа (другие буквы) деанонимизировали
недавно по характеру его правок и кросс-информации, вообще вчистую.
Через пару часов не вставая с места теперь о нём можно узнать вообще
всё. Хоть письма бумажные по адресу с благодарностями посылай, за всё
то где он наследил и что сеть бережно сохранила. Ну и зачем этот цирк?
Зачем этот обман пользователей?
Мы вообще первейшие враги анонимности и конфиденциальности, если уж
на то пошло. В каком ещё месте с таким упорством идиота ставят препоны
любым попыткам анонимизации, вместо того, чтобы придумать как с ними
жить.
Google прав - ни о какой анонимности при регулярной работе в сети
речи вестись не может. Если хочешь анонимности, ходи со специально
заточенного для этого гаджета не из места своей основной локации и
после использования уничтожай его. В любом другом случае получить всю
информацию о пользователе дело лишь идей и времени.
Поэтому вместо обмана юзеров на счёт их анонимности, следовало бы
менять политику конфиденциальности и общую политику (хотя бы по тем же
открытым проксям). Хочешь быть анонимным - будь, но на нашей стороне
это обеспечить невозможно. Мы и так навечно записываем и
распространяем IP при каждой правке, ничему не противоречит быть
последовательными и записывать IP при каждом посещении сохраняя это в
дампе. Ну а для зарегистрированных пользователей можно выдавать ник,
чего уж там. Или пойти по пути псевдоанонимного ID, что внешне будет
выглядеть благопристойней, а для обывателя менее напряжно.
Вообще говоря, мы занимаемся свободным созданием и распространением
знаний. Статистика посещений - это кладез информации, необходимой и в
бизнес и научных целях. Её сбор и распространение запросто принесли бы
человечеству пользы, проектам - ориентировок и оптимизации, а ВМ -
дополнительного дохода. А мы с ней так безобразно обходимся.
А про количество/качество еще философы говорили :)
https://ru.wikipedia.org/wiki/Закон_перехода_количественных_изменений_в_кач…
Поэтому совсем отрекаться от количественной нагонки просмотров при
отсутствии прямого эффекта в донорах/участниках я не буду, авось что-то
хорошее из этого выйдет - особых усилий от нас это не требует.
Позволь выдвинуть следующую гипотезу, что реклама в Google даёт в
целом положительную отдачу заказчикам, иначе в конкурентной среде она
бы просто перестала существовать.
Т.е. вложив 100 рублей, её использователь должен получить назад как
минимум 101 - т.е. какую-то "копеечку" чистого профита.
Но мы не возвращаем даже 10% от вложенного, иначе это было бы
заметно в отчётах. У нас практически 100% бумажный убыток.
Таким образом напрашивается вывод, что мы делаем что-то совершенно
не то и требуются принципиальные изменения.
Например, для меня стало откровением, когда узнал, что ты посылаешь
пользователей не на форму, где они могут без лишних хлопот расстаться
со своими кровными ради благих целей, а на какое-то бла-бла на вики ВМ
РУ, и т.д.
Нам дали неслабый в нашем положении ресурс, а мы его целиком
спускаем, по-другому результат оценить сложно.
Если сами не умеем, давай привлечём специалистов, хоть за половину с
принесённого в результате этого дохода, но просто сидеть, ожидать чуда
и смотреть на выбрасывание таких шайб нельзя.
саша.
Линар
17 августа 2014 г., 19:42 пользователь Alexander N Krassotkin
<krassotkin(a)gmail.com> написал:
Доброе!
2014-08-17 17:39 GMT+04:00 rubin.happy <rubin.happy(a)gmail.com>om>:
...
> PS: А реклама в поисковике Гугла дает нам львиную долю переходов на
> сайт...
Ну это ещё отсюда было понятно (давал на форуме):
http://www.similarweb.com/website/ru.wikimedia.org
Только толку? Денег это не приносит, людей, желающих принять участие
в деятельности тоже.
А статистика, конечно, да... даже в прошлом веке у всех лучше была,
чем нам удётся выклянчить.
саша.
>
> Линар
_______________________________________________
Wikimedia-RU mailing list
Wikimedia-RU(a)lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
_______________________________________________
Wikimedia-RU mailing list
Wikimedia-RU(a)lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
_______________________________________________
Wikimedia-RU mailing list
Wikimedia-RU(a)lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
_______________________________________________
Wikimedia-RU mailing list
Wikimedia-RU(a)lists.wikimedia.org