Добрый день, коллеги.
Я к вам за советом.
1. Есть "Бизнес-журнал", у которого есть постоянно расширяющийся индекс компаний -- http://b-mag.ru/index/. Сейчас проиндексировано всего два-три номера, но с сегодняшнего дня мы быстро двинемся вглубь. При нажатии на какую-то компанию, получаем все статьи, где она в нашем журнале упоминается. Вот, например, Газпром -- http://b-mag.ru/tag/gazprom/
2. Есть сервис по распространению пресс-релизов B2blogger.com, у которого индекса пока нет, но он в стадии создания. А вот пресс-релизы Газпрома, там опубликованные, -- http://b2blogger.com/search/?cx=014251760463203048983%3Avcwb8zhpk8q&ie=U...
3. Мы (Бизнес-журнал и B2blogger.com) договорились о том, что с нашей страницы Газпрома мы даем ссылку их страницу Газпрома. При этом любой из нас может дать еще и ссылки на статью про Газпром в Википедии т.д.
4. Однако с случае с одним только Газпромом кросс-ссылки легко сделать вручную. Если речь идет о сотнях компаний, то нужен механизм автоматизации процесса. В качестве такого механизма мы решили попробовать использовать Викиданные. Страница Газпрома в Викиданных -- https://www.wikidata.org/wiki/Q102673. Мне достаточно включить в урл сборной страницы про Газапром его уникальный идентификатор в Викиданных (Q102673), дальше могут уже работать боты.
Теперь вопросы:
1) Есть ли у затеи какие-то подводные камни на стороне Викиданных? Может ли меня кто-то отговорить от такой затеи?
2) Есть ли в Викиданных запрет на создание страниц про компании, о которых нет статей ни в одном из языковых разделов? Дело в том, что и в БЖ, и в B2blogger.com очень много компаний, о которых нет статей в Википедии. Это значит, что я должен зайти в Викиданные и создать там страницу, например, про компанию "Коптер-Экспресс" (http://b-mag.ru/tag/kopter-ekspress/), о которой, конечно, пока не написали в Википедии, хотя о ней написали уже пять-шесть вполне авторитетных изданий. Не снесут ли такую страницу из Викиданных?
3) На странице описания компании есть поле "Other sites". Такое ощущение, что это поле как раз и создано для таких случае, которые я описываю. То есть я могу записать туда ссылку на страницу компании на сайте журнала? Или поле для других целей?
4) Может быть кто-то знает о подобном использовании Викиданных в сайтах на русском языке? Хорошо видно, что в Викиданных активно редактируются наименования на русском, татарском и башкирском языках. А значит этим же кто-то персонально занимается... Познакомьте, пожалуйста.
Заранее спасибо за помощь.
Юрий Калашнов
Отвечу сразу на пункт 3: поле «Other sites» в правой колонке – это, фактически, только для интервики-ссылок на Викисклад. Т.е. далеко не на любой сайт.
ПК
From: wikimedia-ru-bounces@lists.wikimedia.org [mailto:wikimedia-ru-bounces@lists.wikimedia.org] On Behalf Of Юрий Калашнов Sent: Monday, June 08, 2015 4:20 PM To: wikimedia-ru@lists.wikimedia.org Subject: [WM-RU] Обмен данными между сайтами через викиданные
Добрый день, коллеги.
Я к вам за советом.
1. Есть "Бизнес-журнал", у которого есть постоянно расширяющийся индекс компаний -- http://b-mag.ru/index/. Сейчас проиндексировано всего два-три номера, но с сегодняшнего дня мы быстро двинемся вглубь. При нажатии на какую-то компанию, получаем все статьи, где она в нашем журнале упоминается. Вот, например, Газпром -- http://b-mag.ru/tag/gazprom/
2. Есть сервис по распространению пресс-релизов B2blogger.com, у которого индекса пока нет, но он в стадии создания. А вот пресс-релизы Газпрома, там опубликованные, -- http://b2blogger.com/search/?cx=014251760463203048983%3Avcwb8zhpk8q http://b2blogger.com/search/?cx=014251760463203048983%3Avcwb8zhpk8q&ie=UTF8&cof=FORID%3A11&q=%D0%B3%D0%B0%D0%B7%D0%BF%D1%80%D0%BE%D0%BC&sa=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA &ie=UTF8&cof=FORID%3A11&q=%D0%B3%D0%B0%D0%B7%D0%BF%D1%80%D0%BE%D0%BC&sa=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA
3. Мы (Бизнес-журнал и B2blogger.com) договорились о том, что с нашей страницы Газпрома мы даем ссылку их страницу Газпрома. При этом любой из нас может дать еще и ссылки на статью про Газпром в Википедии т.д.
4. Однако с случае с одним только Газпромом кросс-ссылки легко сделать вручную. Если речь идет о сотнях компаний, то нужен механизм автоматизации процесса. В качестве такого механизма мы решили попробовать использовать Викиданные. Страница Газпрома в Викиданных -- https://www.wikidata.org/wiki/Q102673. Мне достаточно включить в урл сборной страницы про Газапром его уникальный идентификатор в Викиданных (Q102673), дальше могут уже работать боты.
Теперь вопросы:
1) Есть ли у затеи какие-то подводные камни на стороне Викиданных? Может ли меня кто-то отговорить от такой затеи?
2) Есть ли в Викиданных запрет на создание страниц про компании, о которых нет статей ни в одном из языковых разделов? Дело в том, что и в БЖ, и в B2blogger.com очень много компаний, о которых нет статей в Википедии. Это значит, что я должен зайти в Викиданные и создать там страницу, например, про компанию "Коптер-Экспресс" (http://b-mag.ru/tag/kopter-ekspress/), о которой, конечно, пока не написали в Википедии, хотя о ней написали уже пять-шесть вполне авторитетных изданий. Не снесут ли такую страницу из Викиданных?
3) На странице описания компании есть поле "Other sites". Такое ощущение, что это поле как раз и создано для таких случае, которые я описываю. То есть я могу записать туда ссылку на страницу компании на сайте журнала? Или поле для других целей?
4) Может быть кто-то знает о подобном использовании Викиданных в сайтах на русском языке? Хорошо видно, что в Викиданных активно редактируются наименования на русском, татарском и башкирском языках. А значит этим же кто-то персонально занимается... Познакомьте, пожалуйста.
Заранее спасибо за помощь.
Юрий Калашнов
- Есть ли у затеи какие-то подводные камни на стороне Викиданных? Может
ли меня кто-то отговорить от такой затеи?
Компания может оказаться незначимой по меркам Викиданных. Поэтому крайне рекомендую, чтобы связка сайт-Викиданные была необязательной. Собственно, проблема может возникнуть в части того, что вы не сможете связать через ВД полностью все элементы, только часть. В остальном подводных камней быть не должно.
- Есть ли в Викиданных запрет на создание страниц про компании, о которых
нет статей ни в одном из языковых разделов? Дело в том, что и в БЖ, и в B2blogger.com очень много компаний, о которых нет статей в Википедии. Это значит, что я должен зайти в Викиданные и создать там страницу, например, про компанию "Коптер-Экспресс" (http://b-mag.ru/tag/kopter-ekspress/), о которой, конечно, пока не написали в Википедии, хотя о ней написали уже пять-шесть вполне авторитетных изданий. Не снесут ли такую страницу из Викиданных?
Скорее есть, чем нет. Смысл такой, что самой статьи в ВП может и не существовать, но на элемент должна быть ссылка из другого элемента, про который статья существует. Критерии значимости тут: https://www.wikidata.org/wiki/Wikidata:Notability/ru
3) На странице описания компании есть поле "Other sites". Такое ощущение,
что это поле как раз и создано для таких случае, которые я описываю. То есть я могу записать туда ссылку на страницу компании на сайте журнала? Или поле для других целей?
Как уже сказал Павел, это интервики-ссылки. Список доступных сайтов наверняка будет расширяться, но это точно не ваш случай. Если у вас будет большая база, которую можно будет считать авторитетной, то можно будет добавить свойство «ID на сайте БЖ» и ссылаться в обратную сторону, но пока до этого далеко. Пока возможный вариант использовать свойство «описывается в источниках», но для ботов это, прямо скажем, довольно неудобный вариант. К тому же для больших компаний может оказаться, что там и так уже десятки АИ, и не факт, что в таких случаях небольшие источники не будут вычищаться.
4) Может быть кто-то знает о подобном использовании Викиданных в сайтах на
русском языке? Хорошо видно, что в Викиданных активно редактируются наименования на русском, татарском и башкирском языках. А значит этим же кто-то персонально занимается... Познакомьте, пожалуйста.
Мы сейчас пробуем провернуть что-то подобное вместе с Декларатор.org. Там с одной стороны ситуация чуть проще — уже сразу есть свойство, но с другой много сил ушло на сопоставление базы. В ближайшее время зальём и дальше посмотрим, насколько хорошо получится использовать информацию из Викиданных.
Доброе!
2015-06-08 17:33 GMT+03:00 Sergey Leschina mail@putnik.ws: ...
- Есть ли в Викиданных запрет на создание страниц про компании, о которых
нет статей ни в одном из языковых разделов? Дело в том, что и в БЖ, и в B2blogger.com очень много компаний, о которых нет статей в Википедии. Это значит, что я должен зайти в Викиданные и создать там страницу, например, про компанию "Коптер-Экспресс" (http://b-mag.ru/tag/kopter-ekspress/), о которой, конечно, пока не написали в Википедии, хотя о ней написали уже пять-шесть вполне авторитетных изданий. Не снесут ли такую страницу из Викиданных?
Скорее есть, чем нет. Смысл такой, что самой статьи в ВП может и не существовать, но на элемент должна быть ссылка из другого элемента, про который статья существует. Критерии значимости тут: https://www.wikidata.org/wiki/Wikidata:Notability/ru
Добавлю, что речь идёт о любых вики-проектах (за исключением категорий Викисклада). Например, в ВН допустимо создавать категорию для хаба новостных заметок о любом имени собственном (человек, компания, нп, объект), которое упоминается в статье (как в других изданиях делается и вот в БЖ планируется). Т.е. достаточно написать новостную заметку (и чтобы её ещё и опубликовали), в которой это лицо упоминается и можно создавать категорию, ну и соответственно законно положенный ей элемент ВД потом создать. К нему потом и статья в ВП будет приклеиваться, если появится. Роботом это конечно не делается, но если где-то будут дыры о чём-то явно того заслуживающем, то почему бы нет, 15 минут делов руками при наличии инфоповода.
саша.
- На странице описания компании есть поле "Other sites". Такое ощущение,
что это поле как раз и создано для таких случае, которые я описываю. То есть я могу записать туда ссылку на страницу компании на сайте журнала? Или поле для других целей?
Как уже сказал Павел, это интервики-ссылки. Список доступных сайтов наверняка будет расширяться, но это точно не ваш случай. Если у вас будет большая база, которую можно будет считать авторитетной, то можно будет добавить свойство «ID на сайте БЖ» и ссылаться в обратную сторону, но пока до этого далеко. Пока возможный вариант использовать свойство «описывается в источниках», но для ботов это, прямо скажем, довольно неудобный вариант. К тому же для больших компаний может оказаться, что там и так уже десятки АИ, и не факт, что в таких случаях небольшие источники не будут вычищаться.
- Может быть кто-то знает о подобном использовании Викиданных в сайтах на
русском языке? Хорошо видно, что в Викиданных активно редактируются наименования на русском, татарском и башкирском языках. А значит этим же кто-то персонально занимается... Познакомьте, пожалуйста.
Мы сейчас пробуем провернуть что-то подобное вместе с Декларатор.org. Там с одной стороны ситуация чуть проще — уже сразу есть свойство, но с другой много сил ушло на сопоставление базы. В ближайшее время зальём и дальше посмотрим, насколько хорошо получится использовать информацию из Викиданных.
-- Сергей Лещина
Wikimedia-RU mailing list Wikimedia-RU@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
Могут быть проблемы с разветвлённой структурой больших компаний. Когда вы будите считать компанию одним целом, несмотря на разные юридические лица, а в Викиданных будет описано несколько отдельных частей холдинга или исторических юрлиц. Или наоборот.
В подобных сложных случаях элементы Викиданных могут со временем объединяться, тогда вы можете потерять ссылку.
8 июня 2015 г., 16:19 пользователь Юрий Калашнов kalashnov@gmail.com написал:
Добрый день, коллеги.
Я к вам за советом.
- Есть "Бизнес-журнал", у которого есть постоянно расширяющийся индекс
компаний -- http://b-mag.ru/index/. Сейчас проиндексировано всего два-три номера, но с сегодняшнего дня мы быстро двинемся вглубь. При нажатии на какую-то компанию, получаем все статьи, где она в нашем журнале упоминается. Вот, например, Газпром -- http://b-mag.ru/tag/gazprom/
- Есть сервис по распространению пресс-релизов B2blogger.com, у которого
индекса пока нет, но он в стадии создания. А вот пресс-релизы Газпрома, там опубликованные, -- http://b2blogger.com/search/?cx=014251760463203048983%3Avcwb8zhpk8q&ie=U...
- Мы (Бизнес-журнал и B2blogger.com) договорились о том, что с нашей
страницы Газпрома мы даем ссылку их страницу Газпрома. При этом любой из нас может дать еще и ссылки на статью про Газпром в Википедии т.д.
- Однако с случае с одним только Газпромом кросс-ссылки легко сделать
вручную. Если речь идет о сотнях компаний, то нужен механизм автоматизации процесса. В качестве такого механизма мы решили попробовать использовать Викиданные. Страница Газпрома в Викиданных -- https://www.wikidata.org/wiki/Q102673. Мне достаточно включить в урл сборной страницы про Газапром его уникальный идентификатор в Викиданных (Q102673), дальше могут уже работать боты.
Теперь вопросы:
- Есть ли у затеи какие-то подводные камни на стороне Викиданных? Может
ли меня кто-то отговорить от такой затеи?
- Есть ли в Викиданных запрет на создание страниц про компании, о которых
нет статей ни в одном из языковых разделов? Дело в том, что и в БЖ, и в B2blogger.com очень много компаний, о которых нет статей в Википедии. Это значит, что я должен зайти в Викиданные и создать там страницу, например, про компанию "Коптер-Экспресс" (http://b-mag.ru/tag/kopter-ekspress/), о которой, конечно, пока не написали в Википедии, хотя о ней написали уже пять-шесть вполне авторитетных изданий. Не снесут ли такую страницу из Викиданных?
- На странице описания компании есть поле "Other sites". Такое ощущение,
что это поле как раз и создано для таких случае, которые я описываю. То есть я могу записать туда ссылку на страницу компании на сайте журнала? Или поле для других целей?
- Может быть кто-то знает о подобном использовании Викиданных в сайтах на
русском языке? Хорошо видно, что в Викиданных активно редактируются наименования на русском, татарском и башкирском языках. А значит этим же кто-то персонально занимается... Познакомьте, пожалуйста.
Заранее спасибо за помощь.
Юрий Калашнов
Wikimedia-RU mailing list Wikimedia-RU@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
Элементы сейчас объединяются с созданием перенаправлений (тут вам не OSM! :)), просто нужно их корректно обрабатывать. Ну, и для больших компаний скорее всего будет и элемент для холдинга, и элемент для каждой компании. К какой считаем более правильнее привязываться, к той и привязываемся.
8 июня 2015 г., 18:08 пользователь Александр Сигачёв < alexander.sigachov@gmail.com> написал:
Могут быть проблемы с разветвлённой структурой больших компаний. Когда вы будите считать компанию одним целом, несмотря на разные юридические лица, а в Викиданных будет описано несколько отдельных частей холдинга или исторических юрлиц. Или наоборот.
В подобных сложных случаях элементы Викиданных могут со временем объединяться, тогда вы можете потерять ссылку.
8 июня 2015 г., 16:19 пользователь Юрий Калашнов kalashnov@gmail.com написал:
Добрый день, коллеги.
Я к вам за советом.
- Есть "Бизнес-журнал", у которого есть постоянно расширяющийся индекс
компаний -- http://b-mag.ru/index/. Сейчас проиндексировано всего два-три номера, но с сегодняшнего дня мы быстро двинемся вглубь. При нажатии на какую-то компанию, получаем все статьи, где она в нашем журнале упоминается. Вот, например, Газпром -- http://b-mag.ru/tag/gazprom/
- Есть сервис по распространению пресс-релизов B2blogger.com, у которого
индекса пока нет, но он в стадии создания. А вот пресс-релизы Газпрома, там опубликованные, -- http://b2blogger.com/search/?cx=014251760463203048983%3Avcwb8zhpk8q&ie=U...
- Мы (Бизнес-журнал и B2blogger.com) договорились о том, что с нашей
страницы Газпрома мы даем ссылку их страницу Газпрома. При этом любой из нас может дать еще и ссылки на статью про Газпром в Википедии т.д.
- Однако с случае с одним только Газпромом кросс-ссылки легко сделать
вручную. Если речь идет о сотнях компаний, то нужен механизм автоматизации процесса. В качестве такого механизма мы решили попробовать использовать Викиданные. Страница Газпрома в Викиданных -- https://www.wikidata.org/wiki/Q102673. Мне достаточно включить в урл сборной страницы про Газапром его уникальный идентификатор в Викиданных (Q102673), дальше могут уже работать боты.
Теперь вопросы:
- Есть ли у затеи какие-то подводные камни на стороне Викиданных? Может
ли меня кто-то отговорить от такой затеи?
- Есть ли в Викиданных запрет на создание страниц про компании, о
которых нет статей ни в одном из языковых разделов? Дело в том, что и в БЖ, и в B2blogger.com очень много компаний, о которых нет статей в Википедии. Это значит, что я должен зайти в Викиданные и создать там страницу, например, про компанию "Коптер-Экспресс" ( http://b-mag.ru/tag/kopter-ekspress/), о которой, конечно, пока не написали в Википедии, хотя о ней написали уже пять-шесть вполне авторитетных изданий. Не снесут ли такую страницу из Викиданных?
- На странице описания компании есть поле "Other sites". Такое ощущение,
что это поле как раз и создано для таких случае, которые я описываю. То есть я могу записать туда ссылку на страницу компании на сайте журнала? Или поле для других целей?
- Может быть кто-то знает о подобном использовании Викиданных в сайтах
на русском языке? Хорошо видно, что в Викиданных активно редактируются наименования на русском, татарском и башкирском языках. А значит этим же кто-то персонально занимается... Познакомьте, пожалуйста.
Заранее спасибо за помощь.
Юрий Калашнов
Wikimedia-RU mailing list Wikimedia-RU@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
-- Александр Сигачёв
Wikimedia-RU mailing list Wikimedia-RU@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
wikimedia-ru@lists.wikimedia.org