Dlaczego mirror jest wyżej od Wikipedii

List overview All Threads
Download

newer

older

RE: [Wikipl-l] zgloszenie

Bramka irc - ponownie

Krzysztof P. Jasiutowicz

16 Nov 2004 16 Nov '04

3:22 p.m.

Witajcie,

Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?

Jest to zjawisko, które zauważyłem już kilka razy.

URL w jednej linii http://www.google.pl/search?num=30&hl=pl&inlang=pl&ie=ISO-8859-2... %22 Franciszek+Zab%B3ocki%22+1752&btnG=Szukaj&lr=lang_pl

Pozdrowienia, Kpjas.

Show replies by date

Ścibór Sobieski

16 Nov 16 Nov

8:38 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

Dnia 16-11-2004, wto o godzinie 16:22 +0100, Krzysztof P. Jasiutowicz napisał(a):

...

Witajcie,

Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?

Bo być może mirror coś odpala google za to, wyszła jakiś czas temu draka z tym związana.

Ścibór

Fallout

17 Nov 17 Nov

5:19 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

...

...
Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?

Bo być może mirror coś odpala google za to, wyszła jakiś czas temu draka z tym związana. Ścibór

Moze nie tyle odpala, ale po prostu mirror zamieszcza u siebie Google Ads, strony z ktorymi Google moze promowac.

-- Ausir

Marcin Sochacki

16 Nov 16 Nov

9:46 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

On Tue, Nov 16, 2004 at 04:22:49PM +0100, Krzysztof P. Jasiutowicz wrote:

...

Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?

Jest to zjawisko, które zauważyłem już kilka razy.

System punktacji Googla (PageRank) jest dość skomplikowany i (jak każdy system automatyczny) jest przewidywalny.

W tym wypadku i tak wyniki są bardzo zbliżone, jeden za drugim, co sugeruje że ich PageRank jest identyczny albo różni się niewiele, a o kolejności zadecydował los. Świadczy to też o tym, że algorytm Google nie wspiera w żaden sposób stron pochodzących z domeny wikipedia.org -- muszą one walczyć treścią tak jak inni. Są pewne tricki, którymi cwaniacy wprowadzają Googla w maliny i uzyskują wysokie pozycje (np. akcja "kretyn"). Na tym niestety zarabiają kopierzy Wikipedii. Wydaje mi się, że jeśli Fundacja nie ma w tym względzie przebicia do Googla (bo nie wierzę, że nie próbowali ich przekonać, aby algorytm preferował oryginalne linki z Wikipedii), to nasza siła przebicia jest żadna.

Co do Fanzinu, to nie wierzę w hipotezę przekupienia Googla (byliby wówczas na pierwszych miejscach, poza tym są na to za mali). Zastanawiam się jednak nad inną kwestią -- czy jest zgodne z licencją nazywanie kopii "Wikipedią", tak jak jest to na http://www.fanzine.pl/wikipedia/ ? Nagłówek i tytuł strony nie wskazują w żaden sposób, że jest to kopia Wikipedii, dopiero w tekście znajdujemy.

Wanted

Jarosław Witkowski

11:14 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

Dnia Tue, 16 Nov 2004 22:46:12 +0100 osoba przedstawiająca się jako Marcin Sochacki wanted@gnu.univ.gda.pl napisała:

...

Zastanawiam się jednak nad inną kwestią -- czy jest zgodne z licencją nazywanie kopii "Wikipedią", tak jak jest to na http://www.fanzine.pl/wikipedia/ ?

IMHO powinni wymyślić własną nazwę licencja GFDL dotyczy treści, a nie marki "Wikipedia".

Pozdrawiam, Jerry

-- Jarek Witkowski Linux user #136162 |/ http://www.jerry.prv.pl (') http://www.wikipedia.pl -- Wolna Encyklopedia jaw /( )o This posting is covered by PPL - http://ppl.7thGuard.net

Tomasz Wegrzanowski

10:13 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

On Tue, Nov 16, 2004 at 04:22:49PM +0100, Krzysztof P. Jasiutowicz wrote:

...

Witajcie,

Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?

* Nikt nie probowal na powaznie optymalizowac Wikipedii pod wzgledem wysokiego rankingu na wyszukiwarkach. To nie jest latwe, bo trzeba byc bardzo na czasie z tym co sie z wyszukiwarkami dzieje.

Ja nie jestem wystarczajaco na biezaco z wyszukiwarkami, ale kilka hintow: * Poniewaz Wikipedia ma czesto problemy, Googlebot czesto nie dokopuje sie do jakiegos artykulu Nastepna proba powiedzmy za miesiac. * Kazda strona ma duzo linkow, z czego wiele do stron ktorych Googlebotowi ogladac nie wolno (edycja, historia, 30 stron specjalnych etc.). Byc moze rozwadniaja one linki. * Na poczatku strony sa glupoty typu: ... Źródło: "http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artykuł; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da * Nie ma zadnych meta keywordsow ani niczego w tym stylu.

Adam Dziura

17 Nov 17 Nov

12:02 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

Dnia Tue, 16 Nov 2004 23:13:51 +0100, Tomasz Wegrzanowski taw@users.sf.net napisał:

...

Na poczatku strony sa glupoty typu: ... Źródło:

"http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artykuł; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da

Przecież jest na początku treść strony. Linki do źródło, edycji i kategorii są pod treścią.

...

Nie ma zadnych meta keywordsow ani niczego w tym stylu.

One już za wiele nie dają - google je często olewa. Ale na wikipedii są: <meta name="KEYWORDS" content="Austria,Bydgoszcz,Belgia,Bułgaria,Czechy,Cypr (państwo),Chrzest,Dania,Długość geograficzna,Estonia" /> To jest z http://pl.wikipedia.org/wiki/Polska

-- Pozdrowienia || Adam Dziura || http://www.mojaopera.idu.pl "W domu będzie ogień, a do domu proste drogi wiodą słusznie moje stopy. Nie zabraknie mi sił." Coma - "100 tysięcy jednakowych miast"

Tomasz Wegrzanowski

3:54 p.m.

New subject: Dlaczego mirror jest wy?ej od Wikipedii

On Wed, Nov 17, 2004 at 01:02:41PM +0100, Adam Dziura wrote:

...

Dnia Tue, 16 Nov 2004 23:13:51 +0100, Tomasz Wegrzanowski taw@users.sf.net napisa?:

...

Na poczatku strony sa glupoty typu: ... ?r?d?o:

"http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artyku?; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da

Przecie? jest na pocz?tku tre?? strony. Linki do ?r?d?o, edycji i kategorii s? pod tre?ci?.

Ja tylko wklejam co Google pokazuje. Nie jestem pewien dlaczego akurat to, ale widocznie nie jst to to co powinno byc.

...

...

Nie ma zadnych meta keywordsow ani niczego w tym stylu.

One ju? za wiele nie daj? - google je cz?sto olewa. Ale na wikipedii s?:

<meta name="KEYWORDS" content="Austria,Bydgoszcz,Belgia,Bu?garia,Czechy,Cypr (pa?stwo),Chrzest,Dania,D?ugo?? geograficzna,Estonia" /> To jest z http://pl.wikipedia.org/wiki/Polska

Nie sa to zbyt dobrze dobrane keywordsy imho.

Jak zreszta mowilem - nie jestem na tyle na biezaco z Googlem, zeby miec w miare pewnosc ze akurat to i tamto mu przeszkadza. Po prostu zgaduje, i ktos kto w tym bardziej siedzi powinien przeprowadzic analize na powaznie.

Tomasz Goździewicz

10:49 p.m.

New subject: Dlaczego mirror jest wy?ej od Wikipedii

On Wed, 17 Nov 2004 16:54:41 +0100, Tomasz Wegrzanowski taw@users.sf.net wrote:

...

Nie sa to zbyt dobrze dobrane keywordsy imho.

Wydaje mi się, że jako keywords oprogramowanie wiki "podstawia" słowa, które są wikilinkami do innych haseł. Czyli trzeba uważnie wybierać, do czego się linkuje.

-- [[Wikipedysta:Goto]]

PiotrB.

1:01 p.m.

New subject: Dlaczego mirror jest wyżej od Wikipedii

Dnia 16 listopada 2004, Tomasz w 20041116221351.GB986@wroclaw.taw.pl.eu.org napisał:

...

...
Pytanie do osób znajšcych szczegóły rankingu Google dlaczego w Google'u Piszšc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?

...

Nikt nie probowal na powaznie optymalizowac Wikipedii pod

wzgledem wysokiego rankingu na wyszukiwarkach. To nie jest latwe, bo trzeba byc bardzo na czasie z tym co sie z wyszukiwarkami dzieje.

Chyba próbował, domyśla skórka ("monobook" ta którą zapewne dostaje robot google) wygląda na dobrze zoptymalizowaną. Bo chyba nie masz na myśli stosowania oszustw typu wielokrotne powtarzanie słów kluczowych w każdym title. to byłoby poniżej godności wikipedii.

...

Ja nie jestem wystarczajaco na biezaco z wyszukiwarkami, ale kilka hintow:

Poniewaz Wikipedia ma czesto problemy, Googlebot czesto nie

dokopuje sie do jakiegos artykulu Nastepna proba powiedzmy za miesiac.

Kazda strona ma duzo linkow, z czego wiele do stron ktorych

Googlebotowi ogladac nie wolno (edycja, historia, 30 stron specjalnych etc.). Byc moze rozwadniaja one linki.

przecież mirrory typu fanzine tez mają takie linki a poza tym w mirrorach zwykle jest wiele niesprawnych (404) linków co powinno działać na ich niekorzyść, zobacz: http://www.fanzine.pl/wikipedia/10_wrze%C5%9Bnia

nie mówiąc już o tym, że akurat ten mirror domyślnie ma skórkę "Cologne Blue", która teoretycznie jest zrobiona mniej poprawnie niż "MonoBook" (ale "niezbadane są wyroki Google" może ta skórka jednak bardziej mu pasuje?).

...

Na poczatku strony sa glupoty typu: ... Źródło:

"http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artykuł; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da

i tak jest. Być może oglądałeś którąś z alternatywnych skórek, w której jest inaczej ale dla Googla liczy się domyślna.

...

Nie ma zadnych meta keywordsow ani niczego w tym stylu.

są. nawet słowa kluczowe są dobrane do treści

Ale są też rzeczy które MZ powinny być poprawione. np. - spis treści zrobiony jest z tabelek i znaczników <div> a powinien być listą. - nagłówki <hx> często są nie po kolei, jakiś bot mógłby to poprawiać itp. ziarnko do ziarnka i zbierze się miarka

-- PiotrB.

mzopw

3:51 p.m.

New subject: Akcja 50 tys. hasel

Strona http://pl.wikipedia.org/wiki/Specjalna:Statistics sugeruje, że do podawanej ilości artykułów nie wlicza się stubów. Czy tak jest rzeczywiście ?

mzopw

PiotrB.

9:22 p.m.

New subject: Akcja 50 tys. hasel

Dnia 17 listopada 2004, mzopw w 419B736E.30601@neostrada.pl napisał:

...

Strona http://pl.wikipedia.org/wiki/Specjalna:Statistics sugeruje, że do podawanej ilości artykułów nie wlicza się stubów. Czy tak jest rzeczywiście ?

Z krótkiej analizy kodu mediawiki wynikałoby, że domyślnie artykuł jest liczony w statystyce wtedy gdy: 1. jest w głównej przestrzeni nazw (0) 2. nie jest przekierowaniem (nie spełnia wyrażenia regularnego /^#redirect/i) 3. nie ma w nim odnośnika wewnętrznego (a dokładniej ciągu "[[") lub przecinka (ale domyślnie odnośnika)

Odpowiada za to taka funkcja:

function isCountable( $text ) { global $wgUseCommaCount, $wgMwRedir;

if ( 0 != $this->mTitle->getNamespace() ) { return 0; } if ( $wgMwRedir->matchStart( $text ) ) { return 0; } $token = ($wgUseCommaCount ? ',' : '[[' ); if ( false === strstr( $text, $token ) ) { return 0; } return 1; }

Czyli, że domyślnie stuby takie jak np. [[Dynamiczny HTML]] zawierające choćby jeden link SĄ LICZONE. Robiłem też test i rzeczywiście artykuł o treści "Jakaś treść" nie jest liczony, lecz gdy zmienić treść na "Jakaś treść [[link]], przecinek" to już jest liczony.

Z tym, że ja analizowałem swoją kopię mediawiki, być może gdzieś w ustawieniach polskiej mediawiki jest jakiś dodatkowy kolejny warunek. Lub całkiem się pomyliłem z tą analizą.

BTW. Google twierdzi, że w pl.wikipedia.org jest 10800 stron zawierających "png To jest tylko zalążek artykułu".

http://www.google.com/search?num=100&hl=pl&as_qdr=all&q=%22png+T...

-- PiotrB.

7171

Age (days ago)

7172

Last active (days ago)

wikipl-l@lists.wikimedia.org

11 comments

10 participants

tags (0)

participants (10)

Adam Dziura
Fallout
Jarosław Witkowski
Krzysztof P. Jasiutowicz
Marcin Sochacki
mzopw
PiotrB.
Tomasz Goździewicz
Tomasz Wegrzanowski
Ścibór Sobieski