Witajcie,
Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?
Jest to zjawisko, które zauważyłem już kilka razy.
URL w jednej linii http://www.google.pl/search?num=30&hl=pl&inlang=pl&ie=ISO-8859-2... %22 Franciszek+Zab%B3ocki%22+1752&btnG=Szukaj&lr=lang_pl
Pozdrowienia, Kpjas.
Dnia 16-11-2004, wto o godzinie 16:22 +0100, Krzysztof P. Jasiutowicz napisał(a):
Witajcie,
Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?
Bo być może mirror coś odpala google za to, wyszła jakiś czas temu draka z tym związana.
Ścibór
Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?
Bo być może mirror coś odpala google za to, wyszła jakiś czas temu draka z tym związana. Ścibór
Moze nie tyle odpala, ale po prostu mirror zamieszcza u siebie Google Ads, strony z ktorymi Google moze promowac.
On Tue, Nov 16, 2004 at 04:22:49PM +0100, Krzysztof P. Jasiutowicz wrote:
Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?
Jest to zjawisko, które zauważyłem już kilka razy.
System punktacji Googla (PageRank) jest dość skomplikowany i (jak każdy system automatyczny) jest przewidywalny.
W tym wypadku i tak wyniki są bardzo zbliżone, jeden za drugim, co sugeruje że ich PageRank jest identyczny albo różni się niewiele, a o kolejności zadecydował los. Świadczy to też o tym, że algorytm Google nie wspiera w żaden sposób stron pochodzących z domeny wikipedia.org -- muszą one walczyć treścią tak jak inni. Są pewne tricki, którymi cwaniacy wprowadzają Googla w maliny i uzyskują wysokie pozycje (np. akcja "kretyn"). Na tym niestety zarabiają kopierzy Wikipedii. Wydaje mi się, że jeśli Fundacja nie ma w tym względzie przebicia do Googla (bo nie wierzę, że nie próbowali ich przekonać, aby algorytm preferował oryginalne linki z Wikipedii), to nasza siła przebicia jest żadna.
Co do Fanzinu, to nie wierzę w hipotezę przekupienia Googla (byliby wówczas na pierwszych miejscach, poza tym są na to za mali). Zastanawiam się jednak nad inną kwestią -- czy jest zgodne z licencją nazywanie kopii "Wikipedią", tak jak jest to na http://www.fanzine.pl/wikipedia/ ? Nagłówek i tytuł strony nie wskazują w żaden sposób, że jest to kopia Wikipedii, dopiero w tekście znajdujemy.
Wanted
Dnia Tue, 16 Nov 2004 22:46:12 +0100 osoba przedstawiająca się jako Marcin Sochacki wanted@gnu.univ.gda.pl napisała:
Zastanawiam się jednak nad inną kwestią -- czy jest zgodne z licencją nazywanie kopii "Wikipedią", tak jak jest to na http://www.fanzine.pl/wikipedia/ ?
IMHO powinni wymyślić własną nazwę licencja GFDL dotyczy treści, a nie marki "Wikipedia".
Pozdrawiam, Jerry
On Tue, Nov 16, 2004 at 04:22:49PM +0100, Krzysztof P. Jasiutowicz wrote:
Witajcie,
Pytanie do osób znających szczegóły rankingu Google dlaczego w Google'u Pisząc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?
* Nikt nie probowal na powaznie optymalizowac Wikipedii pod wzgledem wysokiego rankingu na wyszukiwarkach. To nie jest latwe, bo trzeba byc bardzo na czasie z tym co sie z wyszukiwarkami dzieje.
Ja nie jestem wystarczajaco na biezaco z wyszukiwarkami, ale kilka hintow: * Poniewaz Wikipedia ma czesto problemy, Googlebot czesto nie dokopuje sie do jakiegos artykulu Nastepna proba powiedzmy za miesiac. * Kazda strona ma duzo linkow, z czego wiele do stron ktorych Googlebotowi ogladac nie wolno (edycja, historia, 30 stron specjalnych etc.). Byc moze rozwadniaja one linki. * Na poczatku strony sa glupoty typu: ... Źródło: "http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artykuł; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da * Nie ma zadnych meta keywordsow ani niczego w tym stylu.
Dnia Tue, 16 Nov 2004 23:13:51 +0100, Tomasz Wegrzanowski taw@users.sf.net napisał:
- Na poczatku strony sa glupoty typu: ... Źródło:
"http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artykuł; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da
Przecież jest na początku treść strony. Linki do źródło, edycji i kategorii są pod treścią.
- Nie ma zadnych meta keywordsow ani niczego w tym stylu.
One już za wiele nie dają - google je często olewa. Ale na wikipedii są: <meta name="KEYWORDS" content="Austria,Bydgoszcz,Belgia,Bułgaria,Czechy,Cypr (państwo),Chrzest,Dania,Długość geograficzna,Estonia" /> To jest z http://pl.wikipedia.org/wiki/Polska
On Wed, Nov 17, 2004 at 01:02:41PM +0100, Adam Dziura wrote:
Dnia Tue, 16 Nov 2004 23:13:51 +0100, Tomasz Wegrzanowski taw@users.sf.net napisa?:
- Na poczatku strony sa glupoty typu: ... ?r?d?o:
"http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artyku?; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da
Przecie? jest na pocz?tku tre?? strony. Linki do ?r?d?o, edycji i kategorii s? pod tre?ci?.
Ja tylko wklejam co Google pokazuje. Nie jestem pewien dlaczego akurat to, ale widocznie nie jst to to co powinno byc.
- Nie ma zadnych meta keywordsow ani niczego w tym stylu.
One ju? za wiele nie daj? - google je cz?sto olewa. Ale na wikipedii s?:
<meta name="KEYWORDS" content="Austria,Bydgoszcz,Belgia,Bu?garia,Czechy,Cypr (pa?stwo),Chrzest,Dania,D?ugo?? geograficzna,Estonia" /> To jest z http://pl.wikipedia.org/wiki/Polska
Nie sa to zbyt dobrze dobrane keywordsy imho.
Jak zreszta mowilem - nie jestem na tyle na biezaco z Googlem, zeby miec w miare pewnosc ze akurat to i tamto mu przeszkadza. Po prostu zgaduje, i ktos kto w tym bardziej siedzi powinien przeprowadzic analize na powaznie.
On Wed, 17 Nov 2004 16:54:41 +0100, Tomasz Wegrzanowski taw@users.sf.net wrote:
Nie sa to zbyt dobrze dobrane keywordsy imho.
Wydaje mi się, że jako keywords oprogramowanie wiki "podstawia" słowa, które są wikilinkami do innych haseł. Czyli trzeba uważnie wybierać, do czego się linkuje.
Dnia 16 listopada 2004, Tomasz w 20041116221351.GB986@wroclaw.taw.pl.eu.org napisał:
Pytanie do osób znajšcych szczegóły rankingu Google dlaczego w Google'u Piszšc frazę ("Franciszek Zabłocki" 1752) Wikipedia jest niżej niż niedawno powstały mirror ?
- Nikt nie probowal na powaznie optymalizowac Wikipedii pod
wzgledem wysokiego rankingu na wyszukiwarkach. To nie jest latwe, bo trzeba byc bardzo na czasie z tym co sie z wyszukiwarkami dzieje.
Chyba próbował, domyśla skórka ("monobook" ta którą zapewne dostaje robot google) wygląda na dobrze zoptymalizowaną. Bo chyba nie masz na myśli stosowania oszustw typu wielokrotne powtarzanie słów kluczowych w każdym title. to byłoby poniżej godności wikipedii.
Ja nie jestem wystarczajaco na biezaco z wyszukiwarkami, ale kilka hintow:
- Poniewaz Wikipedia ma czesto problemy, Googlebot czesto nie
dokopuje sie do jakiegos artykulu Nastepna proba powiedzmy za miesiac.
- Kazda strona ma duzo linkow, z czego wiele do stron ktorych
Googlebotowi ogladac nie wolno (edycja, historia, 30 stron specjalnych etc.). Byc moze rozwadniaja one linki.
przecież mirrory typu fanzine tez mają takie linki a poza tym w mirrorach zwykle jest wiele niesprawnych (404) linków co powinno działać na ich niekorzyść, zobacz: http://www.fanzine.pl/wikipedia/10_wrze%C5%9Bnia
nie mówiąc już o tym, że akurat ten mirror domyślnie ma skórkę "Cologne Blue", która teoretycznie jest zrobiona mniej poprawnie niż "MonoBook" (ale "niezbadane są wyroki Google" może ta skórka jednak bardziej mu pasuje?).
- Na poczatku strony sa glupoty typu: ... Źródło:
"http://pl.wikipedia.org/wiki/Legnica". Kategorie stron: Miasta Polski. Views. artykuł; dyskusja; edytuj; historia. osobiste. Logowanie. nawigacja. Oczywiscie ze na poczatku powinna byc strona, a to powinno byc schowane tak gleboko jak sie da
i tak jest. Być może oglądałeś którąś z alternatywnych skórek, w której jest inaczej ale dla Googla liczy się domyślna.
- Nie ma zadnych meta keywordsow ani niczego w tym stylu.
są. nawet słowa kluczowe są dobrane do treści
Ale są też rzeczy które MZ powinny być poprawione. np. - spis treści zrobiony jest z tabelek i znaczników <div> a powinien być listą. - nagłówki <hx> często są nie po kolei, jakiś bot mógłby to poprawiać itp. ziarnko do ziarnka i zbierze się miarka
Strona http://pl.wikipedia.org/wiki/Specjalna:Statistics sugeruje, że do podawanej ilości artykułów nie wlicza się stubów. Czy tak jest rzeczywiście ?
mzopw
Dnia 17 listopada 2004, mzopw w 419B736E.30601@neostrada.pl napisał:
Strona http://pl.wikipedia.org/wiki/Specjalna:Statistics sugeruje, że do podawanej ilości artykułów nie wlicza się stubów. Czy tak jest rzeczywiście ?
Z krótkiej analizy kodu mediawiki wynikałoby, że domyślnie artykuł jest liczony w statystyce wtedy gdy: 1. jest w głównej przestrzeni nazw (0) 2. nie jest przekierowaniem (nie spełnia wyrażenia regularnego /^#redirect/i) 3. nie ma w nim odnośnika wewnętrznego (a dokładniej ciągu "[[") lub przecinka (ale domyślnie odnośnika)
Odpowiada za to taka funkcja:
function isCountable( $text ) { global $wgUseCommaCount, $wgMwRedir;
if ( 0 != $this->mTitle->getNamespace() ) { return 0; } if ( $wgMwRedir->matchStart( $text ) ) { return 0; } $token = ($wgUseCommaCount ? ',' : '[[' ); if ( false === strstr( $text, $token ) ) { return 0; } return 1; }
Czyli, że domyślnie stuby takie jak np. [[Dynamiczny HTML]] zawierające choćby jeden link SĄ LICZONE. Robiłem też test i rzeczywiście artykuł o treści "Jakaś treść" nie jest liczony, lecz gdy zmienić treść na "Jakaś treść [[link]], przecinek" to już jest liczony.
Z tym, że ja analizowałem swoją kopię mediawiki, być może gdzieś w ustawieniach polskiej mediawiki jest jakiś dodatkowy kolejny warunek. Lub całkiem się pomyliłem z tą analizą.
BTW. Google twierdzi, że w pl.wikipedia.org jest 10800 stron zawierających "png To jest tylko zalążek artykułu".
http://www.google.com/search?num=100&hl=pl&as_qdr=all&q=%22png+T...