Yuhůův weblog o webu

ve čtvrtek 24. června 2004

Nevěřím podílu javascriptu na Navrcholu

Už se budu opakovat. Navrcholu tvrdí, že 7% prohlížečů je bez podpory javascriptu. Podle mě je to blbost, 7 procent je moc. Moje odhady jsou kolem 1 až 2 % vypnutého javascriptu.

Nechal bych to být, ale dnes onu tiskovku s výsledky měření rozebírá na Lupě Martin Kopta v článku Podpora pro Flash, JavaScript a cookies. Jakmile už se něco píše na Lupě, tak tomu mají lidé tendenci věřit a za chvíli tady budeme mít neověřený mýtus, který zní:

Podpora JavaScriptu
ano 92,70 %
ne 7,30 %
Zdroj: Navrcholu.cz

Slabinou měření Navrcholu je, že neudává ani náznak metodiky, jakou se k té hodnotě došlo. Martin ovšem opakuje čísla o Javascriptu, aniž by je zpochybnil více než takto:

Pro ochranu soukromí a z bezpečnostních důvodů nabízejí prohlížeče také možnost odmítnout Javascript z jiné domény, než ze které pochází zobrazovaná stránka.

Možná to udělá nějaký rozdíl, ale jen nepodstatný. Rád bych argumentoval nějakými svými čísly, ale nemám podporu javascriptu nyní naměřenou. Ze svých minulých měření, která jsem dělal z jiných důvodů, nanejvýše vyplývá, že vypnutý nebo nepřístupný javascript má nula až tři procenta uživatelů, přičemž ovšem chyba měření může být veliká. Tyhle věci kolem nuly, to je ve statistice vždycky svízel.

Čísla spadlá z nebe

Vyhodnocování a měření uživatelského vybavení nebo chování je svým způsobem vědecká činnost. K tomu patří uvedení metodiky měření, nebo alespoň její náznak. Navrcholu dává na odiv jenom výsledky. Ono je to totiž mnohem jednodušší -- zveřejnění metodiky by zákonitě přineslo její mohutné zpochybnění. Tak už to chodí. Udělat například pořádné měření zastoupení javascriptu není totiž žádná sranda. Lepší je dělat machry a do světa bez rozmyslu vypustit nějaká čísla, která z toho náhodou vyšla.

A přece mohu o způsobu měření něco vytušit díky tomu, že znám kód Navrcholu (je veřejný). Jde o javascriptové vyskládání dlouhého řetězce, který se stane url-adresou obrázku, o který si skript požádá server (což se zaznamená do logu či databáze). Nutno připustit, že se jedná o velmi důvtipný skript, z něhož se lze lecčemu přiučit.

Samotné zastoupení javascriptu se na Navrcholu pravděpodobně měří tak, že se skriptem předává parametr jss=1. Prohlížeče, které neumějí javascript, by si měly interpretovat oblast <noscript></noscript> a stahovat tamní obrázek s parametrem jss=0.

Problémů je ale hned několik:

A chyby se zprůměrují

Proklikal jsem si první desítku žebříčku aktuálního dne na hlavní stránce Navrcholu.cz. Z první desítky měly hned dva weby chybně zapsaný kód. Stahují si obrázek pro vypnutý javascript (s parametrem jss=0) i v případě, že javascript funguje. Namátkou jsem takhle nalezl stránky HiFiShop.cz a TipCars.com (ten dokonce "neskriptový" obrázek skládá javascriptem). Autoři si prostě kódy přizpůsobují. Tady bych hledal největší chybu.

Jinak řečeno: to číslo 92,70% je náhodná cifra, která naprosto nic nevyjadřuje. Rozhodně ne globální podporu javascriptu.

Zaráží mě ještě jiné věci. Například nemůžu v tiskovce najít, jestli ta naměřená procenta podpory flashe platí pro všechny prohlížeče, nebo jenom pro ty, co podporují javascript. Zastoupení verzí flashe se totiž jistě měří tím javascriptem. Totéž u cookies (naměřeno 98,44%, pravděpodobně též javascriptem). Ačkoli kód měří též podporu Javy (nebo přesněji navigator.javaEnabled()), v tiskovce se neuvádí. Proč? Ach jo.

Nechápejte mě prosím špatně: toto není útok proti serveru Navrcholu. Pouze se snažím, aby nezlidověly pověry. Také vás prosím, moji milí čtenáři, abyste při vlastním posuzování situace vzali v úvahu, že sami jste uživatelé výjimeční. Chápu, že významná část z vás si javascript vypíná a používá více než jeden prohlížeč. V těchto globálních statistikách ale jde spíše o tu masu, která ani neví, co to je "prohlížeč" (to je přeci ten intérnet, ne?).

Svůj názor vyjádřil také Chose (rozebírá zejména cookies).

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

ve středu 23. června 2004

Blogovací nej-argument

Na Lupě vycházejí divné akademické články o blogování, ale diskutující Binární Ládin to rozseknul komentářem porovnávající blog a klasickou stránku:

Homepage už nebrat
Měl jsem stránku a nikdy jsem na ní neměl takovou návštěvnost a odezvu jako na blogu. Howg!

Dál není co řešit. Mohu také potvrdit, že v poměru náklady/návštěvnost vychází weblog jako velmi úspěšná publikační forma.

(Naprosto mimochodem se musím pochlubit, že se mi po dvou letech snažení konečně podařilo napsat trvalý odkaz vedoucí na jeden příspěvek, nikoliv na celou diskusi, ve tvaru http://www.lupa.cz/nazory.php3?c_id=3449&show.x=27&kk[82180].)

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

v neděli 20. června 2004

Fotbal: na tohle je flash

Napadlo mě, že asi nejenom Novinky.cz přinášejí flashové animace gólů z turnaje Euro 2004. Nakonec mě nejvíce zaujaly shockwave animace na BBC.

Diskuse, zda jsou flash či podobné technologie na webu dobré, jsou pravděpodobně nekonečné. V některých oblastech má ale flash jistě své místo -- v reklamě, v zábavě a v některých oblastech zpravodajství.

Flashový tým serveru Novinky.cz (respektive Sport.cz) opět výborně zamakal, a tak se můžete podívat na animace gólů z nynějšího fotbalového turnaje. Mě vrcholový sport normálně nebere, ale tohle se mi líbí. Ve flashi je i rozhraní k on-line přenosům, které zařizuje redakce Práva (pravděpodobně i s přípravou animací). Je na tom skvělé to, jak je to rychle připravené -- prakticky ještě během zápasu.

Konkurenční Idnes.cz připravil také nějaké flashové animace, ale letmým pohledem se mi je nepodařilo objevit. Odkaz jsem našel až z Lacova článku. Animace na Idnesu mi ale zdaleka nepřijdou tak hezké, je to moc rychlé a navíc si umím spustit jenom jeden gól (chybí mi tam tlačítko zpět).

Možná o mně víte, moji milí čtenáři, že mám slabost pro BBC. Nakonec jsem nejlepší světové animace našel právě tam (kupodivu bez protekce). Doporučuji navštívit stránku Virtual Replay. Pozor, chce to instalaci Shockwave 10 od Macromedia, chvilku to trvá, ale nakonec se vyplatí. Postavičky jsou sice trochu schematické, ale nejsou to žádné šachové figurky -- hráče rozpoznáte podle barvy vlasů nebo pleti. Když dostanou gól, dávají si ruce v bok. Můžete si přepínat pohledy kamer nebo zvolit pohled některého hráče (obzvláště doporučuji situace sledovat z hlediska brankářů). Mají tam tak den zpoždění, než to připraví.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

v sobotu 19. června 2004

AdSense už i ve Skandinávii

Google udělal další krok v rozvoji programu AdSense. Kromě rozšíření AdSense na speciální vyhledávací stránky se zvýšil výčet podporovaných jazyků. Informovalo o tom dnes hodně různých zpravodajských webů.

Lidé si hodně pletou AdWords a AdSense. AdWords je program, který umožňuje inzerentům zadávat si do Google reklamy, které se potom objevují v pravém sloupečku hledání. AdSense je pouhým doplňkem AdWords: zapojuje čtvrtou stranu -- majitele webových stránek. Majitel stránky se přihlásí do AdSense a na svou stránku si dá kód. Kód čtenáři vygeneruje reklamu podle obsahu prohlížené stránky tak, aby reklama s obsahem souvisela, říká se tomu "obsahové cílení" (content targeting). Zobrazované reklamy přitom pocházejí právě ze systému AdWords. Pokud uživatel klikne na stránce na reklamu, inzerent získává návštěvníka a platí za proklik Googlu. Google část zisku přeposílá majiteli stránky, na které došlo ke kliknutí (je to tedy PPC systém = Pay Per Click = platba za proklik). Všichni jsou spokojení.

Jinak řečeno, AdSense je způsob, jak si majitel stránky může vydělat za reklamu skutečné peníze (ne jenom nějaké nelikvidní kredity) bez toho, aby si stránky zaneřádil různým blikacím svinstvem, a bez toho, aby každou chvíli lezl mediálkám do zadku nebo aby se s nimi hádal o javascriptu. Stačí mít dobré stránky se zajímavou návštěvností. Zisk z Google AdSense sice obvykle není žádné super terno, ale co tak různě čtu, stačí to na pokrytí nákladů a ještě zbude na večeři.

Pro majitele českých stránek je problém v tom, že AdSense se nedá používat na česky psaných stránkách. Já doufám, že to je jenom zatím. Dokud je v systému AdWords málo českých reklam, tak se prý ještě nevyplatí programovat nástroj na analýzu jazyka (to říká zástupce Google). Určitou nadějí pro mě ale je, že se nyní AdSense rozšiřují o čtyři další jazyky. Zatím fungovala jenom angličtina, holandština, francouzština, němčina, italština, japonština, portugalština a španělština. Od včerejška jede AdSense také v norštině, dánštině, švédštině a ve finštině.

AdSense ve hledání

Další novinkou, kterou jsem ale nemohl vyzkoušet (nejsem v AdSense), je nějaké nové prohledávání jen jednoho webu. Už dlouho existuje v Google program Free search, který každému umožňuje dát si na stránky formulář vedoucí na přebarvené výsledky hledání (psal jsem o tom ve článku o hledání a o Carambě). Na takovýchto "zdarma výsledcích" se objevovaly normálně v pravém sloupku reklamy AdWords, ze kterých šel zisk Googlu. Když si ale současní provozovatelé AdSense dají na stránku nějaký nový formulář, tak nejenom že si výsledky vyhledávání podle sebe obarví (plus logo atd.), ale také na takových stránkách budou reklamy, o jejichž výnos se Google s majitelem stránky podělí (podobně jako v obsahovém AdSense).

Související: AdWords 4/4 - platby a systém účtu, Česká kontextová reklama na Idnesu, Reklamní systémy vše na tomto webu.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

v pátek 18. června 2004

Do Google za 40 hodin

Robotovi Google trvá velmi krátký čas, než najde novou stránku. Pak ještě chvilku trvá, než se stránka objeví ve hledání, ale stejně je to hodně rychlé. Žádný jiný robot této rychlosti nedosahuje. Uvedu dva příklady z praxe.

V diskusích se velmi často objevuje dotaz, jak rychle vyhledávače (a zejména Google) stránku najde a zařadí. Obvykle se udává, že je to asi měsíc. Je fakt, že nevím, jak je to u málo odkazovaných stránek. Pokud ale na novou stránku vede dostatek zpětných odkazů, počítá se rychlost zařazení do indexu Google v hodinách. Rychlost nalezení příspěvků v blogu pak dokonce v minutách!

Ve středu 16. června jsem asi ve čtyři ráno publikoval novou stránku HTML tahák. Není to nic moc stránka, jenom takové kódy pro začátečníky, o to teď nejde. Odkazy jsem rozprostřel porůznu. Podle logu se v 8.17 ráno Googlebot stavil na hlavní stránce o html, kde asi našel odkaz na novou stránku. A už v 9.26 si vesele stahoval HTML tahák. Takže novou stránku znal Google za pět hodin. Naneštěstí jsem přesně nesledoval, kdy se objevil odkaz ve výsledcích hledání Google, každopádně ve čtvrtek 17. června kolem 18. hodiny už tam byl. To je 40 hodin od publikování stránky.

Je jasné, že kdyby robot na tu hlavní stránku o html, kde našel odkaz, nechodil každý den, asi by to bylo pomalejší. Ještě zběsilejší tempo nasazuje ale googlebot v případě příspěvků v blogu. Například předchozí příspěvek o hledání v knihách jsem publikoval včera (17. 6.) ve 20.40. Načež v logu stojí, že už ve 20.53 přicupital googlebot s označením Mediapartners-Google/2.1. Není mi moc jasné, kde na novou stránku během třinácti minut sehnal odkaz. Napadají mě jenom dva způsoby: přes toolbar Google nějakého návštěvníka (ale během těch třinácti minut u mě byly jenom samé Mozilly a Opery), nebo přes články na Jyxo (jyxo si stáhlo rss ve 20.40, chodí si pro něj každých 10 minut, googlebot jenom dvakrát denně). Nová stránka ovšem ani po devíti hodinách ještě není k nalezení (indexování je zřejmě pomalejší než stahování).

O podobné rychlosti si ostatní fulltexty mohou nechat jenom zdát. Zatímco ze stáje Jyxo najde po dvou dnech html tahák pouze Jyxo z Volny (a to pouze stránku obsahující odkaz), ostatní jyxa a morfeo netuší vůbec nic. Yahoo taky nic. Dva dny je pro ně málo.

Abych Google jenom nechválil: má teď jednu nepěknou aktualizační kaňku. Koncem dubna přestal aktualizovat údaje o PageRanku v Google Toolbaru. Novým i neznámým stránkám nyní ukazuje nulu, takže to vypadá, že v indexu vůbec nejsou, ačkoli jsou normálně k nalezení. Pár lidí kvůli tomu už propadá panice. Osobně se domnívám, že tato prodleva nějak souvisí s rozlousknutím šifrování údajů z toolbaru.

Dodatek: Podle přesnějšího sledování se nové stránky do Google mohou dostat už po 33 hodinách. Je ale patrné, že se tak pravděpodobně děje ve vlnách. Například tento příspěvek se objevil (nejpozději) po 33 hodinách, ale předchozí až po 43 hodinách -- oba příspěvky ale (zdá se) ve výsledcích ovšem naskočily najednou.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

ve čtvrtek 17. června 2004

Google se pustil do knih

V doméně print.google.com se vyskytuje 163 tisíc úryvků nebo ukázek z knih a časopisů. Tyto ukázky jsou Googlem indexovány a hodnoceny jako normální stránky a pokud obsahují hledaný text, objevují se ve výsledcích hledání. Už se to ví asi půl roku, ale teprve teď to začíná být zajímavé.

Příklady úryvků: kniha od Václava Havla, článek o nějaké české architektuře.

Google se těmito úryvky a anotacemi podle mého názoru snaží proniknout do oblasti vyhledávání v knihách, jakou před časem představil Amazon (více o tom na Sově v síti). Články jsou přebírány od jiných zpravodajských serverů; zdá se mi, že převážně od variety.com.

Mechanismus vkládání informací o knihách mi uniká, Google na tom asi s někým spolupracuje. Samotná kořenová stránka domény print.google.com je toho času prázdná. Google sám uvádí, že služba Print je v beta verzi a že je v současnosti naprosto nezisková.

První česká informace o print.google.com se nachází na blogu CubSEO.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

ve středu 16. června 2004

Rozmarná glosa

Tento článek je o ničem. Mám tak prostě chuť něco psát.

Zrovna si čtu Lupu. Dlouho jsem tam nebyl. Nechávám si posílat z Lupy info mailem, a tak mi pravidelně chodí upozornění na články, které jsem četl před týdnem. Príma služba, nikdy jsem to nepochopil. Tentokrát jsem tam šel hledat tiskovku Navrcholu, ale nenašel jsem.

Nekonečný seriál o blogování

Místo toho jsem tam našel další půvabný článek o blozích od Pavla Housera, který nestojí za zalinkování. Všichni už přes rok víme, že blogování je svým způsobem pouze módní slovo pro osobní publicistiku, stále se ale najdou někteří, kdo to nechápou nebo to alespoň omílají dokola. Ale v komentářích pod článkem se dá najít výborná definice toho, co znamená zásadní osobnost českého internetu. Nevíte? Tak prosím je to opak od kyselidní osobnosti českého internetu.

Zlaté stránky a Seznam

Pak jsem měl už rozepsaný příspěvek o Zlatých stánkách a o Seznamu, jak o tom pojednává jiný článek Mirka Zemana. Jenomže jsem si nevšimnul, že Zlaté stránky od minula trochu předělaly svůj web, a tak to není taková katastrofa, jak to vždycky bývalo. Teda je to i tak děsné, ale rozhodně bych už musel pečlivě hledat, co bych na webu zlatestranky.cz objektivně pomluvil. Není ovšem sporu o tom, že vlak už jim ujel.

On třeba Seznam.cz asi nemá v katalogu úplně všechny firmy, co tam mají Zlaté stránky. Ale tím tempem, co Seznam jede, je tam bude mít brzo. A pak sbohem, telefonní sezname. Na druhou stranu ona je to hlavně válka obchodních zástupců. Oba obcházejí firmy a slibují zápisy a shrabují provize. Jednou jsem měl náhodou možnost sledovat obchoďáka Seznamu naživo při jednání s klientem a fakt jsem netušil, co to bylo za divnora. Nevěděl ani o tom, že existuje negarantovaný zápis zdarma. Nebo to tajil. A v dalších produktech, jako třeba vyhledání na klíčová slova, se vůbec nevyznal. No ale to by bylo téma na dlouho. Obchoďáci ze Zlatých stránek jsou taky dlouhá kapitolka.

Java nebo javascript?

Já jsem vlastně na té Lupě.cz původně hledal tiskovku od Navrcholu. Komentuje ji Pooh, ale původní text jsem nikde nenašel (zajímavá tisková strategie). Výsledky: podpora cookies: 98,44%, podpora javascriptu 92,70%. Nevěřím. Vzhledem k tomu, že jsem ještě v praxi neviděl Explorer s vypnutým javascriptem (ona totiž není žádná sranda javascript v Exploreru vypnout), prostě nevěřím, že těch asi 7% prohlížečů, co u nás připadá na Mozillu a Operu, běhá po síti s vypnutým javascriptem. Možná jim ty statistiky nakrmili roboti, kteří čtou a stahují obrázky v noscript.

A jestli si dobře pamatuju vykuchaný měřící kód u Navrcholu, tak tu podporu cookies zjišťují javascriptem. No jasně, proměnná c. Zasvěceným jistě svitlo: jak mohli naměřit 98% u něčeho, co se vyhodnocuje jenom v 93% případů?

Koukám také, že tam zjišťují podporu Javy. Nepatří těch devadesáttři procent náhodou spíše Javě (parametr js=)? To by pak smysl dávalo. Ale to se můžu mýlit, neberte mě moc vážně (jako jsem se onehdá pěkně seknul s odhadem zastoupení Yahoo, také u tiskovky Navrcholu). Dneska je to prostě o ničem.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

v pondělí 14. června 2004

Import: všimněte si středníku

Veselá příhoda z praxe. Před chvilkou, když jsem tu stránku začal ladit, byla ještě tma, nyní svítá, ladil jsem to hodinu.

Rozhodl jsem se, že namísto tagu <link rel="stylesheet" href="soubor.css"> tentokrát použiju zápis s @import url("soubor.css"). Proč ne, ostatně v Exploreru je to trochu rychlejší.

Jenomže mi to nefungovalo, prohlížeč ten soubor neviděl. Dvakrát jsem se svedl na scestí sledováním falešné stopy (url, uvozovky). Až jsem tam dopsal středník a najednou to začalo fungovat. Správně je to prostě takhle:

<style type="text/css">
@import url("soubor.css");
</style>

Středník na konci pravidla @import se nesmí vynechat, jinak to nefunguje. Fajn, řekl jsem si a šel jsem si to zapsat do své příručky. Našel jsem patřičné místo o @import a čtu:

Nefunguje to v Netscape 4 (čehož se dá i využít). Všimněte si středníku na konci zápisu.

Asi bych měl číst svoje vlastní návody. To abych nad ránem neztrácel hodiny kodérským šílením. Tuhle chybu už jsem evidentně kdysi udělal.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

Yuhůův weblog píše Dušan Janovský, nick Yuhů. Napište mi prosím na dusan@pc-slany.cz

SPIEDINI