2/12/11

Frekvence slov v knihách

O službě Google Books teď člověk slyší hlavně v souvislosti s tím, jak nakladatelé lamentují, že je to od Googlu prachsprostá zlodějina. Těžko říct, možná mají pravdu a možná ne. Nakonec v knihkupectví má přece taky člověk možnost do knihy se nejdřív podívat, než ji koupí, a to ne jenom na obsah a rejstřík na konci, jak to nabízí třeba Amazon. Navíc, myšlenka o možnosti vyhledávat ve všem, co bylo kdy napsáno, má taky svoje kouzlo. S něčím takovým nedávno Google přišel ve svých Google Labs - jmenuje se to Google Ngram Viewer a sleduje frekvenci výskytu nějakého slova v knihách za posledních cca 200 let. Narazil jsem na to při čtení článku v Respektu a souhlasím s jeho autorkou, že je to zábava a taky docela zabiják času...
Častost výskytu slova war v anglické literatuře za posledních 200 let...

Častost výskytu slov gay, queer a lesbian. V minulosti se gay používalo ve smyslu barevný, rozzářený, rozjásaný, křiklavý, prostopášný - nakonec Frank Sinatra v písničce South of the Border zpívá 'Cause it was fiesta and we were so gay'. A queer se používalo ve smyslu divný, podezřelý.

Laptop. Nemají tam ale kolem roku 1900 nějakou chybu? Podobný mikrohrbečky se v těch letech vyskytují i u slov computer nebo cellphone. Že by o tom psal Jules Verne?

Páteční kantýna

aspoň jednou za čas servírujou něco optimistickýho... :)

2/5/11

Specializace ≠ úspěch

Narazil jsem na kratičký článek ve Frontiers in Ecology and the Environment, ve kterém analyzovali vztah mezi vědeckou specializací a akademickým úspěchem. Občas přemýšlím nad specializací u kytek a jakou s sebou ekologická specializace nese výhody, a v tomhle kontextu mi ten článek přišel jako zajímavá analogie.

Jak vyjádřit vědeckou specializaci člověka? Autoři článku k tomu použili klíčová slova, která ke článkům jednotlivých autorů přiřadí Web of Science. Klíčová slova by měla vyjadřovat heslovitou podstatu sdělení, o kterém článek je, přičemž použita nejsou klíčová slova vybraná samotnými autory článku (asi proto, že člověk má tendenci vybírat pořád ta samá), ale klíčová slova, která byla k článku přiřazena (moc nevím jak) právě na Web of Science. Pro každého autora se pak spočítá míra, která porovnává součet klíčových slov ze všech článků a počet unikátních klíčových slov v těchto článcích (obrázek a). Čím je vztah strmější (modrá křivka), tím širší vědecký záběr autor má - každý článek je tak trochu o něčem jiném, a autor je spíš vědecký generalista, jack-of-all-traits (česky asi všeuměl, nebo spíš všeználek). Teď ještě jak vyjádřit akademický úspěch člověka. Autoři článku k tomu použili k tomu tzv. H-index, který dává dohromady počet publikací, které vědec vyprodukoval, a jejich ohlas, tedy počet jejich citací. Člověk může psát spousty článků, ale pokud je nikdo nečte (třeba proto, že jsou o ničem), H-index mu to nezvedne.


Studie zahrnula články téměř 4000 ekologů a evolučních biologů z let 1980 až 2000. A výsledek? Vztah mezi mírou vědecké specializace a akademickým úspěchem je unimodální (obrázek b). Interpretace je taková, že pokud se člověk moc specializuje (má úzkou "vědeckou niku", research breath), ostatní jeho článkům moc nerozumí, nečtou je a necitují. Navíc, pokud se člověk moc specializuje, není pro něj jednoduché změnit téma v případě, že to původní už jaksi vyschlo. Na vědecké všeználky pak nejspíš platí pravidlo jack-of-all-traits is master of none, tedy kdo dělá všechno, pořádně nedělá nic (nebo taky "kecá do všeho, ale ve skutečnosti ví houby"). Doporučení, které z toho podle autorů studie plyne, je - správný vědec by se neměl přespříliš specializovat, a pokud už se specializuje, měl by alespoň udržovat kontakty s vědci odjinud, aby si udržoval přehled.

Otázkou teda ještě je, co vlastně přesně je ten akademický úspěch. Je to opravdu H-index? A dá se vlastně akademický úspěch skloubit se štěstím v osobním životě?

A co je to vlastně štěstí? Muška jenom zlatá...