Digital humanities aneb Analýza 2.0

Výraz Digital humanities popisuje vznikající vědeckou disciplínu, která se snaží propojit principy humanitních věd a informatiky. Vychází z předpokladu, že lidstvo má k dispozici stále větší množství dat, což mu umožňuje zkoumat společnost zcela novými způsoby. Vzhledem k jejich digitální povaze lze tato data snadno zpracovávat pomocí různých výpočetních algoritmů, hlouběji je analyzovat a následně z nich získávat nové poznatky o člověku.

Digitální data ve světě přibývají především uživatelskou interakcí s různými typy informačních systémů. Datové servery se denně plní neuvěřitelným množstvím nových záznamů, které v sobě skrývají potenciální zdroj dalších výkumů. Pokud je k pak těmto datům umožněn přístup, stačí se vhodným způsobem ptát a při troše štěstí se dozvědět o společnosti nějaké nové souvislosti. Jedná se tak v podstatě o určitý typ statistických metod, použitých na digitální kulturní stopu lidstva.

Kouzlo digitální formy informací je navíc v tom, že často není třeba rozlišovat, zda se jedná o text, obrázek, zvuk či nějaký jiný typ dat. Z pohledu výpočetního zařízení se jedná pouze o velkou skupinu čísel a v takovéto základní formě se nelze bavit ani o jejich sémantickém obsahu. Význam jim dává až člověk a je pouze na něm, jakým způsobem bude požadovaná data interpretovat, což mu dává neuvěřitelnou svobodu a sílu při pokládání dotazů. Vytváří kolem sebe obrovský oceán znalostí a pokud ví, jak správně nahodit udici, je schopen ulovit v něm prakticky cokoliv.

Analýza 2.0

Vzhledem k čím dál lepší dostupnosti dat, výpočetní síly a sofistikovaných analytických nástrojů dochází k určitému novému typu demokratizace společnosti. Zatímco nástup tzv. webu 2.0 umožnil veřejnosti spolupodílet se na vytváření společných znalostí, lze nyní nově sledovat zjednodušující se přístup k jejich analýze. Pomocí velkého množství volně dostupných nástrojů k prohledávání a třídění informací z celého světa si dnes může prakticky kdokoliv udělat vlastní průzkum, který by ještě před nedávnem nepřicházel v úvahu.

Důsledky takové malé revoluce samozřejmě nemusí být nutně pro všechny jedince pozitivní. Podobně jako svoboda tvorby internetu přinesla některým skupinám možnost obrátit tento proces ve svůj vlastní prospěch, je zcela jisté, že se totéž stane i v tomto případě. Situace může být o to vážnější, bude-li se jednat o analýzu konkrétních osobních údajů.

Hodnocení možných důsledků ale nechme prozatím stranou. Důležitější z pohledu demokracie se totiž může zdát ten fakt, že veřejnost tímto získává novou možnost zjišťovat a ověřovat si některé informace vlastní cestou za pomoci analytických nástrojů. Pokud je k dispozici dostatečné množství dat, není už v některých případech nutné spoléhat se oficiální informační zdroje vlád či tradičních (a často mocensky manipulovaných) médií.

Zpátky k Digital humanities

Po menším odbočení se ale vrátíme k popisu oboru Digital humanities a pokusíme se o nějaké formální vymezení vůči ostatním podobně zaměřeným vědeckým disciplínám. Vzhledem ke skutečnosti, že se jedná o obor interdisciplinární, to však není zase tak  úplně jednoduché.

Jako jeden možný výklad pro zaměření tohoto oboru by snad mohl být ten, že se v něm pracuje s analýzou dat bezprostředně se týkajích člověka a jeho kultury. Taková definice je ale bohužel poněkud vágní, protože obecně vzato se lidské kultury týká úplně všechno, co je zavedeno v jejím pojmovém systému. Přesto lze snad alespoň intuitivně chápat, co by tím mohlo být myšleno.

Druhá charakteristická vlastnost oboru by se dala najít v určité uvolněnosti, která se týká požadavku na přesnost výsledku analýz. Zatímco technické vědy bývají velmi exaktní a od jejich metod se většinou očekává ověření nebo vyvrácení nějaké předem dané teorie, Digital humanities se v tomto ohledu podobá spíše humanitním vědám, kde často platí ten přístup, že teprve až na základě pozorování se vytváří nějaký model. Ne vždy se zde požaduje zcela exaktní výsledek a místo něj se očekává spíše nějaké přibližné nasměrování, na kterém je dále možné vystavět příslušnou teorii.

Jistě i takový pokus o vymezení má mnoho trhlin, ale snad charakter Digital humanities alespoň trochu osvětluje. Nakonec je ale dobré si vždy znovu uvědomovat, že se jedná o vědu snažící se pochopit člověka neboli bytost, která v sobě tak ukázkově spojuje prvky řádu a chaosu, že se dost možná jedná o tu nejlepší metodu k jeho zkoumání 🙂

Příklady

Příkladů aplikace Digital humanities by se dalo najít velké množství. Pro svou jednoduchost se však jako první často uvádějí analýzy textů za pomocí různých statistických metod. Na obrázku níže tak vidíme četnost vybraných slov v literatuře pomocí nástroje ve službě Google Books. Pro demonstraci byla zkoumána slova „Religion“ a „Science“ v textech napsaných mezi roky 1800 a 2012. Ačkoliv je jasné, že tato data jsou do velké míry nepřesná (například ne každý publikovaný text je v obsažen databázi), může nám uvedený výsledek nazačit, kterým z uvedených témat se  lidé v daném období zabývali více.

Další podobně jednoduchou metodou ke zkoumání textových dat může být i vytváření tzv. Word Cloudů. Níže tak můžeme vidět graficky vyvedenou četnost slov ve filmu Inception, provedenou nad příslušnými titulky.

(Více filmových Word Cloudů je možné nalézt v příspěvku 10 Famous movies in Word Cloud.)

Leave a Reply

(Spamcheck Enabled)