|
Pohled na svět očima Wikipedie Co lze vytvořit během jednoho dne na novém systému SGI® UV™ 2000 - největším in-memory systému pro data mining? Hamburg, Německo - 18. června 2012 - Společnost SGI (NASDAQ: SGI), lídr v oblasti technických výpočtů, spolupracuje s Kalevem H. Leetaru z Univerzity v Illinois na vytvoření vůbec prvního, historického mapování a průzkumu plného textového obsahu anglického vydání Wikipedie v čase a prostoru. Výsledky zahrnují vizualizace moderní historie zachycené v rámci jednoho dne s využitím in-memory (v paměti počítače) data-mining technik. Díky možnosti vložit celou anglickou verzi Wikipedie do systému SGI® UV™ 2000, pan Leetaru byl schopen ukázat, jak se odvíjel pohled Wikipedie na svět během posledních dvou století. Lokalita, rok a pozitivní nebo negativní sentiment byly provázány s těmito odkazy. Zatímco několik předchozích projektů mapovalo vstupy Wikipedie pomocí ručně přiřazených umístění metadat editorem, tyto předchozí pokusy zahrnovaly jen nepatrný zlomek informací umístěných na Wikipedii. Tento projekt odemkl obsah článků samotných, identifikoval každou lokalitu i časový údaj u všech čtyř milionů stránek a vazeb mezi nimi a vytvořil tak masivní síť."Uzření" Wikipedie ve zcela novém světle
Z této analýzy je vidět, že Wikipedie má čtyři období růstu ve svém historickém pokrytí: 1001-1500 (středověk), 1501-1729 (ranný novověk), 1730-2003 (osvícenství), 2004-2011 (éra Wikipedie) a zdá se, že její další růst se zaměřuje na zvýšení pokrytí historických událostí spíše než na zvýšené dokumentování současnosti. Průměrný charakter pokrytí každého roku Wikipedie úzce souvisí s hlavními globálními událostmi, přičemž nejvíce negativním obdobím za posledních 1000 let je americká občanská válka následovaná druhou světovou válkou. Analýza také ukazuje, že "mezera kvůli autorským právům", která potlačila většinu z dvacátého století v digitalizovaných tištěných sbírkách, není problémem Wikipedie, kde probíhá stabilní, exponenciální růst pokrytí od roku 1924 až po současnost. Umožníme vědcům vytěžit Big Data Analytický přístup Nový systém SGI UV: počítač Big Brain Systém SGI UV 2 můžete začít provozovat v malém měřítku s pouhými 16 jádry a 32 GB paměti a postupně můžete konfiguraci bez problémů rozšiřovat. Tato platforma nové generace, oproti předchozí generaci, zdvojnásobuje počet jader (až 4.096 jader) a čtyřnásobí množství koherentní hlavní paměti (až 64 TB), které jsou k dispozici pro in-memory výpočty v rámci jednoho jedinného systému. Systém SGI UV 2 lze škálovat až do osmi petabajtů sdílené paměti a při maximálním zatížení je I/O rychlost až čtyři terabajty za sekundu (14 PB/hod), což představuje zpracování celého tištěného obsahu americké knihovny kongresu za méně než tři sekundy. SGI UV 2000 je okamžitě k dispozici. SGI UV 20 je možné objednat již dnes a dodávky budou zahájeny v srpnu 2012. O SGI Sledujte SGI na Twitteru (@sgi_corp), na YouTube (youtube.com/sgicorp) a na LinkedIn. Obrázky a videa jsou k dispozici zde: http://www.sgi.com/go/wikipedia © 2012 Silicon Graphics International Corporation. SGI a logo SGI jsou registrované ochranné známky nebo obchodní značky společnosti Silicon Graphics International Corp. nebo jejích dceřiných společností ve Spojených státech amerických a/nebo dalších zemích. Intel a Xeon jsou registrované ochranné známky společnosti Intel Corporation. NVIDIA, Quadro a Tesla jsou registrované ochranné známky společnosti NVIDIA Corporation. Všechny ostatní obchodní názvy a značky jsou majetkem příslušných vlastníků. Obrázky, za laskavého souhlasu, poskytl Kalev Leetaru. | |