fgdfg
         Zadání rešerší       
fgdfg
      Tahák       
fgdfg
Příklad - Dyslexie
fgdfg
Příklad - Deště
fgdfg
    Download    
(c) 2006 Made by inspiratic.com - Email: inspiratic@gmail.com
(c) 2006 Made by inspiratic.com - Email: inspiratic@gmail.com
.
1. Rešerše - druhy, typologie, charakteristika různých typů rešerší, pohledy na význam rešerší z více stran, příklady dělení rešerší
jednorázová rešerše – k jednomu tématu k určitému datu
retrospektivní – shrnuje záznamy k danému tématu od nějakého okamžiku v minulosti k určitému datu.
Doplňková rešerše – v návaznosti na již dříve vypracovanou rešerši
Rešerše průběžná – má zjišťovat literaturu k danému tématu od data zadání směrem do budoucnosti
2. Retrospektivní rešerše, adresné rozšiřování informací - SDI rešerše
Výchozí datum lze určovat v závislosti na tématu rešerše několika způsoby a s přihlédnutím k některým skutečnostem. Limitující úlohu má retrospektivita dostupných lokátorů informací – jak kartotéka katalogových informač. institucí, tak referátových časopisů i strojem čitelných informací. Pro velký počet případů je disponobilní retrospektivita nadbytečná a časový počátek vyhledávání se stanoví s přihlédnutím k životnosti informací v jednotlivých oborech (často 7-8 let, v některých technických oborech pouze 3-4 roky, ale i 30 let). V krajním případě je možné sledovat výskyt literatury o určitém problému až ke (tedy „od“) zjistitelnému prvopočátku
(SDI)– pravidelné opakování stejného dotazu do databáze po určitých časových intervalech - účelem je udržovat přehled o stavu poznání v určité vědecké oblasti; průběžné rešerše se poskytují i jako služby knihoven (databázových center)

3. informační služby a informační průmysl, služby databázových center
Možnost provádět retrospektivní a průběžné rešerše v on-line režimu
Zprostředkování primárních dokumentů (služby typu EDD)
Možnost stáhnout si část vystavovaných databází formou downloadingu
Zasílání krátkých zpráv o nových produktech, službách a dění v databázovém centru
Školení, podpůrná dokumentace, výukové programy, tréninkové databáze
Helpy, popisy databází

Databáze skrývají ohromné množství informací. Již před více než sto lety vědecké společnosti začaly soustřeďovat informace o publikacích svých oborů a zpřístupňovat je ve formě referátových časopisů. Od 2. poloviny 20. století se z referátových časopisů (díky rozvoji výpočetní techniky) stávají bibliografické databáze. Postupným vývojem vznikají další druhy databází.

4. Strukturace informačních služeb dialogových center
S existencí digitální ekonomiky jsou spjaty i „nové“ subjekty (firmy, státní i nestátní instituce a iniciativy), které se podílejí na zajištění jejího chodu a rozvoje. Všechny tyto subjekty je možné rozdělit do několika specifických skupin dle zdrojů, jež poskytují:

Web hosting
Subjekty poskytující datová centra (místa, kde se ukládají data), síťové vybavení a řízení služeb pro zákazníky se zájmem o tzv. outsourcing. Ať už jde o řešení pro část anebo jejich celé webové infrastruktury.

Místa pro obchodování (Virtuální obchodní domy)
Tato místa organizují kupující, prodávající v komunity (v mnoha případech specifického průmyslového odvětví), kde mohou být zboží a služby prodány, směněny, či nakoupeny

Aukce
Subjekty provozující on-line aukce pro klienty, kteří si chtějí opatřit zboží či službu dražbou. Reverzní aukce.

Banky
Subjekty poskytující on-line finanční služby prostřednictvím elektronického zejména internetového styku.

Standardy
Subjekty poskytující informace o standardech nezbytných pro vývoj a implementaci elektronických komerčních systémů.

Vláda
Subjekt, jehož úkolem je vytváření podmínek a právního rámce elektronického obchodování.

5. Digitální ekonomika, cesty k elektronickým médiím, Internet a vyhledávání informací, pohledy na vyhledávání informací - budoucí vývoj
Respektování duševního vlastnictví (copyright) versus svobodný a rovnoprávný přístup k informacím pro všechny
Respektování soukromí uživatelů dat a informací versus potřeby státu a různých agentur získat osobní data občanů
Princip srozumitelné, přesné a pravdivé reprezentace dat
Princip nepoškozování, nezneužívání a nefalzifikování dat a informací.

VYHLEDÁVÁNÍ NA WEBU

Internet představuje rozlehlý prostor a k usnadnění orientace v nepřeberném množství informací slouží různé vyhledávací služby. Základem úspěšného nalezení požadované informace je vědět, jak postupovat, kterou vyhledávací strategii a službu nebo nástroj zvolit.

Dobrá strategie = základ úspěšného vyhledání potřebných informací.

• formulujte slovy co hledáte, jak moc má být informace aktuální, pro koho ji hledám (profesionál, laik), jazykové omezení, geografické určení...
• správně zvolte klíčová slova a fráze (použijte odbornou terminologii), pozor na stop slova!
• používejte i synonyma, příbuzné výrazy, různé pravopisné tvary slov (vyhledávácí nástroje pracují s informacemi v přirozeném jazyce)
• zkontrolujte pravopis klíčových slov
• zvolte vhodný typ vyhledávacího nástroje- lépe je vybrat několik vyhledávacích strojů (každý z nich může najít unikátní dokument)
• seznamte se s nápovědou (help) zvoleného vyhledávače
• sestavte dotaz pomocí klíčových slov a operátorů
• využijte možnost rozšířeného hledání
• vyhledaný výsledek vyhodnoťte
• zpřesněte formulaci nebo zkuste formulovat dotaz pomocí jiných klíčových slov a operátorů

6. Informační profese ve vztahu k vyhledávání informací, strukturace, trendy profese rešeršéra, příklady, náplně práce, vztah koncový uživatel vs. konečný uživatel
Respektování duševního vlastnictví (copyright) versus svobodný a rovnoprávný přístup k informacím pro všechny
Respektování soukromí uživatelů dat a informací versus potřeby státu a různých agentur získat osobní data občanů
Princip srozumitelné, přesné a pravdivé reprezentace dat
Princip nepoškozování, nezneužívání a nefalzifikování dat a informací.

Náplň práce budoucích informačních profesionálů je ve studiu historie písemnictví a končí v analýzách komunikace informací a tvorbě systémů pro řízení podniku nebo instituce fungující např. v občanské samosprávě.

Koncovým uživatelem dialogového systému je možno označit uživatele, který se systémem komunikuje samostatně, bez pomoci zprostředkovatele a pravděpodobně bude informace samostatně získané interaktivním režimem z informačního systému i dále zpracovávat a aplikovat do svých výzkumů či jiných činností. Za jistých okolností můžeme považovat za koncového uživatele také informačního pracovníka (například rešeršéra, „on-line retrieval specialist“, „on-line searching specialist“ apod.), který je uživatelem systému za účelem informační obsluhy „konečného“ (finálního) uživatele a získané informační výstupy mu předává. Informační specialista – zprostředkovatel (information broker) se tak stává partnerem experta, pro kterého je výstup určen.

7. Organizace a řízení rešeršních služeb, lze na příkladu vlastní případové úlohy, např. organizace rešeršních služeb v podnikové oblasti nebo ve veřejné knihovně, vysokoškolské knihovně aj.
Provádění počítačových rešerší se využívají dokumentografické databáze knihovny – ČLÁNKY, KNIHY, ZPRÁVY. Jsou u nás budované od roku 1990. K vyhledávání starších pramenů slouží lístkové katalogy.
Rešerše lze provádět jednorázové i průběžné, ale pouze literární a z informačních materiálů knihovny.
Rešerše jsou již zpracovávány pomocí počítače a uloženy v tiskové i počítačové podobě v knihovně, kde je možno si je vypůjčit.Výsledná podoba rešerše závisí na přání uživatele. Rešerše je nejčastěji požadována v tištěné formě, zřídka na disketě a někdy proběhne předání informací pouze ústní cestou.

1. rešerše klasické
Klasické rešerše jsou zpracovávány z tištěných dokumentů, které jsou k dispozici v Referenčním středisku a ve fondech knihoven. V případě potřeby jsou využívány i dostupné informační zdroje. Vzhledem k objemu sekundárních i primárních zdrojů, z nichž pracovníci oddělení čerpají, je pro tyto rešerše charakteristická komplexnost, ale i větší časová náročnost a cena.

2. rešerše strojové
Strojové rešerše jsou zpracovávány ze zdrojů volně dostupných na internetu, z katalogů knihoven a vybraných českých souborných katalogů, z elektronických zdrojů dostupných v databázových centrech.

Např. Evropské centrum nadnárodní databázové sítě STN International, které sídlí ve FIZ Karlsruhe, zpřístupňuje více než 220 prestižních oborových databází z oblasti techniky a přírodních věd.
Zhotovení rešerše např. z databázové sítě STN International je finančně náročnější, avšak umožňuje mnohem kvalitnější zpracování rešerše s ohledem na možnost výběru skutečně relevantního zdroje (core of science) k zadanému problému.


3. rešerše kombinované
Kombinované rešerše, jak je patrno z názvu, spojují přednosti obou typů rešerší. Pro zákazníka je obzvláště výhodné nechat si pro orientaci vypracovat rešerši strojovou a získat tak výchozí materiál ke studiu. V případě potřeby lze potom objednávku rozšířit o vypracování klasické ruční rešerše.

8. Informační brokering - rozbor, současné problémy, trendy - doporučena stejnojmenná dipl. práce - viz fondy knihovny v Jinonicích
Informační brokering může být typově rozlišován, např. dle druhů dokumentů (např. DDS broker), oborového zaměření, dle technologií (např. on-line specialista - rešeršér), které jsou využívány, dle právní formy subjektů (firma, databázové centrum, knihovna, informační středisko) i jinak. Za všechny prameny, zabývající se informačním brokeringem ve světovém kontextu, je možno uvést např. publikaci autorky S. RUGGEOVÉ [1995], sepsanou spolu s A. GLOSSBRENNEREM.

brokering malých informačních podnikatelských subjektů považuje informační poradenství za zajímavý podnikatelský obor. Konzultanti a malé konzultační firmy se stali součástí obchodního podnikání v informačním průmyslu. Smyslem takového podnikání jako informačního poradce je zprostředkovat efektivní využití dostupných informačních zdrojů, nabízených světovými i regionálními službami. Zejména dialogové služby pro konečného – nezkušeného a neškoleného uživatele - tuto pomoc vyžadují (zejména pokud tyto služby se pojí k velkým databázovým centrům) a nezmění to ani fakt současné přátelskosti dialogových systémů via WWW rozhraní. I přes schopnost ovládat komunikaci s centrem ze strany uživatele tu hraje roli celá řada jiných dovedností a zkušeností, které koncový (resp. i konečný) uživatel nemohl většinou nikde nabýt, pokud k systému přistupuje poprvé.

Ve sdílené síťové ekonomice je nutné se zaměřit na činnosti, které jsou zvládány organizací nejvíce a nejlépe a jiné činnosti delegovat mimo organizaci (v tomto případě mimo uživatele). Z tohoto důvodu informační brokering, poskytující služby konečným uživatelům, má význam a perspektivu, budou-li se jiné subjekty na trhu takto moderně chovat v duchu „outsourcingu“.

Infobroker je v ideálním případě schopen poskytovat rešerše jakéhokoli odborného zaměření.
Zákazníky jsou především malé a střední podniky, vědci, lékaři. Velké podniky mají často vlastní pracoviště (specialisty) nebo tuto činnost provádějí oboroví specialisté (někdy lépe někdy…).
Potřeba: vystihnutí „jádra pudla“ zákazníkových požadavků. Předávat objednavateli data relevantní i pertinentní vhodně setříděná a ne veškeré dostupné informace.
Činnost: vyhledávání informací z různých zdrojů – nalézání a analyzování pro klienta klíčových informací Jednorázové (retrospektivní), průběžné (SDI), patentové rešerše a rešerše na právní čistotu
Zdroje: komerční i free databáze, šedá literatura – polopublikované zdroje, osobní setkání pro zákazníka mnohdy nemožné, web – především ten neviditelný, patentové úřady, rejstříky, knihovny, konferenční materiály, reklamní materiály, výroční zprávy,
Předpoklady: schopnost organizovat, formalizovat a správně ohodnotit svou práci, rozsáhlé znalosti, schopnost logického úsudku, kombinační předpoklady, schopnost naslouchat zákazníkovi a porozumět mu, schopnost vytvořit dobré lidské vztahy se zákazníkem bývá důležitá jak pro kvalitu práce tak pro opakované zakázky.
Přesněji definovat role a úkoly informačních brokerů (nebo také informačních specialistů) nemůže být na první pohled příliš obtížné. Opak je však pravdou - díky různorodosti služeb, které tito lidé poskytují, se definice informačního brokera příliš rozostřuje. Obecněji se však dá říci, že úkolem informačních specialistů je identifikovat, získat a analyzovat klíčové informace, které jsou pro klienta v danou chvíli relevantní a žádané. Informační brokeři musí zajistit, aby zákazník dostal ve správnou chvíli ty správné informace, které mu poskytnou strategické a jiné výhody. I když se broker zabývá především vyhledáváním a vytěžováním informací z elektronických zdrojů (databáze, neviditelný web apod.), pracuje samozřejmě i s dokumenty tradičními (tištěnými) - výročními zprávami, šedou literaturou, sborníky a dalšími materiály firemní i veřejné povahy, které jsou relevantní pro aktuální zadání. Tito "supersearchers" musí mít výborné kombinační a analytické schopnosti, velké praktické zkušenosti s vyhledáváním informací a rešeršní činností obecně a především značné znalosti z oboru, na který se specializují (ekonomie, farmacie, fyzika, chemie apod.).

Radosti a strasti si mají k sobě při vyhledávání informací velmi blízko: Snadno zbloudí nezkušení on-line surfaři na širém moři a nenacházejí v oceánu dat hledanou informaci. Jiným pak pro plynulou navigaci v on-line džungli prostě chybí čas nebo vědomosti.
Informační broker (nazývaný též infobroker) z toho těží a provádí v nejrůznějších zdrojích na zakázku rešerše prakticky jakéhokoliv odborného zaměření.
Doba odezvy je obdivuhodná: informace o firmách, výrobcích a trzích může mít zákazník na stole již během několika hodin; vyhodnocení tisku a literatury, ale i značkové nebo patentové rešerše, se dostanou do jeho e-mailové schránky nebo mezi došlé faxy během několika dní.
Podle informací Německé společnosti pro informační vědu a informační praxi (Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis - DGI) rešeršních služeb asi 100-200 samostatných zprostředkovatelů informací v Německu využívají především malé a středostavovské podniky, ale i zakladatelé existencí, vědci a amatérští nadšenci.
Nejdůležitějším pracovním nástrojem profesionálních rešeršérů jsou přitom on-line databáze, do kterých odborné instituce a poskytovatelé databází nepřetržitě ukládají exkluzivní vědomosti tohoto světa ve strukturované podobě a nabízejí je k dispozici za uživatelský poplatek. Prostřednictvím jednotného dotazovacího jazyka (nazývaného retrieval language) je přes komerční databázové portály (např. GBI nebo Genios) on-line dostupná většina z přibližně 10 000 databází na celém světě, a to zpravidla 24 hodin denně.
K technické výzbroji infobrokera proto patří bezvadná orientace v datových sítích a rozsáhlé znalosti metod dotazovacího jazyka. Mimoto si neustále udržuje přehled o nových informačních pramenech, vzdělává se v rešeršních seminářích a vyzná se v nejdůležitějších datových fondech oborů, na které se specializuje. Ne nadarmo má řada infobrokerů za sebou akademickou dráhu v národohospodářské vědě či oblasti odborných technických věd nebo působení v knihovnictví a dokumentaci.
V ideálním případě není datový profesionál při volbě zdrojů informací fixován pouze na on-line databáze. Jeho "detektivní nos" a jistá míra intuice jej mohou vést i k neuveřejněným expertním vědomostem, které dřímou pouze v hlavách odborníků. Rešerše "v terénu" ve speciálních archivech nebo dokumentačních střediscích činí z infobrokera dokonalého "detektiva vědomostí".
Vlastní "přidanou hodnotu", za kterou koneckonců zákazník platí, vytvoří infobroker ovšem jen tehdy, když se mu podaří upravit sesbírané informace do přehledné podoby a vystihnout jádro zákazníkových otázek. Nic by nebylo horší, než pouze předložit les informací, pro který zákazník nevidí stromy.
Přes všechny šance na trhu se tato branže, která se každoročně setkává ve Frankfurtu nad Mohanem při příležitosti veletrhu Infobase (18. 05. - 20. 05. 1999), stále ještě potýká s obavami z kontaktu a se silně vyvinutým konvenčním informačním chováním především malých a středostavovských podniků - zřejmé cílové skupiny poskytovatelů této služby.
Jinak než před několika lety, kdy byl profesní obraz infobrokera v tisku vychvalován jako perspektivní on-line zaměstnání a přilákal i neseriózní poskytovatele, se trh mezitím sám pročistil. Nebezpečí, že člověk narazí na zloděje nebo šarlatány, je dnes podstatně menší. Přesto: První navázání kontaktu s brokerskými kancelářemi, ve kterých většinou pracují 1 až 4 pracovníci, by mělo probíhat v poklidu.
Již prozkoumání různých webových stránek infobrokerů, uveřejněných v katalogu Yahoo.de ukazuje, že spektrum služeb může mít, tak jako v mnoha svobodných povoláních, značně rozmanité formy. Ne všichni se uživí pouze informačním brokingem. Proto se vyplatí si nejprve přes Německou společnost pro informační vědu a informační praxi (DGI) zjistit související informace a kontaktní možnosti.
Zatímco jednotlivé informace jako firemní profily nebo výtahy z obchodního rejstříku se většinou nabízejí za srovnatelnou pevnou cenu, pohybují se honoráře u rešerší na zakázku mezi 100 a 250 markami za hodinu. Obzvláště u kompletních dotazů se proto doporučuje osobní rozhovor s brokerem. V jeho rámci se informujte například o jeho odborných znalostech, zdrojích, referencích, na zahájení jeho obchodní činnosti. Vyžádejte si kalkulaci ceny.
Také posouzení čistě lidské komponenty (Rozumí mi?) by mělo při rozhodování pro nebo proti konkrétnímu infobrokerovi hrát roli. Protože se většina infobrokerů tradičně živí zakázkami od stálých zákazníků, mělo by se těchto zkušeností využít k vybudování trvalého vztahu.

9. Etický kodex informačního brokera, etický kodex v on-line službách, v rešeršních službách (dokument dohledejte v inf. zdrojích
AIIP je zkratkou pro Association of Independent Information Professionals, která je základní organizací sdružující nezávislé informační brokery po celém světě. Díky nemalým vstupním poplatkům (které z ní však nedělají asociaci "elitářskou") sdružuje pouze vážné zájemce o tuto zajímavou problematiku. Členství potom zavazuje k dodržování přísného etického kodexu, jakož i k odvádění těch nejlepších služeb. Pokud má klient připomínky k práci člena AIIP, může být dotyčný po přezkoumání z této asociace vyloučen. Všichni naši brokeři, kteří pro systém E-quest pracují formou subkontraktních služeb, jsou členy AIIP.

Text strojově přeložený z anglických stránek
Kód etický obchodní
Nezávislý informační profesionál je podnikatel který demonstroval pokračující odborná znalost v umění nalezení a organizující informace. Každý poskytne informační služby na smluvním základu k víc než jeden klient a slouží jako objektivní prostředník mezi klientem a informačním světem
Informační profesionál nese následující povinnosti:
Převezměte na sebe odpovědnost za zaměstnanecký souhlas s tímto kódem.
Podporujte profesní- ovo reputaci pro poctivost, oprávnění, a důvěrnost.
Dejte klientům nejaktuálnější a přesné informaci možný v rámci rozpočtu a časové rámce poskytnutý klienty.
Pomáhejte klientům rozumějte pramenům zpráv užívaný a stupeň spolehlivosti která může být očekávaná od těch zdrojů.
Přijměte jen ty projekty které jsou zákonné a nejsou škodlivé k naší profesi.
Respektujte klientskou důvěrnost.
Poznejte práva k duševnímu vlastnictví. Respektujte licenční dohody a další kontrakty. Vysvětlete klientům co jejich závazky by mohl být vzhledem k právům k duševnímu vlastnictví a licenční dohody.
Udržujte profesionální vztah s knihovnami a podrobte se celý jejich pravidlům z přístupu.
Převezměte na sebe odpovědnost za zaměstnanecký souhlas s tímto kódem

Nezávislá informace profesionál
Informační dohazování jak profese pravděpodobně má své kořeny v 1960's, kdy několik jedinců a knihovní organizace si uvědomily , že počítač a kopírka, posli z významné role , který má být hraný technologií v informační revoluci, by mohl mít významnější dopad na organizaci a získávání informací. Schopnost doručovat dokumenty, kopie z publikovaných článků, a podobný materiál k akademický, obchod a profesionální společnosti, na požádání, představovala příležitost pro ty s dost předvídání a podnikatelský duch proměnit na potřebu služební obchod.
Koncept společnosti která právně získá informaci pro další, a účtuje pro tuto službu, může být zdokumentovaný již 1930's. To bylo koncem šedesáti a brzkých sedmdesáti, nicméně, že organizace jako rýžová Univerzitní oblastní informace a komunikace mění (R.I.C.E.) a informační neomezený otevřel jejich dveře. Pozdější byla založené Sue Rugge a Georgia Finnigan, průmysloví průkopníci kteří pokračovali tvořit, příslušně, vysoce úspěšná informace o požadavku a informačním skladu. Zatímco oba z těchto společností byly pozdější prodaný větším organizacím, R.I.C.E . slavil jeho 30th výročí v obchodu v roce 1997.
Profese pravděpodobně byla první zaznamenala do kroniky v roce 1977 v Adresář Fee - Based informačních služeb, a v roce 1979 s Žurnál Fee - Based informačních služeb, editovaný od Kelly Warnken informační alternativy. Práva k těmto publikace byly koupené v roce 1983 od Burwell Enterprises, Inc., Houston, TX. S jeho prvním vydáním v roce 1984, Burwell identifikoval 334 takových služeb v osmnácti zemích; 12. vydání, teď titulované Burwell světový adresář informací makléře, seznamy přibližně 1800 společnosti v 51 zemích.
Uskutečnění že jiní spojila jejich hodnosti nebo zajímaly se o formování nových informačních provizí udělaly informační profesionály stále více vědomý si potřeby organizovat. Asociace nezávislých informačních profesionálů byla vytvořená v roce 1987 kdy 26 podnikatelé z Evropy, Latinské Ameriky, a celý růžky USA přijde organizační setkání v Milwaukee, WI. Ačkoli jejich společnosti nabídly různorodost služeb, běžná nit byla jejich zahrnutí s informací - získávající to, organizování a analyzování toho, nebo konzultování týkající se jeho použití a managementu.
Informační makléře v 1970- ovo často držely stupeň v knihovnictví. V posledních letech, nicméně, kolegové s pokročilými stupni ve vědě, zákonu, obchodu, léku, nebo další disciplíny spojily jejich hodnosti. Tyto přistěhovalci kombinovali jejich vzdělání a let ze zkušenosti s podnikáním, spouštěcí společnosti které slouží široké různorodosti klientů, někdy včetně jejich bývalých zaměstnavatelů. Tyto experti, spolu s ti, kdo je držící knihovnictví stupně, může ovládat oba generála a vysoce- specializované otázky nebo úkoly. Pro projekty vně jejich oblasti odborné znalosti, nebo kde znalosti druhá profese nebo znalost jsou požadovaná, jejich kolegové v AIIP jsou dostupní pro doporučující nebo dodatek ke smlouvě.


10. Vztah rešeršních a referenčních služeb, důvody blízkého vztahu, obsah činností, názor na jejich řízení a zabezpečení
• Konzultační a poradenská služba poskytující informace: o katalozích
• o knihovních fondech
• o elektronických informačních zdrojích
• Pro: uživatele konkrétní instituce
• odbornou veřejnost

Rešeršní služby

Rešeršní služby představují vyhledávání literatury podle věcných a formálních hledisek zadaných uživatelem (tematika, časové vymezení, jazyk, druhy dokumentů atd.). Výsledkem jsou soupisy záznamů dokumentů nebo jejich částí. UK poskytuje rešeršní služby podle specializace a specifických úkolů jednotlivých pracovišť pro vědecké a odborné účely. Využívá k tomu informační zdroje dostupné v UK.

• Rešeršní služby jsou poskytovány na základě objednávek předaných při osobní návštěvě, poštou nebo prostřednictvím elektronického objednávkového formuláře. Vždy musí být písemně potvrzeny.
• V rámci rešeršních služeb je poskytována rovněž metodická pomoc uživatelům při vyhledávání v databázích.
• Studentům jsou rešeršní služby poskytovány pouze v podobě metodické pomoci.

• Rešerše pro odbornou veřejnost jsou účtovány podle ceníku. Služby jsou hrazeny přímou platbou proti vydání rešerše a potvrzení.

11. Vyhledávání informací na internetu
Internet představuje rozlehlý prostor a k usnadnění orientace v nepřeberném množství informací slouží různé vyhledávací služby. Základem úspěšného nalezení požadované informace je vědět, jak postupovat, kterou vyhledávací strategii a službu nebo nástroj zvolit.

Dobrá strategie = základ úspěšného vyhledání potřebných informací.

• formulujte slovy co hledáte, jak moc má být informace aktuální, pro koho ji hledám (profesionál, laik), jazykové omezení, geografické určení...
• správně zvolte klíčová slova a fráze (použijte odbornou terminologii), pozor na stop slova!
• používejte i synonyma, příbuzné výrazy, různé pravopisné tvary slov (vyhledávácí nástroje pracují s informacemi v přirozeném jazyce)
• zkontrolujte pravopis klíčových slov
• zvolte vhodný typ vyhledávacího nástroje- lépe je vybrat několik vyhledávacích strojů (každý z nich může najít unikátní dokument)
• seznamte se s nápovědou (help) zvoleného vyhledávač
• sestavte dotaz pomocí klíčových slov a operátorů
• využijte možnost rozšířeného hledání
• vyhledaný výsledek vyhodnoťte
• zpřesněte formulaci nebo zkuste formulovat dotaz pomocí jiných klíčových slov a operátorů


VYHLEDÁVACÍ NÁSTROJE A SLUŽBY

Existují dva základní typy vyhledávacích nástrojů:

• předmětové katalogy (Internet Directories, subject catalogs, subject directories, virtuální knihovna, rozcestník)
• vyhledávací stroje (search engines, vyhledávač)

VYHLEDÁVACÍ STROJE (SEARCH ENGINES)

• typ služeb vyhledávání (searching)
• služby založené na automatizovaném sběru dat pomocí tzv. robotů (někdy též crowler, spider)- programy, které se pomocí hypertextových vazeb pohybují po webu a sbírají informace (indexují) o dokumentech a ukládají je do rozsáhlých databází, které pravidelně aktualizují
• informační zdroje jsou zpravidla registrovány plnotextově
• umožňují vyhledávání informací klíčovými slovy prostřednictvím jednoduchého rozhraní nebo metodami pokročilého vyhledávání (buď výběrem z menu nebo přímým zápisem dotazu)
• vyhledávací stroje:
o AltaVista
o Google
o AllTheWeb
o HotBot
o Excite
o TEOMA
o NorthernLight
• metavyhledávače (metasearch engines)– dotaz položený do vyhledávacího metasystému je souběžně zpracován několika vyhledávacími službami najednou, tzn. prozkoumání co největšího prostoru internetu, výsledný soupis je uspořádán a zobrazen v prostředí metavyhledávače.
o Vivísimo
o Ez2wWw.com
o Metacrawler
o KartOO
o ProFusion
o SavvySearch
o Mamma
o Highway61
o Dogpile
• vyhledávací nástroje s unifikovaným rozhraním (gateway) – usnadňují hledání v různých typech služeb prostřednictvím jednotného uživatelského rozhraní
o Alenka
o Amazing Internet Guide
o Eureka!

• portál- často navštěvovaný server, který nabízí svým uživatelům komplexní služby (vyhledávání informací katalogového typu, plnotextové informace, zpravodajství, on-line zábava, bezplatnou el. schránku, diskusní fóra, virtuální obchody apod). Smyslem je integrace služeb do jediného uživatelského rozhraní.
* Yahoo!
* Seznam
* Atlas
* Open Directory
* LookSmart

12. Viditelný versus neviditelný web
Dokumenty dostupné ve www prostředí lze částečně rozdělit na dva okruhy. První tzv. viditelný web (visible web, surface web) obsahuje dokumenty, které jsou běžně volně přístupné a snadno vyhledatelné vyhledávacími stroji. Jeho velikost se odhaduje okolo 2-3 miliard indexovatelných dokumentů, tj. dokumentů, které mohou být podchyceny v databázích vyhledávacích služeb založených na automatizovaném sběru dat (údaj z dubna 2003 od Google: 3,083,324,652 web pages).

Druhým okruhem je tzv. neviditelný web (invisible web), někdy také nazývaný hluboký web (deep web). Jde o oblast dokumentů, které jsou běžnými vyhledávacími stroji obtížně vyhledatelné (tj. jsou pro ně neviditelné). Podle studie Michaela Bergmana pro společnost BrightPlanet se dá odhadnout velikost neviditelného webu přibližně na 400- 500 násobek webu viditelného. Naleznete zde především informace uložené v databázích (54 % deep webu), adresáře, specializované vyhledávače, dokumenty v jiných formátech než HTML (např. PDF, PS, Macromedia Flesh - v těchto formátech se často publikují výzkumné zprávy a studie, příspěvky z konferencí, oficiální zprávy a další významné dokumenty), stránky tzv. samotáři, z kterých není odkaz na jiné a na které není odkaz, dynamicky generované stránky (po základní interakci s uživatelem)- např. katalogy knihoven, kalkulátory a také stránky chráněné heslem.

Existují specializované vyhledávací služby, které umožňují prohledávání neviditelného webu:

• Complete Planet
• Invisible Web
• Direct Search

A také vyhledávací nástroj, který na uživatelem zadaný dotaz prohledá viditelný i neviditelný web:

• Scirus

13. Vztah mezi producentem, zprostředkovatelem a uživatelem, vliv internetu na vztah producent-zprostředkovatel-uživatel
Zprostředkovaná i přímá informační obsluha se posouvá kvalitativně a kvantitativně do jiných rovin. Existuje současná (konkurenční) orientace výrobců systémů a producentů dat a šiřitelů dat (např. databázová centra) na koncového uživatele přes přátelská rozhraní (user-friendly interface, human-centered interface). Informační prostředník (information broker) a jeho role se posouvá do nových směrů .
V síťové struktuře dnešních systémů jsou běžně uplatnitelné hypertextově orientované struktury, které nově ovlivnily vyhledávací metody a rovněž chování uživatelů při vyhledávání informací (např. „browsing" vs. „analytické" způsoby vyhledávání). V budoucnu se dá předvídat širší uplatnění i dalších technologií, jako jsou např. neuronové sítě aplikované do informačních sítí a prostředků vyhledávání. To umožní koncovému uživateli pracovat s informačními systémy ještě více samostatněji a cíleněji. Role informačního specialisty, např. rešeršéra, se posouvá dále (O'LEARY, 1993, s.10-11), svým způsobem by to mohlo být i směrem k nové profesi typu „knowledge worker".

Zánik mezičlánků a jeho vysvětlení může být odvoditelné od některých novodobých komunikačních cest, např. zrodu digitálního dokumentu publikovaného ve webovém prostoru již na straně jeho producenta, nikoliv zveřejněného u vystavovatele (např. u databázových center). Přesto mezičlánek – prostředník se dostane do popředí, a to z důvodu jakési navigace ve světě informací a znalostí.

Koncový uživatel, člověk v komunikaci s informačním systémem či informační službou přímou či zprostředkovanou informační institucí nebo informačním specialistou, je středem celého problému, kolem kterého se odehrávají procesy vyhledávání informací. Není však nutné výhradně toto chápat jen jako důsledek „humanizace" přiblížení výpočetní techniky a informačních systémů člověku, ale je to zejména důsledek silného konkurenčního prostředí (např. KESSELMAN - WATSTEIN, 1988) v oblasti vývoje a provozování počítačových a informačních systémů a snahou oslovit zákazníka a produkt/službu mu prodat. Přes humanistické poslání řady informačních systémů (nejen ve vědě, školství, medicínských oborech, v kultuře) uplatnit se v lidské společnosti a v její pospěch, potažmo ve prospěch člověka, který si rozumí s „počítačem" i bez větších technických a technologických dovedností, tu dominuje ekonomický diktát. Cílem je vyvinout nové (intelektuální kapitál), inovovat, a aspoň po krátkou dobu být na trhu „bezkonkurenční" či „konkurencí neohrožen", a umění a schopnost prodat.

Příklad

Je možno dokumentovat prostřednickou roli již starším experimentem, který se konal v CAS – Chemical Abstracts Service v roce 1988. Týkal se sledování chování uživatelů (WARR – JACKSON, 1988, s.68-72). Po neformálních diskusích, které započaly mezi korporacemi CAS a ICI v roce 1984, a v nichž ICI zastávala stanovisko, že chemici jsou nejvhodnějšími finálními uživateli, kteří mají být zacvičeni jako uživatelé dialogových bází dat, protože již mají zkušenosti z používání interaktivního systému, zacvičil během dalších dvou let štáb CAS 88 chemiků z ICI k využívání databáze CAS ON-LINE. Cílem společného experimentu CAS a ICI bylo získat informace o potřebách chemiků – finálních uživatelů (final user) CAS ON-LINE a o využívání této databáze. Výsledky posloužili také rozvoji CAS. V experimentu se jednalo o:

1. určení efektivity zacvičení pro používání CAS ON-LINE pro finálního uživatele a pro informační pracovníky, kteří jim byli nápomocni, a zhodnocení vhodnosti příruček a dokumentace

2. zjištění problémů, s nimiž se finální uživatelé setkali

3. určení počtu a druhu rešerší, které je schopen denně udělat finální uživatel

4. prostudování efektivity vyhledávání finálního uživatele

5. určení druhu problémů při vyhledávání, které způsobily že musí finální uživatel vyhledat pomoc informačního pracovníka

6. studování reakce informačních pracovníků na vyhledávání finálních uživatelů

7. prostudování reakce řídících pracovníků ICI včetně názorů chemiků i informačních pracovníků na efektivitu nákladů na vyhledávání finálních uživatelů

8. zjištění toho, jak by mohla CAS lépe sloužit potřebám vědců – finálních uživatelů - vědců

Experiment trval 24 měsíců (od prosince 1984 do prosince 1986). Zájem chemiků o experiment byl značný. Nejdříve jim vyhledávání informací zabíralo více času, než kdyby využívali jako prostředníka informačního pracovníka. Chemici však chtěli databázi využívat sami bez cizí pomoci.

Závěr k tomuto případu: pokud koncový uživatel v některých oborech (chemie je toho názorným příkladem) objeví schopnosti vyhledávat informace samostatně a má k dispozici příznivou časovou strukturu, existuje tu i zájem si rešerše realizovat sám. Obvykle je také lépe provádí, neboť obor detailněji zná a navíc zvládá úskalí informačních zdrojů a komunikace s nimi.

Dnes je přístup k chemickým informacím usnadněn ještě více, a to díky přátelskému grafickému uživatelskému prostředí a návodnými způsoby vyhledávání, jako např. u STN International – viz následující příklady základních stránek, odkud se do systému pokračuje s konkrétní rešeršní strategií:

Příklad tzv. Chemportu - http://www.cas.org/chemport/about.html - orientováno na samostatného koncového uživatele, který má uzavřenu smlouvu s CAS (jedna ze součástí databázové sítě STN International)

Chemikům a farmaceutům může velmi dobře sloužit pro komunikaci s databázemi centra STN International, které je jedno z nejlepších na světě, systém rozhraní STN Easy -
http://stneasy.cas.org/html/english/login1.html
14. Problematika licencí ve vztahů k rešeršní činnosti - příklady, problematika konsorcií
Primární úloha tj. tvorba autorských prací, zůstává autorům. Nakladatelům je přisouzena role získat práva na autorská díla, zpracovávat je, distribuovat a tím zhodnocovat. Knihovny sdružují poptávku a finanční zdroje. Tvoří aktuální fondy. Majitelé práv či zprostředkovatelé mají pro používání materiálů v elektronickém prostředí poskytovat licence knihovnám.
Pořizovatel databáze má právo na vytěžování nebo na zužitkování celého obsahu databáze nebo její kvalitativně nebo kvantitativně podstatné části a právo udělit jinému oprávnění k výkonu tohoto práva.
Definice licence
Svolení k určitému výkonu práv z duševního vlastnictví. Licence se uděluje třemi způsoby:
• Dvoustranným právním úkonem (smlouva)
• Prostřednictvím zákona
• Rozhodnutím státního orgánu
Užití síťově zpřístupňovaných digital. Dokumentů a databází pro knihovny – u nás prostřednictvím bezúplatných zákonných licencí (smluvní úprava vztahu) mezi poskytovatelem elektron. Materiálu a nabyvatelem zdroje
Typy licencí
1. Výhradní licence
2. nevýlučná licence (pokud není jinak uvedeno platí tato)

Licence k autorskému dílu (včetně databáze) a licence k obsahu databáze – poskytovatel vstupu do elektronických informačních zdrojů je většinou majitelem autorských práv.

Smíšená a sdružená licence – poskytovatel nabízí nabyvateli celý soubor produktů
Smíšené – jde o více nehmotných statků stejného typu
Sdružené – nabyvatel získává soubor nehmotných statků různého typu – v případě nutnosti speciálního komunikačního softwaru (klienta) pro vstup do databáze je současně s licenčním přístupem k databázovým zdrojům poskytována licence na použití tohoto softwaru.

Licence křížová – bezplatná výměna licencí mezi dvěma stranami (konsorciální licenční dohody) např. Science Direct (STK) umožňuje křížený přístup, kdy každý člen konsorcia měl možnost využívat elektronickou verzi libovolného časopisu odebíraného kterýmkoli členem konsorcia.

Licence Click – on
1. jako knihovnické sítě pro sdílení zdrojů (souborný katalog, MVS atd.)
2. pro nákup a management licencí vytvářená knihovnami
3. konsorcia pro prodej e-služeb knihovnám a krookerským firmám.

Obecné předpoklady pro vstup do konsorcia – telekomunikačním připojením, technickou připraveností, nabyvatelem licence a celkovou architekturou databázového systému poskytovatele.
Zpřístupňování dat přes GUI.
Podpora prohlížečů – standard HTML
Možnost získání nalezených dat (mail, download, tisk)
Architektura systému – nejběžnější http
Knihovny vyhledávají a přijímají protokolem Z39.50
Kontrola vstupu do systému (IP adresa, jméno a heslo
Zabezpečení pro přenos dat SSL
Pluginy – skriptovací jazyky
Další komponenty Active X, JAVA apod.
Nezbytný freeware pro čtení dokumentů PDF

Odpovědnost licencora
• architektura systému
• kontrolu přístupu do systému
• zabezpečení přenosu dat
• řízení systému a kontrolu dat

Řízení systému
• plánované prostoje využít k údržbě systému
• podpora klientů
• monitoring systému


15. On-line přístup, CD-ROM, Internet - volný web - srovnání, rozbor, výhodnost, nevýhodnost
Databázová centra
K největším současným trendům v oblasti zdrojů informací patří vedle prosazování digitální formy i zpřístupňování databází prostřednictvím rozsáhlých světových dialogových systémů. Nejtypičtějším představitelem jsou databázová centra, jejichž účelem je on-line zpřístupnění velkých množství databází současně tisícům uživatelů. Databázová centra většinou nakupují databáze informací od producentů včetně licencí na jejich on-line vystavování, vyhledávání a distribuci záznamů, pouze výjimečně je také samy vytvářejí. Od informací volně dostupných na Internetu se liší především svou hodnotou.

Charakterizuje je záruka přesnosti, úplnosti a včasnosti. Největší databázová centra jako Dialog, Lexis-Nexis, UMI a IAC obsahují i 500 databází z různých disciplín a oblastí. Tradičně zde bývají zahrnuty informace z následujících oborů: chemie, lékařství, společenské vědy, technologie, podnikání a finance, zemědělství, patenty a normy, legislativa, energetika a životní prostředí. Firmy nejvíce využívají databáze zaměřené na podnikatelské prostředí, nacházejí zde informace o firmách a institucích (např. adresáře, výroční zprávy), informace o službách a výrobcích (katalogy), informace o financích (zprávy z kapitálových trhů, informace z burzy a finančních institucí), hospodářské informace (makroekonomické indikátory) a informace z vědy (výzkumné zprávy a projekty).

On-line versus CD ROM
V současnosti nabízejí databázová centra i další producenti informací své produkty dvěma základními způsoby, s přístupem on-line nebo databázi na CD-ROM. Vhodnost každého z přístupů sice musí firma posoudit individuálně, podle konkrétních podmínek, ale je vhodné zvážit i některé obecně platné přednosti a nedostatky, které vyplývají již z podstaty přístupu. U databází ve formě CD-ROM patří k výhodám poměrně snadná možnost integrace databáze do stávajícího podnikového informačního systému. Firma tímto ve spojení s podnikovou LAN sítí vytváří pro uživatele jakousi lokální on-line databázi. Toto integrované řešení se osvědčí především ve firmách, kde se předpokládá více uživatelů a klade se důraz na spolehlivost systému. Současná telekomunikační infrastruktura zatím většinou není schopna poskytnout srovnatelně spolehlivé prostředí pro on-line přístup k rozsáhlým databázím. Další nespornou výhodou je pohodlné a uživatelsky velice přívětivé dotazovací rozhraní, které je dodáváno společně s daty na CD-ROM. Na rozdíl od on-line přístupu zde uživatel není při práci omezen ani časem ani frekvencí vstupů do databáze. Největší omezení zde představuje, i přes neustále se zvyšující hodnoty, nedostatečná kapacita CD-ROM.

On-line přístup do databázových center umožňuje přístup k neustále aktualizovaným informacím. Dále vyšší přesnost a úplnost výsledků vyhledávání. Zpřístupňuje také velké množství databází, bez ohledu na to, zda uživatel předem zná, nebo nezná databázi, která by optimálně vyřešila jeho dotaz. Některé funkce umožňují i snadnou a rychlou kontrolu výsledku dotazu vyhledáváním napříč mnoha dalšími databázemi. A navíc databázová centra často on-line zpřístupňují informace, které nejsou na CD-ROM přístupné. K nevýhodám on-line přístupu patří pro uživatele někdy náročnější dotazovací systémy, které zahrnují i např. nutnost práce s příkazovým řádkem a dále také značný časový stres.

Nic není zadarmo
S nástupem Internetu se mohlo chvíli zdát, že veškeré informace budou snadno dostupné a navíc ještě zdarma. Ve skutečnosti to tak není, informace které jsou dostupné zdarma mají většinou i malou hodnotu pro manažerské řízení. Oproti tomu spolehlivé a kvalitní informace bývají zpoplatněné, protože odrážejí značné náklady potřebné na vybudováni těchto bází dat. V současnosti se používají především dva základní způsoby placení, které se mohou dále lišit v detailech podle jednotlivých firem. Tím prvním je klasické předplatné a používá se především pro databáze distribuované na CD-ROM a také pro některé databáze s on-line přístupem. Druhý způsob nejlépe vystihuje anglický termín "pay-as-you-go".

Tento přístup se nejvíce prosazuje u on-line služeb, kdy uživatel platí za zobrazené dokumenty nebo také podle doby práce s databází. Většina producentů informací nabízí obě varianty, většinou i v kombinaci s dalšími podmínkami. Důkazem může být např. společnost Dialog, která nabízí téměř 40 různých cenových schémat pro přístup k jejím databázím.

16. Komunikační software (např. STNExpress, DialogLink aj.) a jeho význam v on-line službách, příklady, vysvětlení funkcí komunikačního softwaru
V databázových centrech bylo vždy nutné dodržovat určité zásady rešeršní strategie a přístupu k informacím. Některé úkony lze pak dělat jen výhradně těmito postupy dodnes. Někteří informační specialisté nemíní opustit klasické způsoby komunikace se zažitým uživatelským rozhraním, protože by je nová často pomalejší rozhraní zdržovala a není to ani nutné k jejich práci. Databázová centra jsou si velmi dobře vědoma poměrně velké skupiny uživatelů z velkých korporací, kteří nechtějí měnit své rešeršní návyky. A databázová centra usilují především o velké uživatele-zákazníky zejména z firemního prostředí. Zkušení rešeršéři však stále rádi využívají klasické dotazovací jazyky, a to i proto, že novinky často postrádají důvtip a kvalitu dřívějších prostředků. Je také možno naimplementovat různá a pro nás výhodná uživatelská rozhraní na protokol telnet či jiné protokoly (např. ssh) používané pro bezpečnou práci ze vzdálených míst. U centra STN International je to speciálně pro jejich uživatele vyvinutý komunikační software STN Express. Jeho používání je výhodné pro práci s patentovými, chemickými a farmaceutickými databázemi, které obsahují jednoduchou grafickou informaci v podobě nákresů, chemických strukturních vzorců apod., dále z důvodu jednoduše nadefinovaného automatického připojení se a automatického “zalogování se”, které ovládáme přes tzv. funkční klávesy.
Databázové centrum Dialog zpřístupňuje on-line kolem 600 databází ze všech oblastí lidské činnosti s významným podílem databází zaměřených na technologický vývoj, trendy, tržní rozbory, marketing, firemní informace, patenty apod. Přístup k těmto informacím je dnes nejčastěji prostřednictvím www prohlížeče. Služba DialogWeb Overview je určena spíše profesionálním uživatelům, zatímco DialogSelect slouží profesionálům i koncovým uživatelům bez speciálního vyškolení. Služba DialogClassic je určena nejpokročilejším uživatelům, kteří jsou schopni využít všech možností příkazového jazyka Dialog Command Language. Další možnosti zpřístupnění jsou uvedenyna stránce produktu
Služby centra Dialog je v zásadě možno čerpat dvojím způsobem:
• transakční účtování (tzv. pay-as-you-go) znamená, že uživatel platí poplatek za skutečné využití informací - např. za zobrazení záznamů apod.
• předplatné vybraných databází (tzv. flat-fee) poskytuje výhodu neomezeného čerpání informací z nejpoužívanějších databází za pevný roční poplatek
Oba tyto způsoby lze kombinovat. Minimální měsíční poplatek je 75 USD, je však použit jako nevratná záloha pro transakční čerpání informací. Služby je rovněž možno platit prostřednictvím karet (např. VISA).
DIALOGLINK 5 je programový balík určený pro on-line práci s databázemi informační centrály Dialog (Thomson Scientific). Kromě usnadnění a řízení všech fází rešeršního procesu (formulace a zadávání dotazu, průběh rešerše, analýza a zpracování výsledku, nadstavbové procedury) je významný i tím, že umožňuje práci s grafickou informací jako je např. zadávání/zobrazení strukturních chemických vzorců nebo obrázků (loga, ochranné známky apod.).

17. Softwarová podpora uživatele že strany databázových center
Podpůrné funkce - jsou orientovány na zlevnění a usnadnění komunikace se systémem pro všechny kategorie uživatelů. STN Express umožňuje připravit jádro rešeršního dotazu v režimu off-line na klientské stanici a následně dotaz uplatnit jako do jisté míry už odladěný on-line do celého systému databázového centra. Další s názvem STN Mentor Laboratory je typickým výcvikovým programem pro začátečníky a poslední, Professional File System je databázovým systémem pro klientské stanice umožňujícím uživateli z dokumentů, přetažených elektronicky ze serverů centra, vytvářet vlastní bázi dat s hlavními funkcemi pro její optimální další informační využití v lokálním prostředí. Pro zahajovací kontakty s centrem dává STN International uživateli k dispozici testovací možnosti na sedmi vybraných databázích po 15 minut zdarma v rámci podpůrné funkce STN Sneak Peek. Mezi takto uvolněnými databázemi jsou např. nejznámější světová bibliografie patentové literatury Derwent Patent Citation Index nebo bibliografie světové literatury v oblasti elektroniky, fyziky a řízení INSPEC.
V prostředí WWW zpřístupňuje STN International své databáze uživatelsky vlídným způsobem funkcí STN Easy, doplněným ještě možností využívat prohlížení (browsing) ve slovníku termínů ve WWW.
18. Konfigurace on-line pracoviště, vliv nových rozhraní na konfiguraci, propočet (resp. profesionální odhad) ceny zřízení pracoviště on-line přístupu, co vše je zapotřebí včetně smluvních a licenčních pravidel, zakomponování do struktury organizace
Investiční prostředky:
PC s LCD, scaner, tiskárna zařízení na připojení na internet (síťové aktivní prvky)
programové vybavení
Všechny komponenty koupeny na základě jednoho výběrového řízení, vyhlášeného na nákup celého systému,
hardwarově zcela dostačující pro první tři roky projektu
Neinvestiční prostředky:
Nákup přístupu do databází např AIP
databáze DIALOG CLASSIC
databáze systému MEDLINE
databáze STN International
školení: 1 pracovníka se systémy
konzultace k instalaci aplikačního softwaru
konzultační služby
poplatky (bankovní, poštovní, inzerát)
mzda
pojištění
režie
cestovné: konference apod.
19. Selekční jazyky a jejich používání v rešeršních systémech
Metody a techniky vytváření, publikování, organizace, vyhledávání a vyhodnocování informací. Důraz je kladen zejména na práci s elektronickými, resp. digitálními informacemi, a na využívání informačních a komunikačních technologií.

Tezaurus (někdy také Thesaurus, lat. "poklad, pokladnice") je slovník, který uživateli nabízí seznam synonym, někdy i antonym. V softwaru je známý hlavně v kancelářských programech typu Microsoft Word.

PŘEDMĚTOVÉ KATALOGY

• typ služeb prohlížení (browsing)
• služby umožňující předmětově orientované vyhledávání v hierarchicky uspořádaných předmětových katalozích
• jsou založené na ručním sběru dat zpracovávaných odborníky, později doplněné o možnost zaslání požadavku na registraci v katalogu pomocí formuláře skrývajících se pod ikonami typu Přidej URL, Add URL
• užívá se v situacích, kdy uživatel přesně neví, jaký zdroj informací hledá a má pouze přibližnou, obecnou představu
• pomocí hierarchických vztahů mezi kategoriemi, cestou od obecných ke specifičtějším, může svůj požadavek specifikovat a dostat se k seznamu hodnotných zdrojů k danému tématu
• dnes je k většině předmětových katalogů přidána funkce hledání pomocí klíčových slov nebo výběr menu s určitým omezením
• předměrové katalogy:

o Yahoo!
o Seznam
o Atlas
o Caramba!
20. Přirozený jazyk, řízené slovníky, tezaury, předmětová hesla, klasifikační schémata a jejich role v rešeršní činnosti

Rešeršní strategie je postup, jak efektivním způsobem získat přesný ohlas relevantních dokumentů. Předpokládá přesnou formulaci dotazu, analýzu tématu a znalost vyhledávacích služeb. Mezi rešeršní nástroje řadíme věcné selekční jazyky a systémové nástroje podmíněné informačními technologiemi.
Věcné selekční jazyky se zabývají obsahovou charakteristikou dokumentu. Podle typu používaných selekčních prvků se dělí na věcné selekční jazyky na bázi přirozeného jazyka (zkráceně zvané předmětové selekční jazyky), jejichž lexikální jednotky jsou vybírány z přirozeného jazyka, a systematické selekční jazyky, jejichž lexikální jednotky představují numerické, případně alfanumerické znaky.
Podle způsobu organizace lexikálních jednotek v procesu indexování a vyhledávání rozeznáváme jazyky prekoordinované a postkoordinované.
V prekoordinovaných jazycích je téma dokumentu vyjádřeno sestavou lexikálních jednotek podle předem stanovených syntagmatických a syntaktických pravidel už v průběhu indexování. V lístkových katalozích a u první generace OPAC katalogů tvořila tato sestava nedílnou součást v celém procesu pořádání informací, bylo možné do ní vstupovat pouze prostřednictvím vstupní pozice; později v souvislosti se zdokonalením systémových nástrojů pro vyhledávání, tj. s možností vyhledávat po slovech, bylo možné vstupovat do systému a vyhledávat i prostřednictvím jednotlivých segmentů předmětového hesla (podhesel, zpřesnění) .
V postkoordinovaných jazycích je téma dokumentu vyjádřeno sestavou izolovaných jednotek, mezi nimiž nejsou syntaktické vztahy explicitně vyjádřeny.
Věcné selekční jazyky jsou charakterizovány
• lexikem,
• strukturou, tj. vyjádřením vztahu mezi lexikálními jednotkami,
• gramatikou - pro potřeby této práce zjednodušené na aplikační syntax, tj. soubor pravidel pro spojování lexikálních jednotek při tvorbě selekčního obrazu dokumentu.
Podle uplatnění principu prekoordinace nebo postkoordinace při tvorbě selekčního obrazu dokumentu se věcné selekční jazyky na bázi přirozeného jazyka dělí na jazyk předmětových hesel a jazyky deskriptorového typu.
Jazyk předmětových hesel vznikl v prostředí lístkových (manuálních) katalogů. Předmět dokumentu bývá vyjádřen několika předmětovými hesly (3-6), přičemž předmětové heslo je struktura (věta) tvořená podhesly podle předem stanovených syntaktických pravidel. Slovní zásobu tohoto jazyka tvoří soubor předmětových hesel, sestavených z dílčích lexikálních jednotek. Nejčastějším představitelem dílčí lexikální jednotky je jednoslovné substantivum. Do systému je v konkrétně stanovených situacích možno zařadit i víceslovné lexikální jednotky, jejichž typickou vlastností je inverze (priorita substantiva). Systémy však mají tendenci tyto víceslovné lexikální jednotky rozkládat (výchova dítěte - děti - výchova). Soubor předmětových hesel se vytváří induktivní metodou (tvorba "zdola", na základě konkrétního materiálu), protože postihuje univerzální fond. Mezi lexikálními jednotkami jsou definovány dva typy vztahů: vylučovací a přidružovací. V syntaktické rovině je dominantním principem prekoordinace, kdy jsou definována komplexní pravidla, která umožňují vystihnout obsah dokumentu detailním způsobem. Standardizace se řeší povýšením řetězce předmětového hesla do autoritního souboru. K nesporným výhodám tohoto systému patří
• detailní vyjádření předmětu dokumentu
• odpovídající specifičnost
• maximální informační hodnota řetězce předmětového hesla
• efektivní servis pro uživatele v tradičním prostředí
K nevýhodám, které vynikly až v elektronickém prostředí, patří
• rozklad víceslovných lexikálních jednotek
• délka řetězce předmětového hesla - koncové údaje se nezobrazí vůbec, případně na druhé řádce
• princip prekoordinace uplatněný v syntaktické rovině, a z toho pramenící
• komplikovaná pravidla aplikační syntaxe
• redundantnost informací v bibliografickém záznamu
• velikost autoritního souboru
• komplikovaná údržba
Jazyky deskriptorového typu - oborové tezaury se plně rozvinuly zvláště v prostředí elektronických katalogů v souvislosti s nástupem vyhledávacích systémů 2. generace charakterizovaných možností vyhledávat pomocí kombinace slov. Předmět dokumentu bývá vyjádřen sestavou izolovaných lexikálních jednotek - deskriptorů, variantní vsup do systému bývá zajištěn pomocí nedeskriptorů. Typickým reprezentantem lexikální jednotky je jednoslovné substantivum, přičemž je možno zařadit do systému i víceslovné lexikální jednotky v přirozeném slovosledu, avšak velmi často dochází k jejich rozkladu. Typické pro tezaury je důsledné vyjádření vztahů mezi lexikálními jednotkami, a to ekvivalence (synonymie, homonymie), hierarchie (nadřazenost, podřazenost), asociace. Při vyjádření komplexního obrazu dokumentu je důsledně uplatněn princip postkoordinace. Autoritní soubor vzniká deduktivní metodou (postup "shora"). K výhodám tohoto systému patří princip postkoordinace a z toho pramenící přehlednost selekčního obrazu dokumentu, snadná tvorba hierarchických struktur, snadná údržba, snadná manipulace. K nevýhodám patří rozklad víceslovných jednotek - nerespektování kompaktnosti termínu, informační šum způsobený parazitním (náhodným) spojením deskriptorů a v důsledku toho velký ohlas irelevantních dokumentů, omezení pouze na tematickou část obsahové charakteristiky dokumentu: systém deskriptorů a nedeskriptorů zahrnuje pouze tematické termíny. Tento nedostatek se odstraňuje připojením podpůrných souborů identifikátorů (personalia, jména korporací, geografické názvy, atd.).

21. Význam kódovníků ve vyhledávání informací

Význam kódovníků (číselníků) pro vyhledávání informací – když známe kód, stává se naše rešerše přesnou, nedostane se do ní informační šum, protože kód umožňuje individuální identifikaci.
Když známe kód, nemusíme se bát problémů s vyhledáváním, vzniklým z důvodu různých vyjádření jednoho a téhož pojmu nejenom v různých jazycích (i v jednom jediném jazyce mají termíny několik způsobů vyjádření a to přináší uživateli při vyhledávání nemalé komplikace se zadáním dotazu).

Příklady kódovníků:

KEMLER kód:
Jak se označují nebezpečné látky na silnicích a železnicích?
Silniční (ADR) a železniční (RID) přeprava nebezpečných látek se řídí mezinárodními dohodami, které ukládají patřičné značení. Nejprůkaznějším je oranžová tabulka 40x30 cm, rozdělená na dvě části, ve kterých jsou napsány číselné kódy – KEMLER kód nahoře a UN kód dole.






Tabulka označující chlór.
Vrchní číslo je tzv. Kemler kód: - můžeme podle něj určit, jaké nebezpečí nám od látky hrozí - je složen ze dvou nebo tří čísel, někdy doplněných písmenem X - čísla jsou od 2 do 9, každé z nich má svůj význam pro přepravovanou látku:

2 – uvolňování plynů pod tlakem nebo chemickou reakcí
3 – vznětlivá pára kapaliny nebo vznětlivý plyn
4 – hořlavá pevná látka
5 – látka s oxidačními účinky (schopná samovznícení)
6 – jedovatá látka
7 – radioaktivní látka
8 – žíravá látka
9 – látka s nebezpečím prudké reakce (samovolný rozklad)
X – látka nesmí přijít do styku s vodou (uvádí se před číslicí)

Pokud jsou čísla v Kemlerově kódu zdvojená či ztrojená, znamená to stupňování nebezpečí (např. 3 – hořlavá kapalina, 33 – lehce hořlavá kapalina).

Spodní číslo je tzv. UN kód:
Podle něj však běžný smrtelník, který nemá co dočinění s hasiči, chemickým průmyslem či s firmou zabývající se přepravou nebezpečných látek nepozná nic. Zpravidla čtyřmístné číslo má přidělená každá nebezpečná látka schopná přepravy. Těchto látek je samozřejmě několik tisíc, proto existují speciální databáze,ne však běžně přístupné.
Pokud na cisterně je vepředu a vzadu jen prázdná oranžová tabulka,znamená to,že převáží více druhů látek najednou.

D-U-N-S
D-U-N-S (Data Universal Numbering System) - unikátní identifikační devítimístný číselný znak zavedený společností Dun & Bradstreet. Pomocí D-U-N-S je možné spolehlivě nalézt firmu v kterékoli části světa a v řadě případů rozpoznat její vlastnické vazby.
D&B sleduje pomocí D-U-N-S čísel vazby mezi mateřskými a dceřinými společnostmi, ústředím a pobočkami.

ISBN
International Standard Book Number – mezinárodní standardní číslo pro knihy, jedinečné číslo, podle kterého můžeme určit, v jaké zemi a u kterého vydavatele byla kniha vydána.

EAN?
Mezinárodní systém kódování zboží EAN je jediný, který v mezinárodním měřítku umožňuje identifikovat jednoznačným kódem, neboli číslem EAN nejen každý výrobek a jeho varianty bez ohledu na místo jeho původu nebo určení, ale i místa a entity (tzv. lokalizační číslo EAN). Kódy EAN jsou pak fyzicky vyznačeny na předmětu ve formě čitelné strojem, tj. čárovými kódy umožňujícími rychlé a automatické rozpoznávání dat.

Medistyl – dtb. Alarm

22. Rozbor: přirozený jazyk versus řízený slovník, srovnání rešeršních přístupů, problematika prekoordinace a postkoordinace

Předmětově orientovaný přístup k informačním zdrojům – řízené slovníky, hesláře, tezaury.
Vyhledávání informací – otázkou je, zda řídit či neřídit slovníky. Lze využívat klíčová slova, kombinovaný slovník či řízení slovník. Funkcí řízeného slovníku je kontrola synonym a tento druh slovníku umožňuje výtěžnost relevantních dokumentů.
Snahy o vytvoření univerzálních řízených slovníků.

Vyhledávání informací – pomocí řízeného slovníku nebo ve volném textu

Př. řízeného slovníku – LCSH – Library of Congress Subject Headings.
Přirozený jazyk přináší mnoho problémů, PJ je nejednoznačný – synonymie, homonymie (jeden znak označuje dva či více zcela různých významů), polysémie slov (křídlo letadla nebo ptáka, klavír).
V přirozeném jazyce se skládají slova do vět.
Přirozený jazyk neexistuje sám o sobě, přirozených jazyků je mnoho, existuje plurálně. Zároveň však existuje něco jako jeden rozum nebo jedno myšlení, tzn. shoda obsahu různosti jazyků a jazykových forem. Vzniká tedy otázka překladu mezi různými jazyky.
Sémantika přirozeného jazyka je volná, jeho významy jsou fuzzy významy, přičemž volnost odpovídajících významů v různých přirozených jazycích je různá. Každý přirozený jazyk je otevřeným systémem umožňujícím proměnu stávajících významů, jakož i zánik, vyloučení jedněch a vznik, doplnění jiných významů.
V celku přirozeného jazyka se tedy mění jak slova, tak významy. Za přirozeným jazykem se nenachází přímo svět, ale obraz světa.
Při předmětovém pořádání informací zařazujeme záznamy s ohledem na přirozený jazyk.
Vlastní – přirozený jazyk v užším slova smyslu slouží k běžnému, přirozenému dorozumívání mezi lidmi. Obsahuje mimiku a gestikulaci. Písmo zachycuje zvukový jazyk –grafické zachycení jazyka. Přirozená mluva je mnohoznačná a má nepřesný vztah mezi slovem a jeho významem.
Selekční jazyk – jazyk, kt.se užívá k ukládání, indexaci a k zpětnému vyhledávání – selekci I.
Typickým rysem SJ je řízená slovní zásoba – řízený slovník.
Koordinace – využití více lexikálních jednotek k vyjádření složených témat při formulaci dotazu. Vzájemné přiřazování klíčových slov.

Prekoordinace – vztahy mezi lexikálními jednotkami jsou definovány už při indexování dokumentu (na vstupu) – zvyšuje přesnost.
Hesláře – seznamy lexikálních jednotek používaných k prekoordinovanému obsahovému zpracování a vyhledávání dokumentů (např. LCSH).

Postkoordinace – vztahy mezi jednotkami jsou definovány až při formulaci dotazu (na výstupu) – zvyšuje úplnost.
Tezaurus – soubor lexikálních jednotek používaných k postkoordinovanému obsahovému zpracování a vyhledávání dokumentů (např. MeSH), řízený slovník termínů SJ.
„předmětové selekční jazyky“ X systematické (hierarchické) selekční jazyky (např. OKEČ,MDT,LCC, DDT).

Přirozený jazyk Selekční jazyk
1. asymetrický (synonyma, homonyma, …) směřuje k symetrii
2. komunikační i apelační funkce komunikační fce
3. asociační spojení jsou skryta asociač.spojení zvyšují sílu jazyka
4. možnost obměny slov obměna vyjadřování nežádoucí
5. závisí na fonetice fonetika je nezávažná
6. slova jsou libovolné délky rovnoměrnost kódu bývá žádoucí
7. je redundantní redundance je omezována
8. dominuje substantivum a slovesa operuje jen se substantivy a adjektivy
9. má slovesné kategorie (vid, rod) nemá slovesné kategorie
10. má metajazyk je popisován přirozeným jazykem


Jak systémy založené na používání přirozeného jazyka, tak systémy založené na používání formalizovaného (řízeného) jazyka mají stejně výkonné pomůcky k vyhledávání - osekávání (truncation), vzdálenost slov atd.
Vyhledávání podle slova v názvu nebo v abstraktu – slova jsou v přirozeném jazyce. Předmětová hesla (deskriptory) jsou formalizované termíny zařazené do tezauru deskriptorů příslušné báze dat, jde o řízený slovník.
Problémy nastávají, pokud máme vyhledáváme informace v cizím jazyce. Pokud je autorem člověk, jehož mateřštinou není např. angličtina, pak se někdy stává, že jeho verze angličtiny je poněkud vzdálená angličtině rodilých mluvčích. Zdaleka ne všechny články procházejí před zveřejněním jazykovou korekturou. Názvy článků i abstrakty v bázích dat mohou proto obsahovat výrazy, které se neshodují s běžně používanou anglickou terminologií. Je s tím nutné počítat – buď použít pro hledání všechna známá synonyma nebo si vhodný termín najít v řízeném slovníku – v tezauru – příslušné báze dat.
Pokud bychom použili pro hledání záznamů na určité téma špatný výraz, zbytečně se připravíme o řadu cenných informací.
23. Booleovské a proximitní operátory, numerické operátory
viz. také otázka č. 25

Booleovské - logické operátory (angl. Boolean operators)
Proximitní – poziční – vzdálenostní operátory - distanční operátory (angl. proximity operators)

Boolean (logické) operátory
Booleovské (logické) operátory
Logické operátory určují vztah mezi jednotlivými vyhledávanými slovy a dotaz zužují nebo rozšiřují.
AND, OR, NOT (případně AND NOT) (dle priority NOT, AND, OR)

1) AND (a také) - základní operátor, výsledek hledání zkrátí na stránky obsahující slova, mezi kterými se AND nachází.



2) OR (nebo) - vyhledá stránky, které obsahují alespoň jedno klíčové slovo (keyword), které OR spojuje.



3) NOT (ne) - vyhledá stránky, které neobsahují klíčové slovo za operátorem NOT.



Poznámka: Operátory AND a NOT lze nahradit znaky + a -.

Obdobou booleovských operátorů mohou být v některých databázích používané znaky:
+ & (and); - | (or); ! (not)

Složité dotazy - lze formulovat navíc ještě s využitím kulatých závorek: ( )
(Karel AND Čapek) NOT spisovatel - pokud se chceme ujistit, že výsledek bude obsahovat zároveň obě jména obsažená v závorkách, ale nebude se jednat o spisovatele Karla Čapka.


Proximitní operátory
operátory udávající vzdálenost mezi zadanými výrazy, nejsou univerzální, každý systém užívá jiné (např. ADJ, NEAR, WITH, N, W, L, S...)
(w), (n), (l), (a), (s), near, with, adj - proximitní

Slouží pro vyjádření omezení vzájemné pozice vyhledávaných termínů (např. mezi termíny nesmí být více než zadaný počet slov s ohledem na pořadí či v libovolném pořadí atd.)

Distanční operátory - NEAR, ADJACENT (ADJ) a FOLLOWED BY, specifikují posloupnost a vzdálenost mezi dvěma vyhledávacími výrazy. Umožňují nalézt dokumenty, v nichž se hledaná slova vyskytují nedaleko sebe nebo v těsném sousedství. Vyskytují-li se slova v textu blízko sebe, je větší pravděpodobnost, že se dokument hledaným tématem zabývá, než kdyby tato slova sice obsahoval, ale na místech od sebe hodně vzdálených.

Operátor ADJACENT zkráceně ADJ, se používá k hledání slov, která se v textu dokumentu nacházejí vedle sebe, tj. sousedí spolu, ovšem nezávisle na pořadí,
zatímco operátor FOLLOWED BY bývá používán, je-li nutné zajistit vyhledání slov v přesném pořadí.
Spojení dvou výrazů operátorem NEAR znamená, že se hledaná slova musí vyskytovat v textu dokumentu v určité vzdálenosti od sebe.

Použití distančních operátorů při formulaci dotazu je výhodné například při hledání vlastních jmen nebo názvů. Totéž vyhledávání lze sice zpravidla zajistit příkazem, který umožňuje vyhledat zadaná slova jako frázi, někdy je však účinnější formulace dotazu právě pomocí operátoru NEAR. U fráze totiž musíte uvést pouze hledaná slova v odpovídajícím pořadí.
Dejme tomu, že byste měli zájem o informace o Karlu Havlíčkovi Borovském. Občas bývá jeho jméno chybně uváděno takto: Karel H. Borovský. Pokud byste si chtěli vyhledat všechny odkazy, bez ohledu na to, jak je v dokumentech jméno uvedeno, máte několik možností. Buď byste museli v dotazu uvést všechny varianty jména a spojit je logickým operátorem OR, nebo můžete použít právě operátor NEAR. V dotazu s tímto operátorem je vhodné uvést ta slova, která se s největší pravděpodobností budou vyskytovat všude. V tomto případě: Karel NEAR Borovský.

• NEAR/x (poblíž) - udává, v jaké vzdálenosti od sebe mohou být klíčová slova maximálně vzdálena. X určuje maximální vzdálenost (vzdálenost se "měří" ve slovech a zapisuje se číslem).
• FAR/x (daleko) - udává, v jaké vzdálenosti od sebe mohou být klíčová slova minimálně vzdálena. Dále je to jako u NEAR.
• ADJ/x (z angl. adjacent - přilehlý) - podobné jako u NEAR a FAR, jen nezáleží na pořadí slov a x označuje přesnou vzdálenost.
• WITH – záleží na pořadí
• Within operátor (W) – nalezne slova v zadaném pořadí

Numerické operátory
používají se pro číselné hodnoty (např. =, >,<, ...)

< menší než
<= menší nebo roven
> větší než
>= větší nebo roven
== rovná se
~= nerovná se

24. Vztah koncipování rešeršní strategie k množinám, principy a charakteristika Vennových diagramů

STRATEGIE VYHLEDÁVÁNÍ
STRATEGIE VYHLEDÁVÁNÍ je vhodná cesta, jež vede k nalezení řešení určitého problému pomocí různých zdrojů, ať už v knihovnách nebo z databázových zdrojů. Tato strategie zahrnuje:
• identifikaci hlavního cíle a ostatních parametrů pro vyhledávání (časové období, typy dokumentů, jež mají být vyhledány, příp. jiné faktory, jako jak rychle je třeba najít odpověď),
• napsání seznamu termínů a jiných vyhledávacích klíčů, které se použijí (např. chemické struktury, jména autorů, jména sloučenin atd.),
• rozhodnutí, které zdroje by pravděpodobně obsahovaly odpovědi
• prohledávání tištěných prací nebo databází, dokud nenajdeme odpověd nebo dokud nezjistíme, že žádnou odpověď nelze v dostupných zdrojích nalézt.
Vennovy diagramy:
• zobrazovací metoda (graficky v rovině), prostřednictvím Booleovských operátorů
• slouží k větší názornosti řešení množinových situací

Vennovy diagramy:


Valná většina modelů, na nichž jsou vybudovány systémy pro vyhledávání informací, by mohla být interpretována v geometrické podobě ve formě planárních Vennových diagramů .
Pomocí těchto diagramů lze v podstatě zobrazit valnou část pomocných návodů , zpravidla připojených ve formě odkazu označeného jako “ pomoc” uživateli ( tzv. HELP) při hledání informací na Internetových serverech.

25. Omezení a kritika booleovského modelu vyhledávání
viz. také otázka č. 23

Logický model, Booleovský (nejstarší typ)
– pomocí operátorů Booleovy logiky AND, OR, NOT, (XOR)¨
– Vyhledavač vrací ty doku, které splňují zadaná logická omezení.
Výhody – možnost velmi přesného vymezení vrácených doku
Nevýhody
- neumožňuje vzít do úvahy důležitost termínu v doku
- neumožňuje vzít do úvahy důležitost termínů v dotazu
- nabízí jen hrubou škálu (doku vyhovuje nebo ne)
- nemožnost kontrolovat velikost výstupu – vrácených doku (žádné x moc – přeformulovat dotaz), netriviálnost správné formulace složitějších dotazů, nemožnost seřazení podle relevance. Pouze dvě skupiny – relevantní a nerelevantní. Některá z těchto omezení byla odstraněna rozšiřujícími modely postavenými na teorii fuzzy množin(Ale spíše se rovnou používá model vektorový).
Fuzzy rozšíření – využití více hodnot než jen TRUE a FALSE (vážené termíny)

Nepřesné výsledky
Nedovoluje rozlišit důležitost termů dotazů
Nelze řídit velikost výstupu dotazu
Nelze automaticky modifikovat dotaz na základě odpovědi
Nedokonalá formulovatelnost dotazu
Přílišná ostrost operátoru AND



26. Jiné modely vyhledávání (mimo booleovský model)
Vektorový model
Metoda reprezentace dat pomocí vektorového modelu je přibližně o dvacet let mladší než předchozí. Hlavním rysem vektorového modelu výběru je reprezentace záznamů reprezentujících dokumenty i uživatelských dotazů pomocí vektorů.
Příklad 5.3: Představme si, že se pohybujeme v databázi, kde množina termů, podle kterých se dá vyhledávat je:
databáze, term, koeficient přesnosti, koeficient úplnosti, zpracování textu. Nechť databáze obsahuje tři záznamy (texty) obsahující (víceslovné) termy:
(1) databáze, term, koeficient úplnosti,
(2) koeficient úplnosti, koeficient přesnosti
(3) databáze, zpracování textu Reprezentace těchto záznamů pomocí vektorů je:
DJ: (1,1,1,0,0) D2: (0,0,1,1,0) D3: (1,0,0,0,1)
kde 1, resp. 0 sděluje fakt, že daný term existuje, resp. neexistuje v záznamu. Uvažujme dotaz na dokumenty s termy "databáze" a "zpracování textu". Jeho vektor bude (1,0,0,0,1). Vyzkoušíme-li v Boolovském stylu dotaz (konjunkce) vzhledem k záznamům, zjistíme, že dokument (3) je hitem. Zajímavý však může být i dokument (1), obsahuje term databáze, dokument (2) je zřejmě nerelevantní. Tato fakta lze ale též zjistit ekvivalentním způsobem, vynásobíme-li vektor dotazu skalárně s vektory databáze, tj. např. (1,1,1,0,0). (1,0,0,0,1) = 1. Postupnou aplikací součinu obdržíme čísla 1, 0, 2 a můžeme tedy seřadit dokumenty do pořadí (3), (1), (2).

Fuzzy množiny
V [Za73] L. A. Zadeh formuloval „princip nekompatibility": Roste-li složitost systému, klesá naše schopnost formulovat přesné a významné soudy o jeho chování, až je dosaženo hranice, za níž jsou přesnost a relevantnost prakticky vzájemně se vylučující charakteristiky.
Mocný nástroj umožňující člověku dosti obsažný, avšak ne úplně přesný popis reality, je přirozený jazyk. Vedle mnohotvárnosti je jeho hlavní síla ve schopnosti funkčně používat vágní pojmy. Každý vágní pojem charakterizuje určitou třídu objektů, jejíž hranice bychom však velmi těžce určovali.
Teorii fuzzy množin lze chápat jako formalizaci vágnosti. Základní myšlenka je velmi jednoduchá a poměrně přirozená. Nejsme-li schopni stanovit přesné hranice třídy určené vágním pojmem, nahraďme rozhodnutí o náležení daného prvku do ní mírou vybíranou z nějaké škály. Každý prvek bude mít přiřazenu míru vyjadřující jeho místo a roli v této třídě. Bude-li škála uspořádaná, pak menší míra bude vyjadřovat, že daný prvek je někde blíže okraji třídy. Tuto míru nazveme stupněm příslušnosti prvku do dané třídy a třídu, v níž každý prvek je charakterizován stupněm příslušnosti do ní, nazveme fuzzy množinou.
Příkladem budiž predikáty VYSOKÝ, STARÝ, BOHATÝ. Pomocí těchto predikátů chceme kategorizovat objekty tak, abychom mohli klást dotazy na databázi, obsahující data o těchto objektech. Klasické množiny však mají při použití v kategorizaci objektů značné nevýhody. Rozhodnout např. náležení do množin VYSOKÝ, STARÝ nebo BOHATÝ vyžaduje stanovit nějakou prahovou hodnotu. Např. bohatá osoba je taková, která má roční příjem vyšší než 600.000 Kč. To znamená, že osoba vydělávající 599.999 Kč již nepatří do množiny BOHATÝ. Pomocí fuzzy množin lze dosáhnout, že osoba s příjmem 500.000 Kč patří do množiny BOHATÝ s jistým stupněm příslušnosti.
Nechť U je množina, kterou budeme nazývat univerzem. Uvažujme diskrétní fuzzy množinu VYSOKÝ, přičemž

U = {165, 170, 175, 180, 185, 190, 195, 200} a
VYSOKÝ = {0/165, 0.2/170,0.5/175,0.7/180, 1/185, 1/190, 1/195, 1/200},



kde pro každý pár hodnot první člen znamená stupeň příslušnosti. Fuzzy množina je zadána pouze výčtem, což nemusí být pro použití příliš účinné. Obecnější přístup předpokládá vhodnou funkci. Obrázek 6.3 nabízí nejjednodušší možnost pro daný příklad. Sám Zadeh však zkonstruoval jiné funkce. Patří mezi ně např. tzv. S-funkce (po částech kvadratická funkce) definovaná jako

pro x <a
pro a < x < (a + P)/2 pro (a + p)/2 < x < p pro x > p

S{x, a, P) =0
= 2*((x-a)/(P-a))2 = 1 - 2*((x-p)/(p-a))2

i
S-funkce je základem mnoha funkcí, jako např. okolo{x, x) definovaná jako
okolo(x, x) = S(x, x - 8, x) pro x < x
= 1 -S(x, x, x + 8) pro x > x

1.0
Av
0.7
0.5
160
170 175 180 185
Výška v cm Obr. 5.3: Spojitá funkce popisující fuzzy množinu VYSOKÝ
27. Hypertext a vyhledávání informací, čím změnil aplikovaný hypertext rešeršní systémy?
V síťové struktuře dnešních systémů jsou běžně uplatnitelné hypertextově orientované struktury, které nově ovlivnily vyhledávací metody a rovněž chování uživatelů při vyhledávání informací (např. „browsing“ VERSUS „analytické“ způsoby vyhledávání). V budoucnu se dá předvídat širší uplatnění i dalších technologií, jako jsou např. neuronové sítě aplikované do informačních sítí a prostředků vyhledávání. To umožní koncovému uživateli pracovat s informačními systémy ještě samostatněji a cíleněji.
Uživatel si požadavek zpracovává samostatně bez asistence informačního experta, což mu dnes v případě neznalosti dotazovacího jazyka umožňují systémy řízených menu, anebo graficky orientovaná rozhraní, často dnes na bázi hypertextu, s prvky intuitivního ovládání apod.
Každé databázové centrum má kromě klasického („konzervativního“) přístupu na úrovni textového režimu, který vyhovuje pokročilým uživatelům zvládajícím příkazový jazyk, také hypertextově orientovaný WWW přístup. Hypertextově orientované rozhraní se zavádělo v posledních letech a jednotlivá světová databázová centra se doslova předháněla, čí nabídka bude v rozhraní WWW úplnější a s kvalitnějšími vyhledávacími rozhraními.
Hypertext, který sice odpovídá přirozenosti lidského myšlení asociovat další myšlenky, v tomto případě je umožněn přechod na další informační uzly a hypertextové odkazy, může působit více psychických problémů při technice vyhledávání informací zvané browsing (prohlížení, listování) proti cíleným vyhledávacím analytickým strategiím (např. s využitím dotazovacího jazyka při rešeršních strategiích).
Nezbytná je také pro účely vizualizace informací na zobrazovacích jednotkách terminálů strukturace informace do „podobných“ struktur uživatelova myšlení (je-li to možné a je-li známa například cílová skupina – příklad vědec-chemik, vědec-lékař, obchodník, student-středoškolák, student - vysokoškolák technického typu, předškolní dítě atd.). Poznání mentálních modelů uživatele je podstatné a existuje několik metod, jak toho dosáhnout, nebo respektive přiblížit se výsledku co nejvíce objektivnímu. Všichni účastnící komunikace musí znát model protější strany, jinak dorozumění není možné. Doporučuje se model, který analyzuje spíše individuálního uživatele, než tzv. typického. Implicitní modely jsou vhodné pak tam, kde uživatel není schopen přesně specifikovat informační požadavky.
Mentální modely a jejich metody poznávání hrají úlohu při koncipování bází dat textových a obrazových a jejich vztahu k metodám vyhledávání. HCI tuto problematiku rovněž sleduje a prakticky se poznatky realizují při vývoji interaktivních multimediálních systémů. Informační věda se touto problematikou rovněž zabývá.
Nepříznivé stavy způsobené přehlcením nebo špatnou organizací informací jsou pak zesilovány dalšími faktory, např. psychologickým typem člověka, jeho odolností, zkušeností. Slabší typ (např. převaha typu melancholika v osobnosti) je jistě ohrožen více než silnější (např. převaha typu sangvinika, flegmatika).
Proto dodržování určitých ergonomických zásad v komunikaci s koncovým uživatelem je ze strany producenta dialogového systému také otázkou marketingovou. Podobně je vidět i chování uživatelů Internetu při návštěvách webovských prezentací (jde také o vyhledávání, například na úrovni browsingu). Existuje „syndrom 20 sekund“, kdy uživatel je ochoten čekat na odezvu. Jinak je stresován a opouští komunikaci přechodem na jiný objekt.

28. Uživatelské rozhraní a jeho význam v problematice vyhledávání informací
Uživatelské rozhraní má 2 základní složky:
• fyzickou (vstupní/výstupní zařízení, nástroje selekce a zpětné vazby)
• konceptuální (dotazovací, resp. příkazové jazyky, menu, postředky přímé manipulace, systémy pracující s ikonami, formulářové rozhraní, prvky inteligentního rozhraní)
Můžeme uvažovat i rozhraní v běžném reálném světě, nejenom ve vztahu k počítačovému (informačnímu) systému, a jmenovat činnosti, které rozhraní vyžadují - ovládání telefonu a dalších služeb telekomunikačního průmyslu, ovládání prostředků masové komunikace (televizní nebo rozhlasový přístroj), rovněž “elementární” záležitosti jako ovládání výtahu, spuštění mikrovlnné trouby, řízení automobilu mají uživatelské rozhraní. Velmi inspirativní je v tomto případě publikace D. A. NORMANA z roku 1988 s názvem The Design of Everyday Things. V tomto textu uvažujeme jen o rozhraní mezi člověkem a informačním systémem (počítačem).
Komunikace s objekty (např. s dialogovými informačními systémy) má 2 základní přístupy, které rozdělujeme a posuzujeme na základě:
• předchozích zkušeností
• očekávání, jak systém bude pracovat při jeho užití
Aby koncový uživatel mohl se systémem komunikovat přes přátelsky orientované uživatelské rozhraní (user-friendly interface), je nutná ze strany tvůrců, “architektů” a projektantů informačního systému znalost oboru interakce člověk-počítač (human-computer interaction) v souvislosti s návrhem a vytvářením informačních systémů (information design). Uživatelské rozhraní můžeme velmi jednoduše definovat jako komunikační kanál mezi uživatelem a systémem.
Kvalita uživatelského rozhraní podmiňuje vztah uživatele ke zpřístupňovanému systému (např. k databázi). Optimální uživatelské rozhraní by mělo umožnit uživateli vyhledávat v dialogovém systému i bez znalosti informační problematiky, resp. také výpočetní techniky. Systém se má přizpůsobit uživateli, ne uživatel systému. Kritéria optimálnosti uživatelského rozhraní mohou být:
• snadná příprava na dialog
• koncentrace na základní úkoly
• snadná kontrola
• spolehlivost
• vhodná struktura vysvětlujících poznámek, nabídek a nápověd
• malá možnost chyby při dialogu
V každém případě, uvažujeme-li uživatelské rozhraní pro interaktivní režim, máme bezvýhradně na mysli generace uživatelsky přátelských rozhraní a systémů (user-friendliness, user-friendly). Stanovení principu tzv. přátelskosti je však vágním vyjádřením a neexistují přesné specifikace, co je “ještě přátelské” a co “už ne”. Teprve po rozšíření dialogových systémů je možno rozumět termínu user-friendliness například takto:
• jako synonymum k pojmu “snadný k užívání”
• jako naznačení prvořadého cíle
• jako vykazování kvality “lidského přátelství”, tj. existuje předpoklad, že vztah člověk - počítač je interpersonální povahy a komunikace by měla být s ním příjemná
29. Typologie uživatelských rozhraní
Uživatelské rozhraní a jeho návrh může respektovat nejen mezinárodní zvyklosti, ale zaměřovat se i na cílovou skupinu regionální. Přístupy, rozsah rozhraní, to vše je rozmanité. Podmínkou zůstává orientace na uživatele (člověka).
S využitím některých názorů T. MANDELA [1997] je možné sumarizovat, co se očekává od tvorby uživatelského rozhraní informačních systémů, a to směrem k tvůrcům i k uživateli:

kvalita systému

porozumění uživateli

efektivní vytváření rozhraní

schopnost změn a schopnost se učit

adekvátnost a účelnost

upotřebitelnost

snadná použitelnost a ovladatelnost

estetický zážitek

Při tvorbě uživatelského rozhraní se pro usnadnění výše uvedených očekávání může přistupovat k jeho návrhu a vytváření ze 3 pohledů – modelů, které mohou hledat přirovnání, metaforu, ve stavbě domu [MANDEL, 1997, s.25-36].

Modely pak můžeme rozdělit na:

Mentální model uživatele, jehož hlavním smyslem je, že informační systém musí vyhovovat především z pohledu uživatele a jeho mentálního světa. To, co je uvnitř mozku uživatele, není snadné přenést mimo něj a navíc mentální svět popsat a formalizovat. K tomuto mentálnímu modelu světa uživatele se můžeme dostat cílenými otázkami, úlohami, dialogem s ním, ať skutečným nebo potenciálním uživatelem, zpětnou vazbou a testováním.

Model programátorský je v podstatě nejjednodušší, protože jej lze zviditelnit a definovat, specifikovat. Vytváření tohoto modelu se dá přirovnat ke stavbě domu a programátor je v roli stavitele.

Model tvůrce, projektanta – „architekta“ je možno přirovnat k roli architekta, který navrhuje dům. Činnosti jsou porovnatelné. Je to model „vyvážený“, na „střední cestě” mezi uživatelem a programátorem.

Je možno také naimplementovat různá a pro nás výhodná uživatelská rozhraní na protokol Telnet či jiné protokoly používané pro bezpečnou práci ze vzdálených míst (např. u centra STN International je to jejich speciálně pro jejich uživatele vyvinutý komunikační software STN Expres - výhodné pro práci s patentovými, chemickými a farmaceutickými databázemi, které obsahují jednoduchou grafickou informaci v podobě nákresů, chemických strukturních vzorců apod., dále z důvodu jednoduše nadefinovaného automatického připojení se a „zalogování se”, které ovládáme přes tzv. funkční klávesy), čímž se ušetří finanční prostředky za použití komutovaného spojení (přímé přes telefonní linky) nebo za vstup do profesionální sítě (u nás např. NEXTEL).
Databázová centra však oslovila koncového uživatele aplikací WWW rozhraní na přístup do svých zdrojů. V tomto rozhraní jsme vedeni k výsledku, aniž bychom museli dokonale znát dotazovací jazyk, někdy ani ne zásady rešeršní strategie, nicméně znalosti obého jsou výhodou. WWW rozhraní pak obvykle pracují s “basic” formou a “advanced” formou, tedy pokročilý uživatel nemusí být unavován pomalými nebo méně dokonalými postupy začátečníka. Výstupy je pak možné obdržet ve vícero formátech, novinkou je právě výstup do HTML nebo RTF formátů. Oproti výstupům do „konzervativního“ TXT formátu, resp. někdy do DBF formátu, je to velký pokrok před několika lety nemyslitelný.

30. Analytické metody vyhledávání; intuitivní metody vyhledávání
Vyhledávací systémy na Internetu (search engines) nepracují zcela běžně s pokročilými metodami vyhledávání na principu používání „vyšších“ operátorů - například proximitních (příkladem za všechny je AltaVista: http://www.av.com, http://altavista.digital.com). V poslední době se u vyhledávacích nástrojů pro internet projevuje odklon od analytičtějších způsobů vyhledávání. Je to však i mnohdy výhodné: tvůrci totiž sázejí na intuitivní způsoby vyhledávání (za desítky možností příklad vyhledávacích internetovských prostředků: http://www.google.com nebo http://askjeeves.com).
Příkladem orientace IS/IT ke koncovému uživateli z pohnutek konkurenčních mohou být dnešní dialogové (on-line) služby databázových center. Služby center a metody přístupu k nim jsou dnes zásadně postaveny na přívětivém uživatelském rozhraní na principu grafického rozhraní (graphic user interface, GUI). Každé databázové centrum má kromě klasického („konzervativního“) přístupu na principu textového režimu, které vyhovuje zejména pokročilým rešeršérům, kteří ovládají příkazový (dotazovací) jazyk, také hypertextově orientovaný WWW přístup. Hypertextově orientované rozhraní se zavádělo v posledních letech a jednotlivá světová databázová centra se doslova předháněla, čí nabídka bude v rozhraní WWW úplnější a s lepšími vyhledávacími rozhraními. Příklady však nemusíme hledat jen u databázových center, ale velmi poučný je i vývoj v oblasti automatizovaných katalogů (OPAC). Existuje i několik studií, které se zabývají vlivem uživatelského rozhraní na koncového uživatele [např. PETERS, 1991]. Můžeme hovořit, že došlo k integraci dialogových informačních systémů s hypertextově orientovaným prostředím, což umožňuje uživateli snadnější přístup k informacím, jejich volnější a méně formalizovaný výběr a zároveň realizaci nejrůznějších kombinací založených nejen na analytickém přístupu k vyhledávání, ale i na intuitivních postupech v rešeršním procesu.
Uživatel si požadavek zpracovává samostatně bez asistence informačního experta, což mu dnes v případě neznalosti dotazovacího jazyka umožňují systémy řízených menu, anebo graficky orientovaná rozhraní, často dnes na bázi hypertextu, s prvky intuitivního ovládání apod.

31. Vysvětlení tzv.prohlížení (browsing strategy), kdy ano,kdy ne, vztah ke kognitivnímu modelu uživatele a k hypertextu
Uživatel je často přehlcován informacemi z obrazovek počítačů nebo dialogových informačních systémů. Může k tomu přispívat i nevhodný design informací prezentovaných na displeji, nejenom například technická kvalita výstupního zařízení.
Otázka formátů, množství informací, které jsou pak prezentovány softwarovými produkty a jsou výsledkem například prezentovaných výstupních formátů z dialogového systému, které komunikují směrem k uživateli a které respektují např. i jeho paměťové schopnosti (například parametry krátkodobé paměti), přehlednost informací, strukturovanost informací, jsou otázky velmi podstatné. Stejně tak vývoj nových rozhraní v laboratořích HCI včetně již zmíněného hlasového vstupu/výstupu, světelných per, třídimenzionálních displejů a dalších vizualizačních pomůcek. Doporučení jsou již často formulována, podložena navíc experimenty v laboratořích HCI. Dialogové systémy by měly respektovat fyziologické a psychické schopnosti člověka, nebo ještě lépe cílové skupiny uživatelů systémů (např. děti v roli vyhledávajících v dialogových systémech typu encyklopedie). Souvislost s nadměrným množstvím informací, které přetěžují naši psychiku, je nesporná.
Jako příklad takového informačního systému přehlceného podněty mohu uvést hypertext obecně, k němuž je potřeba přistupovat s jistou vyhledávací strategií a nenechat se dezorientovat. Hypertext, který sice odpovídá přirozenosti lidského myšlení asociovat další myšlenky (v tomto případě je umožněn přechod na další informační uzly a hypertextové odkazy), může působit více psychických problémů při technice vyhledávání informací zvané browsing (prohlížení, listování) proti cíleným vyhledávacím analytickým strategiím (např. s využitím dotazovacího jazyka při rešeršních strategiích).
Nezbytná je také pro účely vizualizace informací na zobrazovacích jednotkách terminálů strukturace informace do struktur “podobných” uživatelovu myšlení (je-li to možné a je-li známa například cílová skupina - příklad vědec-chemik, vědec-lékař, obchodník, student-středoškolák, student-vysokoškolák technického typu, předškolní dítě atd.). Poznání mentálních modelů uživatele je podstatné a existuje několik metod, jak toho dosáhnout, nebo respektive přiblížit se výsledku co nejvíce objektivnímu. P. J. DANIELS vytváří hodnotící přehled mentálních a kognitivních modelů a zdůrazňuje, že všichni účastníci komunikace musí znát model protější strany, jinak dorozumění není možné. Doporučuje se model, který analyzuje spíše individuálního uživatele než tzv. typického. Implicitní modely jsou vhodné pak tam, kde uživatel není schopen přesně specifikovat informační požadavky.
Mentální modely a jejich metody poznávání hrají úlohu při koncipování bází dat textových a obrazových a jejich vztahu k metodám vyhledávání. HCI tuto problematiku rovněž sleduje a prakticky se poznatky realizují při vývoji interaktivních multimediálních systémů. Informační věda se touto problematikou rovněž zabývá.
Nepříznivé stavy způsobené přehlcením nebo špatnou organizací informací jsou pak zesilovány dalšími faktory, např. psychologickým typem člověka, jeho odolností, zkušeností. Slabší typ (např. převaha typu melancholika v osobnosti) je jistě ohrožen více než silnější (např. převaha typu sangvinika, flegmatika).
Poznávání (cognition) můžeme chápat jako interpretaci informací pocházející z okolního světa a přijímanou našimi smyslovými analyzátory.
Problematika kognitivních funkcí je částečně sledována informační vědou. Zejména tam, kde tušíme rozhraní oboru informační věda s umělou inteligencí, a také pochopitelně na rozhraní s počítačovou vědou a tradičně s psychologickými disciplínami. Aplikací mohou být např. neuronové sítě, které sehrají velkou budoucí roli ve vyhledávacích a učících se (znalostních) systémech. Modelování neuronových sítí se stalo novou mezioborovou disciplínou a její rozhraní s human-computer interaction a informační vědou je odvoditelné a tušitelné.
Problematikou kognitivních funkcí se průřezově k problematice komunikace člověk - počítač zabývá i obor human-computer interaction [FAULKNER, 1998]. HCI se zajímá o fyziologickou a psychickou složku poznávacích procesů. Počítačové a informační systémy dnes komunikují na úrovni všech lidských smyslů, které náš okolní svět mapují, tedy:
• zraku
• sluchu
• chuti
• čichu
• hmatu
Pochopitelně úroveň poznání k jednotlivým smyslovým analyzátorům je rozlišná a různorodě naplněná co do počtu výzkumných aktivit. Nejvíce poznatků je shromážděno k problematice percepce informací zrakem. Vizualizační schopnosti dnešních informačních systémů jsou pokročilé a jsou předmětem zkoumání mnoha týmů laboratoří HCI ve světě. Informační vizualizace je reálnou oblastí, kam dnes směřuje i zájem bibliografických, faktografických a plnotextových bází dat, hybridních systémů, digitálních knihoven a speciálních softwarových podpor vyhledávání informací. Principem je, že lidské oko (zrak) interpretuje zobrazená (vizualizovaná) data podstatně rychleji a mnohem efektivněji než text.
Informační vizualizace (information visualization) má v současnosti jako sub-disciplína oboru human-computer interaction 2 základní směry výzkumu:
• interakci člověk - počítač
• vyhledávání v rozsáhlých databázích
Oblast human-computer interaction není zaměřena jen na komunikaci zrakem přijímaných informací, přestože zrakem v podstatě přijímáme více než 90-95 % informací z okolního světa, které jsou později zpracovány v mozku. Systémy pracující na jiných smyslových úrovních jsou rovněž zkoumány, ale jejich aplikační pole je úměrné ekonomickému prostředí a zázemí pro jejich výzkum.

32. Vztah HCI a rešeršních systémů, v čem je základní vzájemné ovlivnění


33. HCI jako disciplína se vztahem k informační vědě a k vyhledávání informací
Má HCI vztah k informační vědě? Domnívám se, že úzký. Ve světě je rovněž chápán (možná i působením jeho představitelů v expertních strukturách a skupinách informační vědy) jako obor s vazbami a rozhraním k informační vědě. V zahraničí se touto problematikou zabývá pravidelně celá řada periodik z oblasti informační vědy nebo s ní hraničních periodik [viz např. DAVIES, 1992; NORTON, 1992; SOUTTAR, 1995; CARROLL, 1997; SHACKEL, 1997; BASTIEN, 1999] a řada autorů, kteří publikují některé své rozsáhlejší práce na rozhraní informační vědy a HCI [výběrově SHNEIDERMAN, SHACKEL, MARCHIONINI] a někteří z nich v rámci univerzit přednášejí na školách informační a knihovní vědy.
Human-computer interaction zkoumá “koncového uživatele” velmi detailně. Koncový uživatel a jeho okolí (a také jeho chování nebo informační potřeby) jsou rovněž zkoumány informační vědou a zaměřují se na něj aplikačně informační služby, které rovněž informační věda zkoumá a navrhuje jejich koncepci a optimalizaci. M. KÖNIGOVÁ [1984, s. 41-56] ve vztahu ke konstrukci informačního systému VTEI (tj. vědeckých technických a ekonomických informací) přímo deklaruje, že uživatel je v podstatě centrálním a určujícím činitelem celého informačního systému. Bez respektování potřeb konkrétních uživatelů systém pracuje do jisté míry naprázdno a z hledisek ekonomických neefektivně.
Uživatel komunikace informací (například vědeckých, technických a ekonomických) coby předmět a cíl zkoumání oboru informační a knihovní vědy se u nás odráží publikačně např. v pracích I. WIESENBERGERA nebo A. MERTY, či V. SMETÁČKA, a přestože jde o “klasické” představitele tohoto oboru u nás a jejich práce zaměřené na uživatele a jejich chování v informačních procesech byly psány před několika desetiletími, na jejich analýzy uživatelů a informačních potřeb uživatelů se dá v mnoha směrech navazovat i dnes.
Koncový uživatel je intenzivně zkoumán oborem HCI v několika jeho oblastech, ale zejména je to v oblasti zvané uživatelské rozhraní. S pojmem “koncový uživatel” je spojena rovněž oblast návrhu a projektování [např. KÖNIGOVÁ, 1984; ROWLEY, 1990; JANČAŘÍK 1983] informačních systémů. Podobné zájmy má i informační věda, a to nejen v projekční části, ale později ve zkoumání a vyhodnocování užívání systémů koncovým uživatelem.
Není pochyb, že uživatelské rozhraní, coby prostředník komunikace mezi informačním systémem (počítačem) a uživatelem (člověkem), ovlivnilo zájem o vyhledávání v informačních systémech a v elektronických zdrojích typu bází dat. Éra současného rozvoje internetu tuto oblast jenom umocnila v podobě nástupu nových vyhledávacích prostředků a rozhraní v komunikaci klient/server, která je pro internet charakteristická. Rozhraní “information science” a “human-computer interaction” jsou zřetelná a budou se více a více naplňovat a propojovat.
34. Dotazovací (příkazové) jazyky, jejich význam, srovnání, příklady, typologie příkazů, vlastnosti, struktura dotazovacího jazyka
V případě, že chceme položit určitý dotaz ( a nepoužíváme přitom některé z předem připravených témat) musíme zadat jeho text do dotazového pole. Toto pole se nachází většinou v úvodní stránce (a je určeno pro rychlé, jednoduché vyhledávání). Pro složitější vyhledávání lze využít jednoho z vyhledávacích formulářů.

Samotný text dotazu může mít samozřejmě řadu podob. Nejjednodušší dotaz představuje jediné slovo nebo slovní spojení - tzv. fráze. Při zadávání složitějších a víceslovných dotazů je již nutné použít logické operátory (AND,OR, NOT a další), popř. jejich zástupné znaky.

základní dotazovací možnosti je nejlépe ilustrovat na několika příkladech:

počítač
vyhledá dokumenty, které obsahují různé gramatické tvary zvoleného slova (počítačem, počítačový apod.).


Booleovské operátory

počítač OR tiskárna
vyhledá dokumenty, které obsahují různé gramatické tvary slov "počítač" nebo "tiskárna", nebo obou. Operátor OR lze nahradit znakem "," - čárka.

"osobní počítač" OR "přenosný počítač"
vyhledá dokumenty obsahující různé gram. tvary frází "osobní počítač" nebo "přenosný počítač", nebo obou.

(počítač, tiskárna) AND modem
vyhledá dokumenty, které obsahují různé gramatické tvary slov "počítač" nebo "tiskárna", nebo obou. A zároveň s nimi nebo alespoň s jedním z nich i slovo "modem".

(počítač AND modem) NOT tiskárna
vyhledá dokumenty, které obsahují různé gramatické tvary slov "počítač" i "modem" a zároveň neobsahují slovo "tiskárna".

počítač <NEAR> internet
vyhledá dokumenty obsahující různé gramatické tvary slov "počítač" i "internet" a seřadí je podle textové vzdálenosti mezi těmito slovy.


Hvězdičková konvence

internet*
využití tzv. hvězdičkové konvence - vyhledá dokumenty, které obsahují slova začínají na "internet", tzn. internetem, internetová apod.

*net opačný způsob využití funkce hvězdičkové konvence - vyhledá dokumenty obsahující slova končící na "net", tzn. internet, intranet, arpanet apod.


Otazníková konvence

??měr
vyhledá dokumenty, které obsahují slova končící na "měr" a sestávající se z 5 znaků, např. záměr, výměr, poměr atd.


Vyhledávání podle obsahu polí

Zdroj="Computerworld" AND Strana=16
vyhledá všechny dokumenty, které jsou na straně 16 v časopise Computerworld.

Zdroj="Nova" AND Moder=Zuna
vyhledá "dokumenty", které na TV Nova moderoval Pavel Zuna.

Nazev <CONTAINS> internet
vyhledá dokumenty, které mají v názvu slovo internet. (operátor <CONTAINS> lze nahradit znakem #).

Nazev <STARTS> internet
najde dokumenty, jejich název začíná slovem internet.

Nazev <ENDS> internet
tímto způsobem jsou vyhledány takové dokumenty, které slovem "internet" končí.

Text dotazu lze dále rozšířit o vyhledávání pomocí dalších polí. Volby pro rozšířené hledání obsahuje "Rozšířený formulář":



1. sloupec - přesnost vyhledávání.
je-li zaškrtnuto slovo "Přesně" v příslušném řádku, je požadován přesný výskyt daného výrazu ve vybraném poli, v opačném případě postačí libovolný výskyt.

2. sloupec - logická vazba
jedná se o logickou vazbu na předchozí část dotazu.

3. sloupec - dotaz do daného pole
zde znamená výraz, který se bude hledat v příslušném poli uvedeném v posledním sloupci.

4. sloupec - hlavičkové pole
jedná se o výběr pole pro hledání. Pro výše uvedený příklad má automaticky sestavený text dotazu podobu následující: (((Relace = Události) <NOT> (Moder <CONTAINS> Janeček)) <OR> (Autor <CONTAINS> Souhradová))
Z39.50
Z39.50 je standardizovaný aplikační protokol, který specifikuje komunikaci mezi klientem a serverem při vyhledávání informací v databázích a umožňuje také přejímání dat z databází.
Základní kroky komunikace:
Klient Z39.50 naváže spojení
Spojení navazuje klient zasláním tzv. Init požadavku, kterým se představí serveru a ve kterém navrhuje hodnoty parametrů (např. verze protokolu, ověření identity, podporované operace, maximální délka zprávy) nezbytných pro vytvoření Z39.50 relace tj. navázání interaktivní komunikace mezi konkrétním Z39.50 klientem a jiným konkrétním Z39.50 serverem.
Server Z39.50 odpoví
Server zareaguje zasláním Init odpovědi, ve které oznamuje klientovi své hodnoty parametrů a informuje ho, zda souhlasí s vytvořením Z39.50 relace.
Klient formuluje a odešle dotaz
Následně klient zformuluje dotaz a odešle jej jako tzv. Search požadavek.
Server hledá v databázích a zašle odpověď
Server prohledá databáze, vytvoří si množinu výsledných záznamů a odpovídá zasláním počtu prvků této množiny v Search odpovědi. V závislosti na počtu nalezených záznamů může tato odpověď obsahovat také některé či všechny nalezené databázové záznamy. Ostatní nalezené záznamy jsou pro klienta k dispozici prostřednictvím dodatečných dotazů, tzv. Present požadavků, po kterých následují Present odpovědi serveru obsahující požadované záznamy.
Ukončení spojení
Proces ukončení Z39.50 relace může zahájit jak klient, tak server, a to zasláním Close požadavku a obdržením Close odpovědi.
Jiné operace Z39.50
Kromě výše uvedených služeb Init, Search a Present nabízí protokol Z39.50 mnoho dalších operací, jako např. vyhledávání v uspořádaném seznamu (služba Scan), setřídění či zrušení množiny výsledků (služba Sort, resp.Delete), ověřování totožnosti klienta (služba Access-control), zasílání služebních informací (služba Resource-control), atd. Databázové záznamy musí vyhovovat některému z registrovaných formátů, přičemž 2. verze protokolu Z39.50 z roku 1995 podporuje patnáct především MARC-formátů (UNIMARC, USMARC, UKMARC, NORMARC, apod.).
Jako přenosová syntaxe záznamu je podporována struktura záznamu pro výměnu dat podle normy ISO 2709.
DOTAZOVÁNÍ PŘES Z39.50 NA PŘÍKLADU
K tomu, abychom problémy Z39.50 pochopili, musíme dobře chápat datové toky celého
procesu vyhledávání. Komunikace Z39.50 se skládá typicky ze 4 členů:
a) vyhledávací klient, který převezme od uživatele dotaz a předá ho klientovi Z39.50
b) klient Z39.50, který vysílá dotaz příslušnému serveru Z39.50
c) server Z39.50, který dotaz přijímá a předává ho vyhledávacímu stroji
d) vyhledávací stroj s datovým úložištěm, který provede vyhledávání
Typické je, že tyto členy mezi sebou nepoužívají na všech úrovních stejný komunikační
protokol, dotazovací jazyk ani formát dat. Často při předávání dat dalšímu členovi
komunikace provádějí konverze protokolu, dotazu i formátu. Pokud neexistují přesné
definice těchto konverzí, dochází ke zkreslení původního dotazu a vrácené výsledky mají
sníženou relevanci - vyhledávání funguje nekorektně.
Nejlépe si celý proces komunikace dotazu můžeme ukázat na příkladu vyhledávání z
katalogizačního klienta:
Vyhledávací klient
Katalogizátor si ve svém editoru spustí vyhledávání záznamu na vzdáleném
serveru Z39.50 na základě uvedení autora dokumentu, např. "Jiří Zikmund".
Protože daná knihovna používá formát MARC 21, vygeneruje katalogizační klient
dotaz, který můžeme zapsat např takto:
FIND 100$a="Zikmund, Jiří"
Klient Z39.50
Katalogizační klient předá dotaz klientovi Z39.50, při čemž provede konverzi
dotazu do syntaxe atributů Z39.50. K takové konverzi musí použít mapování polí a
podpolí MARC 21 do sady atributů Bib-1. Výsledný dotaz může vypadat takto:
FIND 1=1003 2=3 3=1 4=1 5=100 6=1 "Zikmund Jiří"
Pozn.: V tomto modelovém příkladu je jméno autora interpretováno jako fráze,
protože cílový server indexuje jména jako fráze. Z fráze byla odstraněna
oddělovací čárka.
Server Z39.50
Dotaz je zaslán vzdálenému serveru Z39.50 (klient Z39.50 i server Z39.50 musí
podporovat stejné atributy, jinak dojde ke ztrátě informace v dotazu). Aplikace
musí na serveru provést konverzi ze syntaxe atributů Z39.50 do dotazovacího
jazyka vyhledávacího stroje. Vyhledávací stroje pracují na velice rozdílných
principech a s různými datovými strukturami. Často se stává, že neumí přesně
interpretovat význam dotazu, není schopen takový dotaz realizovat nebo není
schopen vyhledávání provést v požadovaném čase. Pokud by vyhledávací stroj
pracoval nad relační dotabází, mohl by výsledný dotaz SQL s ohledem na
strukturu databáze vypadat např. takto:
SELECT COUNT(id) FROM knihy WHERE hl_autor = "Zikmund Jiří"
Vyhledávací stroj
Vyhledávací stroj spustí dotaz. Databáze je organizována tak, že bibliografické
záznamy v MARC 21 jsou uloženy jako celý plný text do jednoho pole a aplikace z
nich vytváří podle použitých pravidel uměle rejstříky na principu indexů. Ty poté
využívá k vyhledávání. V indexech se ztrácí informace o pozici údajů v
poli/podpoli, indexy jsou navíc společné pro více polí podle obsahu (např. autoři ze
všech relevantních polí).
Vyhledávací stroj zjistí, kolik záznamů vyhovuje dotazu. Následně vyhledá
35. Rešeršní strategie a taktika - objasnění a diskuse pojmů, strukturace, příklady
1. Zadání dotazu
2. Výběr selekčních prvků (klíčová slova, předmětová hesla) a předběžná formulace dotazu
Pozor! Anglická terminologie.
3. Výběr databáze podle oborového zaměření
4. Sestavení dotazu – kombinace selekčních prvků (použití operátorů Booleovy algebry - AND, OR, AND NOT, proximitních operátorů - např. SAME, NEAR, WITH, a operátorů krácení - např. *, ?, #)
5. Vyhledání záznamů
6. Posouzení relevance výsledků
7. Případné doladění dotazu (volbou dalších selekčních prvků nebo použitím dalších operátorů)
Pozor! Neplatí, že větší množství záznamů = vyšší kvalita rešerše.
8. Zobrazení, výběr, tisk, stáhnutí vyhledaných záznamů

• Zadání dotazu
chci vyhledat všechny publikace o korozích předpínací oceli
• Výběr selekčních prvků a předběžná formulace dotazu
za použití odborného slovníku si vyberu anglické výrazy – prestressed steel, také je možné použít ekvivalentní výraz prestressing steel, corrosion, oba tvary (tj. prestressed i prestressing steel) současně vyhledat a spojit se slovem corrosion
• Výběr databáze a prostudování nápovědy
jedná se o stavebnictví – vyberu databázi ICONDA, mohu případně přidat databázi COMPENDEX
nápověda je k dispozici on-line v databázovém centru DIALOG
• Sestavení dotazu
(prestressed steel OR prestressing steel) AND corrosion
• termíny zadám do pole Main Subject – systém bude vyhledávat v klíčových slovech a slovech z názvu
• termíny můžu zadat do pole Entire Text – systém bude vyhledávat v abstraktu, deskriptorech a názvu

• Vyhledání záznamů
výsledkem rešerše je 53 záznamů

• Posouzení relevance výsledků - rozbor
podle vybraného množství záznamů mohu dotaz omezit např. časovým obdobím nebo jazykem (nechávám v obrazovce zaškrtnuto pole English only a rozmezí let 1999 - 2001)

Prohlédnutím plné citace záznamu zjistíme, nakolik záznamy odpovídají našemu dotazu a jsou-li pro nás přínosné a významné a nebude-li třeba dotaz pozměnit - zpřesnit.
Záznam č. 1
Neobsahuje sice abstrakt, ale podle klíčových slov zjistíme, že odpovídá - tzn. je obsahově relevantní - našemu dotazu. Modře jsou označeny termíny, které byly zadány a které se ve vyhledaných záznamech vyskytují.
Otto Graf Journal. Annual journal on research and testing of materials. Vol.7, 1996 Forschungs- und Materialpruefungsanstalt Baden-Wuerttemberg -FMPA-, Otto-Graf-Institut, Stuttgart
(Editor)
Series: Otto-Graf-Journal; 7
248 p, figs.,tabs.,refs
Publisher: in-house publishing, Stuttgart
Published: 1996
Language: English
Summary Language: German
Document Type: Mongraph which is not commercially available; Irregular serial
Location Mark: DEIRB 0/97-4
Subjects:
permanent formwork
floor slab
glass fibre concrete
prestressing steel
fibre-reinforced concrete
structure waterproofing
protection against corrosion
prestressing
steel fibre
corrosion
ICONDA - International Construction Database
Copy 2001 Fraunhofer Informationszentrum Raum und Bau. All rights reserved. Dialog File Number 118 Accession Number 425526
Záznam č.2
Obsahuje i abstrakt. I v tomto případě je záznam obsahově relevantní. To je pro nás známkou toho, že jsme rešeršní dotaz zadali správně, použili jsme vhodně i operátory a výsledky této rešerše můžeme použít.
Refurbishment or demolition? : problems of P.C. skeleton buildings damaged by corrosion
Tassi G (Author) Szali K (Author); Orosz A (Author)
p.151-159
Publisher: Concrete Institute of Australia, (Brisbane, Qld.)
Published: 1995
Language: English
Summary Language: English
Document Type: Textual; Conference, meeting document
The paper deals with the general problem of what should be done if it becomes evident that a structure does not comply with requirements. It is demonstrated by the use of skeleton buildings with post-tensioned floors. The buildings load-bearing structure consists of precastelements possible with a monolithic stiffeningsystem. Corrosion damaged the prestressing steel. After describingthe structural system. the mode of deterioration is detailed. The future of the buildings is discussed from technical. economic and social points of view and differentmethods of strengthening are presented The paper concludes that the decision-making process in the case of a damaged structure is at best avery complex issue and that all the three mentioned points of view must be taken intoconsideration.
Subjects:
skeleton structure
renovation
renovation of old buildings
concrete corrosion
prestressing steel
building defect
load-bearing structure
safety
ICONDA - International Construction Database copy 2001 Fraunhofer Informationszentrum Raum und Bau. All rights reserved.
Dialog&reg File Number 118 Accession Number 424786

36. Etapy rešeršního procesu; analýza, rozbor, příklady
Rešerše: francouzský pojem le recherche – hledání
- celý informační proces, tj. stanovení rešeršní strategie, výběr zdrojů, konkrétních postupů při vyhledávání, hodnocení nalezených zdrojů z hlediska relevance a sumarizace nalezených odkazů do sekundárního informačního zdroje jako výsledku konkrétní dokument obsahující bibliografické odkazy na primární dokumenty, elektronické odkazy (URL) na fulltextové dokumenty a případně i faktografická data

rešerše faktografická
rešerše orientační
rešerše komplexní – ke zjištění úplného stavu poznání, dělí se dále na:
retrospektivní rešerši, tzn. že zpracovává všechny dostupné informace od minulosti do současnosti;
periodickou rešerši – zmapuje určité časové období (např. posledních 10 let);
průběžnou rešerši – sleduje nové informace průběžně tak, jak se v informačních zdrojích objevují.

Etapy rešeršního procesu
- formulace rešeršního dotazu (na preciznosti formulace rešeršního dotazu je závislý úspěch celé rešerše!), hlavní a vedlejší cíle;
- výběr zdroje (báze dat) –velmi důležité!!! - specifikace pramenů, v nichž budete informace hledat a jejich analýza;
- bibliografický průzkum (zadání dotazu, zjišťování a shromažďování informací)
lze hledat: v knihovních katalozích; v odborných bibliografiích a abstraktových databázích; ve faktografických publikacích či databázích; ve speciálních zdrojích (patentové databáze, legislativní databáze apod.); v prostředí internetu.;
- zpracování získaných informací a jejich vyhodnocení


Proces vyhledávání informací v dialogových systémech v širších souvislostech:


Rešeršní proces
Nejdříve je nutné si pečlivě vše promyslet a ujasnit, co máme hledat, v jakém rozsahu (časovém i odborném) a jaký má být cíl rešerše;
chronologicky postupujeme vždy od nejnovějších zdrojů zpět, často totiž nalezneme třeba přehledovou studii shrnující dosavadní stav poznání;
nalezené relevantní odkazy na sekundární informační zdroje zaznamenáváme tak, aby citace měla všechny náležitosti podle zvyklostí a norem a primární dokument byl podle ní jednoznačně identifikovatelný;
zaznamenáváme také, jaké zdroje jsme si již prohlédli (klíčová slova apod.);
při přejímání záznamů z referátových časopisů zaznamenáváme nejenom bibliografickou citaci, ale i číslo abstraktu a plnou citaci sekundárního zdroje;
výpisy z literárních zdrojů pořizujeme vždy v jazyce originálu (většinou v angličtině), abychom zabránili pozdějším pochybnostem o správnosti prvotního překladu;
během rešerše konfrontujeme nalezené informace s původním zadáním a dílčí poznatky konzultujeme s vedoucím práce (bakalářské či diplomové).
Příklad rešerše
Českou pivovarnickou firmu zajímá analýza trhu s pivem v sousedním Německu, protože se bude snažit o expanzi právě do tohoto prostředí. Nejraději by se dostala k nějaké podrobnější zprávě o struktuře trhu. Existuje nějaký zdroj, kde by se mohlo něco podobného vyskytovat? Po bližším studiu dokumentace na WWW DataStar se rozhodujeme pro Euromonitor Journals (MOJO) a vytvoříme jednoduchý dotaz pod Quick Search. Provádíme omezení hledání do titulu, aby šlo o nosné téma a aby o trhu s pivem nebyla jen drobná zmínka v textu. Časové omezení učiníme od května roku 1997. Při vlastním postupu využíváme nápovědy systému a zjišťujeme, že vyhledávání je velmi návodné a celkem jednoduché. Výsledek je překvapivý a přínosný. Lépe je provést objednávku celého dokumentu příkazem (ve webovském rozhraní to může být kliknutím na tlačítko) Order Selected Documents. Název dokumentu "German Market for Beer" ovšem není jediným dokumentem, který je možno získat, ale po nahlédnutí do obsahu dokumentu zjišťujeme, že už jiný dokument momentálně nepotřebujeme, protože tento plně odpovídá našim informačním potřebám a požadavkům. Jedinou relativně nepříjemnou záležitostí celé komunikace je cena dokumentu, která není nízká (v tomto konkrétním případě báze dat Euromonitor Journal se vypočítává cena za jednotlivé odstavce (paragraphs), které si mohu ovšem zvolit). Za informační služby této kvality se platit musí, ale cena rešerše na pozadí rozsahu obchodních aktivit nebo vývojových úkolů může být zanedbatelná a finanční zabezpečení informační činnosti se má plánovat a podporovat.

37. Tvorba tzv. konceptů, konceptuální analýza při realizaci rešerši, výhody a nevýhody
Konceptuální analýza a její vymezení
Co je to vlastně konceptuální analýza? Pokusme se ji vymezit následujícími tvrzeními:

1) Objektem jejího zájmu jsou objekty v reálném nebo abstraktním světě (objekty).
2) Zajímá se o vlastnosti těchto objektů (atributy).
3) Zajímá se o identifikaci těchto objektů (klíčové atributy).
4) Jejím zájmem je klasifikace těchto objektu dle různých společných vlastností (třídy).
5) Její zájmem jsou vztahy mezi těmito klasifikačními třídami (dědičnost).
6) Jejím zájmem je vzájemná strukturalizace těchto objektů (skládání).
7) Zajímá se o vzájemné vztahy mezi objekty a klasifikací těchto vztahů (vztahy obecné).
8) Všechny tyto aspekty považuje pro daný model za trvalé po dobu života jednotlivých objektů.

Uživatelské rozhraní má 2 základní složky:
- fyzickou (vstupní/výstupní zařízení, nástroje selekce a zpětné vazby)
- konceptuální (dotazovací, resp. příkazové jazyky, menu, postředky přímé manipulace, systémy pracující s ikonami, formulářové rozhraní, prvky inteligentního rozhraní)
V současné tzv. informační společnosti je jedním z největších problémů velké množství dat, do kterých „není vidět". Přitom bychom se rádi dozvěděli, co je v datech zajímavého. V posledních deseti letech se proto mohutně začala rozvíjet nová disciplína nazývaná data mining (dolování znalostí z dat). Formální konceptuální analýza je jednou z metod data mining. Cílem je objevovat v datech zajímavé shluky (které připomínají přirozené pojmy) a různé závislosti.

38. Metoda volného hledání v textu ('free-text searching') a vyhledávání s pomocí řízených slovníků

Vyhledávání ve volném textu/free text searching - rozšířenější
formulaci dotazu v tzv. "přirozeném jazyce" -"free-text"
vyhledávání v textových polích (např. název, abstrakt, plný text...)

Řízený slovník-Tezaurus (slovník, který uživateli nabízí seznam synonym, někdy i antonym).
-plně se rozvinuly zvláště v prostředí elektronických katalogů v souvislosti s nástupem vyhledávacích systémů 2. generace charakterizovaných možností vyhledávat pomocí kombinace slov.

Příklad řízeného vyhledávání v online informační službě ProQuest



39. Rešeršní techniky a elementy dialogového vyhledávání (rozšíření pravostranné i levostranné, operátory, maskování)
Jedním z nejdůležitějších elementů efektivního procesu vyhledávání jsou operátory. Booleovské (pojmenováno po Georgi BOOLEOVI, 1815-1864) operátory mají nejširší použití, ale také své limity. Booleovský model vyhledávání je velmi účinný, ale je rovněž velmi kritizován. Mnohé dokáží napravit tzv. proximitní (vzdálenostní) operátory, jichž je několik druhů, ale vývoj postoupil dále. Některé vyhledávací systémy už pracují na principech tzv. fuzzy logiky, ale rozhodně to není běžné v největších a nejrozšířenějších informačních systémech. Velkou podporou klasických databázových systémů (sofistikovaných), ale i vyhledávacích prostředků pro internet, jsou proto proximitní operátory. Operátory a další elementy je obecně možno rozdělit: AND, OR, NOT, (w), (n), (l), (a), (s), near, with, adj – proximitní,
( ) - závorky.
Vyhledávací systémy na internetu (search engines) nepracují zcela běžně s pokročilými metodami vyhledávání na principu používání "vyšších" operátorů - například proximitních (příkladem za všechny je AltaVista: http://www.av.com, http://altavista.digital.com). Je to však mnohdy výhodné: tvůrci totiž sázejí na intuitivní způsoby vyhledávání (za desítky možností příklad vyhledávacích internetovských prostředků: http://www.google.com nebo http://askjeeves.com).
Vyhledávání v prostředí sofistikovaných databázových zdrojů je stále nejefektivnější a nejrychlejší. Na začátku však potřebuje tento způsob získávání zdrojů alespoň základní informační dovednost a přehled. Naprostá většina uživatelů však o takových zdrojích, kde se vyskytují ty nejvhodnější - nejvíce relevantní - dokumenty, neví. Je to dáno několika bariérami. Ta finanční není vždy zásadní. Z důvodu neznalosti, anebo i oněch finančních omezení, se mnozí uživatelé orientují pouze na "volně" přístupné informace na internetu, které jsou mnohdy bezcenné, anebo zkreslené. Dá se dokumentovat mnoha praktickými příklady, jak informace získané z internetu mají dezinformační charakter.

Maskování
Další funkcí, kterou nabízejí vyhledávací služby, je používání zástupných znaků (angl. wild cards).
Jako zástupné znaky jsou používány tyto symboly: hvězdička *(angl. asterisk), otazník ? (angl. question mark), dolar $ a procento % (angl. percent).
Způsob používání zástupných znaků pro tzv. maskování je nutné si zjistit v nápovědě vyhledávacích služeb, neboť takřka každá z nich používá pro tuto funkci jiné znaky. U některých služeb však maskování nelze použít vůbec (například u Google).
Zástupné znaky lze použít pro nahrazení písmen (jednoho nebo více) uprostřed slov. Například zápisem wom*n říkáme systému, že chceme vyhledat jak slovo woman, tak women (tedy jednotné i množné číslo).
Pro používání této funkce při formulaci dotazu platí totéž, co bylo uvedeno u funkce předchozí (krácení podle slovních kořenů). Využijte ji jen tehdy, pokud budete hledat úzce specializované téma a budete chtít hledáním zajistit vyčerpávající průzkum.
Příklad použití zástupných znaků lze v rozhraní Dialog
Zástupný znak lze v rozhraní Dialog použít pro nahrazení koncovek, neboť tento systém umožňuje pouze tzv. pravostranné krácení slov. Například místo několika výrazů retrieval, retrieving, retrieve a retrieved je možné v dotazu uvést pouze jediný výraz: retriev?. Systém pak vyhledá všechna slova začínající výrazem retriev. Tento způsob zápisu zjednodušuje a usnadňuje formulaci dotazu. Jinak byste totiž pro zajištění podobného hledání museli vzít v úvahu všechny tvary hledaných slov a spojit je v dotazu operátorem OR.
Může se totiž stát, že systém do vyhledané množiny zařadí i slova, která mají sice shodný začátek, ale jejich rozšíření o další významové části slov a koncovky způsobí, že se do vyhledané množiny dostanou i slova s jiným významem, než hledáte.
Chcete-li např. vyhledat jednotné i množné číslo slova odpad – waste i wastes, pak zápis waste? způsobí, že se ve vyhledaných záznamech vyskytnou také slova wastewater a wastewaters. Je tedy vhodnější použít pro zápis dotazu waste OR wastes (pokud vás ovšem nezajímají odpady jakéhokoliv druhu).
Pro podobné případy jako je tento, máte ještě další možnost. Chcete-li vyhledat podobným způsobem pouze výrazy, jež neobsahují více než jeden znak navíc, můžete použít zástupný znak #.
Výraz metal# tedy nalezne pouze výskyty slov metal nebo metals, ale už nikoliv např. metallurgy. Obdobně výraz waste# vyhledá pouze waste nebo wastes.

Symboly pro rozšíření
* -nahrazuje libovolný počet znaků
? –nahrazuje jeden znak
?? -nahrazuje dva znaky
Rozšíření je možné použít pravostranné nebo uvnitř slova
Př:. Hledáme sulfur,který se může vyskytovat i jako sulphur SUL*UR
Použití uvozovek - uvozovky používány v případech, kdy slova AND, OR NOT, SAME neslouží jako operátory.
Př.: hledáme práce autora Williama Ora, dotaz bude vypadat následovně: “OR“ W.
Slovní spojení a fráze se zapisují bez uvozovek

40. Efektivnost systémů, relevance, pertinence, organizace zpětné vazby (nejen povídavé, ale exaktní vysvětlení - matematické vzorečky a jejich vysvětlení, velmi oblíbená otázka ;-) )

Efektivnost informačního systému - kritéria
ekonomická efektivnost (zisk, náklady, rentabilita)
selekční efektivnost (vyhledání a poskytnutí relevantních, resp. pertinentních informací)
flexibilita (kritéria časová a schopnost přizpůsobit se změnám)

Relevance - relevantní: závažnost, významnost, důležitost, adekvátnost, závažný, významný, důležitý, adekvátní, odpovídající

Pertinence – pertinentní: příslušnost, potřebnost, využitelnost, příslušný, potřebný, využitelný

Zpětná vazba relevance je proces, kdy uživatel v nalezené množině dokumentů identifikuje seznam pro něj nejzajímavějších dokumentů, a vyhledávací systém pak je schopen na základě těchto dokumentů automaticky vytvořit nový dotaz, pomocí kterého budou vyhledány dokumenty podobné těm označeným.

Relevance a vyhledávání
relevance vyhledávání je závislá na poměru mezi úplností a přesností vyhledávání
úplnost výsledku vyhledávání (recall) - poměr mezi nalezenými dokumenty a všemi relevantními dokumenty v databázi
přesnost výsledku vyhledávání (precision) - poměr mezi nalezenými relevantními dokumenty a mezi všemi nalezenými dokumenty
úplnost a přesnost vyhledávání se měří koeficientem úplnosti a přesnosti
optimálně: hodnota koeficientu přesnosti a úplnosti se rovná jedné

Tři úrovně analýzy relevance z hlediska poskytnuté informace
formální relevance (formální vztah poskytnuté informace k obsahu dotazu) - vztah syntaxe
věcná relevance ( vztah obsahu poskytnuté informace k obsahu dotazu) - sémantický vztah
pertinence (vztah poskytnuté informace k informační potřebě) - pragmatický charakter

Úspěšnost vyhledávání, aneb co jsou relevance, přesnost a úplnost
Při posuzování kvality libovolného systému pro vyhledávání informací hraje klíčovou roli koncept relevance, která se definuje jako vlastnost vztahu mezi dotazem uživatele a jednotlivým dokumentem jako prvkem množiny všech nalezených dokumentů. Toto vymezení vychází ze dvou předpokladů:
- Odpověď vyhledávacího systému je množina rovnocenných objektů (obvykle bibliografických záznamů nebo fulltextových dokumentů). Některé systémy řadí výstup podle jakési interně vypočítané míry vhodnosti dokumentu vůči dotazu, to ale na hodnocení relevance nemá vliv.
- Kvalita objektu, tedy jeho relevance vzhledem k zadanému dotazu, závisí jenom a právě na dotazu. Případné souvislosti a závislosti s dalšími nalezenými dokumenty se neberou v úvahu (např. když pochopení jednoho dokumentu závisí na prostudování jiného dokumentu).
Dokument je relevantní tehdy, pokud je jím uspokojena informační potřeba uživatele. V opačném případě se označuje jako nerelevantní dokument. Posouzení relevance se děje vždy až v okamžiku, kdy uživatel vnímá výsledky dotazu. Nalezené dokumenty jsou proto jen tzv. systémově relevantní. To vyplývá z principu fungování vyhledávacích systémů, kdy se algoritmicky vyhodnocuje podobnost mezi zadaným dotazem a vyhledávacími obrazy dokumentů. Dále se posuzuje relevance jako subjektivní kategorie. Pro dva různé uživatele se stejnou informační potřebou nemusí být tytéž výsledky stejně relevantní. Subjektivně chápaná relevance se označuje jako pertinence. Relevanci lze asi nejlépe charakterizovat jako informativnost dokumentu. Přináší–li dokument uživateli něco nového, snižuje–li jeho určitou nejistotu, pak je relevantní.
Na základě posouzení relevance výsledků se pak odvozují dvě velmi často používané míry hodnocení efektivnosti vyhledávání – přesnost a úplnost. V následujícím vymezení obou pojmů označení NAL vyjadřuje množinu všech nalezených objektů (dokumentů) a REL množinu všech relevantních objektů v prohledávané množině dokumentů.
Přesnost (precision) vyjadřuje, jak velká část nalezených dokumentů je relevantní.
p=|REL?NAL|/|NAL|
Například mějme databázi s miliónem dokumentů, z nichž 1000 je zaměřeno na informační společnost. Je–li pomocí dotazu nalezeno celkem 200 dokumentů, z nichž je 100 relevantních, pak přesnost činí 0,50.
Úplnost (recall) říká, jak velká část relevantních dokumentů (ze všech možných) se vůbec našla.
r=|REL?NAL|/|REL|
Uvažujme stejnou databázi jako výše. Je–li pomocí dotazu je nalezeno 100 dokumentů o informační společnosti, pak úplnost činí 0,10.
Lidé se často dopouštějí při porovnávání různých vyhledávacích systémů té chyby, že uvažují pouze o úplnosti. Je–li položen týž dotaz ve dvou systémech a seznam nalezených dokumentů je u jednoho z nich dvojnásobný, pak je okamžitě považován za lepší. Ve skutečnosti je ale nutno brát v úvahu také přesnost obou systémů. Mějme systém A, který na položený dotaz najde 100 dokumentů, ale dosáhne přesnosti pouze 0,25 (jen 25 dokumentů je pro uživatele relevantní). Je použit stejný dotaz a systém B nabídne seznam pouze 50 dokumentů, ale přesnost činí 0,80 (40 dokumentů je relevantních). Je zřejmé, že systém B pracuje efektivněji. Nezanedbatelným důsledkem pro uživatele je také úspora času při zkoumání dokumentů, které se nakonec ukáží jako nerelevantní.
Určení přesnosti výsledku je poměrně jednoduchá záležitost (za předpokladu, že výsledek je rozumně velký, čili hodně záleží na použité vyhledávací strategii). S určením úplnosti je to obtížnější, problém spočívá ve stanovení velikosti množiny REL. Pro určení její velikosti se při hodnocení efektivnosti systémů vyhledávání informací používají různé metody odhadu. Pro úspěšné vyhledávání je významná jak vysoká přesnost, tak vysoká úplnost. V ideálním případě by obě charakteristiky měly být rovny jedné. To jinými slovy znamená, že každý relevantní dokument uložený v databázi by byl nalezen, a současně také, že výsledek je tvořen výhradně relevantními dokumenty. Toto je pouze nedostižný ideál, reálně tento stav nikdy nenastává.
Přesnost a úplnost jsou navzájem protichůdné. Je–li dotaz formulován tak, aby poskytoval
co nejúplnější výsledky, pak současně bude výsledek málo přesný (relevantní objekty budou v drtivé menšině oproti těm nerelevantním). A obráceně – jsou–li výsledky díky vhodnému dotazu velmi přesné, je velmi pravděpodobná nízká úplnost. Zpravidla se výsledky vyhledávání pohybují mezi oběma extrémy.

Většina vyhledávacích systémů používá pro prezentaci nalezených dokumentů určitý způsob jejich řazení, jejím klíčem nejčastěji bývá systémová relevance a dokumenty jsou podle ní řazeny sestupně. Při listování seznamem obvykle směrem dolů klesá přesnost. Různé systémy se v tomto ohledu mohou velmi lišit.
V souvislosti s vyhledávacími stroji pro WWW dokumenty je nutné se ještě zmínit o třetí charakteristice – pokrytí (coverage), která udává, jak velká část potenciálního prostoru relevantních dokumentů je zachycena v databázi vyhledávacího stroje. Například uvažujme vyhledávací stroj, jehož databáze obsahuje údaje o 10 dokumentech, přičemž pět dokumentů je zaměřeno na problémy nezaměstnanosti. Celkem ovšem existuje 50 dokumentů s daným zaměřením (45 dokumentů nebylo daným strojem vůbec indexováno). Výsledkem dotazu na nezaměstnanost budou čtyři relevantní a dva nerelevantní dokumenty – přesnost činí 0,66, úplnost 0,80, ale pokrytí jen 0,10.
Na efektivní vyhledávání působí mnoho faktorů, např. přesnost úzce souvisí s kvalitou indexování, s problémy přirozeného jazyka (synonyma, homonyma aj.). Problém pokrytí se týká všech vyhledávacích služeb bez rozdílu, uvádí se, že i velké vyhledávací služby pokrývají nanejvýš třetinu až polovinu všech veřejně dostupných dokumentů.

V tomto případě „konečný uživatel“ nemusí být zatěžován problematikou informačního systému a vedením dialogu s ním, ale stačí mu pouze zformulovat informační požadavek vyplývající z jeho informačních potřeb. Informační požadavek zpracuje pak v realizaci informační pracovník, a to samostatně, nebo za přítomnosti konečného uživatele (což pro naplnění relevantního výstupu ve smyslu pertinence (obsahové relevance) vždy žádoucí).

Relevance rešeršních informací
Relevancí nazýváme předmětnou (obsahovou) příslušnost informace k dotazu, podle něhož byla provedena selekce z informačního fondu. Pojem a význam výrazu „relevantní informace“ nebyl dosud náležitě vysvětlen. Kontradiktorický termín „irelevantní informace“ lze zahrnout do pojmu „vada“ čili „šum“ vzniklý při selekci.
Při indexování a selekci musíme uvažovat tři druhy relevance, a to jak:
formální, projevující se formálním, znakovým souhlasem indexů dokumentů s indexy dotazu
věcná relevance, daná ekvivalencí obsahu (významu) pramene s obsahem
(významem) dotazu, nebo obsahu pramene s jemu udělenými pořádacími znaky (indexy)
faktická (individuální) relevance, tj. ekvivalence obsahu nalezených informací s významem, který uživatel udělil pramenům z hlediska jejich užitečnosti pro řešení úkolu, formulovaného rešeršním dotazem. Faktická relevance se při stejných odpovědích na stejný dotaz může u jednotlivých tazatelů podstatně lišit.
Bohužel o úspěchu rešerše rozhoduje právě faktická relevance, ačkoliv je gnozeologicky a sémanticky nejvágnější.
Je známo, že počet informací, které byly nalezeny během selekčního procesu se nikdy nekryjí s množinou věcně relevantních informací. V rešeršním praxi dochází pouze k částečnému průniku množiny nalezených a množiny všech věcně relevantních informací, které jsou uloženy v paměti soustavy. Tuto situaci znázorňuje graf na obr. č. 18.



Poznámka: vztahy mezi elementy grafů jsou vyjádřeny pomocí matematických symbolů.

Jak vidíme, šumem lze označit dva typy selekčních chyb:
- chyba prvého druhu, kdy rešerše nevydá relevantní dokument. Tuto neúplnost způsobuje nejčastěji vadné indexování dokumentu nebo dotazu,
- chyba druhého druhu, při níž rešerše poskytne pouze formální, nikoliv věcně relevantní dokument. Příčinou je irelevance mezi obsahem dokumentu a přidělenými indexy.

Hodnoty šumu jsou ovlivňovány těmito kvantitativními charakteristikami informačního systému:
- frekvencí jednotlivých indexů,
- citlivostí systému (tj. počtem tříd ekvivalence, na něž selekční jazyk rozkládá informační fond),
- frekvencí tříd ekvivalence v rešeršních dotazech,
- kombinovatelností pořádacích znaků (měřitelnou počtem různých pořádacích znaků, s nimiž se vyskytuje v kombinacích).

Předpoklady poskytování relevantních, resp. pertinentních informací
-strukturovat nestrukturované informace a užívat takových vyhledávacích systémů, které mají kvalitní nástroje k uchopení nestrukturovaných plných textů, protože tyto ve velké míře převažují
-propojovat věcný selekční jazyk se systematickou notací, zapojovat autority, aplikace pojmového vyhledávání interakce mezi uživatelem, informačním pracovníkem a informačním systémem

(Pozn.: Dva odborníci mohou mít při řešení stejného odborného úkolu velmi rozdílné
informační potřeby, v rámci jednoho oboru má rozdílné informační potřeby vědec v základním
výzkumu, vývojový pracovník, pracovník v komerční firmě působící v aplikačních činnostech.
V této souvislosti je potřeba upozornit na vztah relevance a pertinence informace. Vyhledaný
relevantní dokument nebo informace, kterou již odborník zná a kterou již do svého
poznatkového fondu uložil je pertinentní, není pro odborníka zajímavá a využitelná).

41. pojmy přesnost a úplnost, vzájmené vztahy, vztah ke zvoleným rešeršním strategiím, podmínky zvýšení přesnosti, podmínky zvýšení úplnosti
Vyhledávání
Cílem vyhledávání je vyhledat v systému uživateli dokumenty, které uspokojí jeho informační potřebu (vyjádřenou dotazem) – vybrat relevantní dokumenty. Co je relevantní, je jasné člověku, ale už ne počítači. Konečný soud o relevanci leží na uživateli.
Úspěšnost systému znamená – nevynechat žádný relevantní dokument (toho by bylo nežádoucím způsobem dosaženo vrácením všech dokumentů) a naopak nevracet dokumenty, které jsou irelevatní (čehož by se nežádoucím způsobem dosáhlo nevrácením žádného doku).

Nejznámějším způsobem, jak měřit efektivitu systému je: koeficient přesnosti (precision) a koeficient úplnosti (recall).
Žádoucím výsledkem by bylo maximalizovat obě hodnoty, prakticky to však možné není.

Koeficient úplnosti:
Počet vrácených relevatntích doku
/počet všech relevantních doku
jak dobře systém vyhledá všechny relevantní doku

Koeficient přesnosti:
Počet vrácených relevantních doku
/počet všech vrácených doku
jak dobře systém vyhledá jen relevantní doku

Následující obrázek ukazuje vztahy mezi množinami dokumentů, které existují v procesu vyhledávání v dialogovém systému.



Vztahy úplnosti a přesnosti je nejlépe pozorovat z následujících obrázků

První graf ukazuje ideální poměr a grafické vyjádření mezi přesností a úplností:


Druhý graf pak ukazuje reálný funkční vztah mezi přesností a úplností:


Jak docílit co nejlepších výsledků hledání
• Účinnost vyhledávání je možné měřit právě množstvím vyhledaných záznamů (angl. recall) a přesností (angl. precision), tj. kvalitou, relevancí vyhledaných záznamů. Oba přístupy jsou vůči sobě v protikladu.
• Rozšíříte-li jakýmkoliv způsobem svůj dotaz s cílem vyhledat co nejvíce záznamů, zvýšíte tím současně pravděpodobnost vyhledání nerelevantních informací.
• Zúžíte-li svůj dotaz s cílem dosáhnout co největší relevance výsledků hledání, zvýšíte naopak pravděpodobnost ztráty určitého množství relevantních informací.
Dobrá vyhledávací strategie vyvažuje odpovídajícím způsobem oba přístupy.
Chcete-li získat více záznamů:
• Nesnažte se co nejvíce zpřesňovat dotaz. Použijte jen nezbytná pole a jen ty nejdůležitější termíny.
• Neomezujte své vyhledávání – jazykově, typem dokumentu nebo časově.
• Prohledejte více bází dat, jež sledují problematiku, o kterou se zajímáte.
• Zadávejte hledaný výraz fulltextově místo např. do text.pole Název atd.
• Nepoužívejte logický operátor NOT.
• Nepoužívejte pro hledání obecné nebo abstraktní výrazy (např. research, development, effect, theory, method, experiment, structure, material, properties apod.). Tyto výrazy však mohou být užitečné pro hledání, jsou-li součástí určitých frází, metod, názvů (Moessbauer effect) nebo deskriptorů (high-pressure effects in solids) apod.
• Nepřekládejte hledané téma z češtiny do angličtiny doslovně - pro formulaci dotazu použijte jen významová slova.
• Zkontrolujte pečlivě správnost pravopisu slov použitých v dotazu.
• Použijte zástupné znaky pro vyhledání různých tvarů slov (jednotné a množné číslo, příslovce, přídavná jména, slovesné tvary apod.).
• Použijte synonyma a příbuzná slova.
Chcete-li dotaz zpřesnit (zmenšit vyhledanou množinu):
• Použijte více slov vyjadřujících hledané téma spojených logickým operátorem AND.
• Použijte dalších nabídek, například omezte prohledávání časově nebo jazykově.
• Místo hledání prostřednictvím pole fulltext použijte např. pole Název apod.
• Chcete-li vyhledat přesnou frázi, použijte uvozovky (apod.)
• Pokud použijete zástupný znak, dbejte na to, abyste nepoužili příliš krátký slovní základ pro hledání slov s různými koncovkami.
• Použijete-li logické operátory AND, OR a NOT, nezapomeňte na správné použití závorek.
42. Metody hodnocení rešeršního systému a metody hodnocení rešeršních výstupů
Výkonnost DIS bývá měřena na dobře definovaných vzorcích textů. Jako příklad může sloužit soubory používané a na konferencích TREC. Testovací soubor, který je základem pro hodnocení systémů pro zpracování úplných textů obsahuje jeden milion ohodnocených dokumentů.
Soubor TREC-1 obsahuje 2 Gbyte dokumentů. Dokumenty jsou různě dlouhé (od několika stovek termů po více než 1 tisíc termů). Dokumenty jsou upraveny do formátu SGML a pocházejí z různých zdrojů:
WSJ: Wall Street Journal (1986-1992) 550 MByte
AP: Associate Press Newswire (1989) 514 MByte
ZIFF: Computer Select Disks (Ziff-Davis Publishing) 493 MByte
FR: Federal Register 469 MByte
DOE: Abstract from DOE 190 MByte
Na každý dotaz je známa množina relevantních dokumentů, tj. není problém vypočítat hodnotu koeficientu R.

Specializovaný hardware
Hardware má vliv na návrh DIS, protože určuje alespoň částečně operační rychlost DIS, což je klíčový faktor interaktivních informačních systémů, dále pak množství a typ informací, které mohou být prakticky uloženy v informačním systému. Většina DIS, které se v současné době používají, je implementována na von Neumannovských počítačích, tzn. na univerzálních počítačích s jedním procesorem. Většina technik a algoritmů, které jsou v této práci diskutovány, implicitně předpokládá jako implementační platformu von Neumannovský stroj. V posledních letech enormně vzrostla výpočetní rychlost těchto počítačů, ale stále existují aplikace z oblasti vyhledávání informací, pro které jsou tyto počítače stále příliš pomalé. Jako odpověď na tento problém někteří výzkumníci zkoumali alternativní architektury pro implementaci DIS. Existují dva základní přístupy - paralelní počítače a specializovaný hardware.
Zajímavá je implementace DIS na Connection machine, což je masivně paralelní počítač s 64000 procesory. Specializovaný hardware pro DIS, znamená počítače speciálně navržené k vykonávání operací specifických pro DIS. Jako příklad může sloužit specializovaný hardware efektivně realizující běžné Boolovské operace jako je kombinace množin.
Současně s potřebou větší rychlosti vznikla též potřeba medií schopných uchovávat velké textové databáze v kompaktní formě. Odpovědí na tuto potřebu je technologie optických paměťových médií umožňující uchovávat několik Gbyte dat na jednom disku.
43. Multifile, „multiple searching“ – rozbor, užití, příklady, výhody, nevýhody
Velkou výhodou databázové sítě, jež zpřístupňuje stovky databází z různých oborů z celého světa, je možnost vyhledávání konkrétních informací ve více databázích současně (tzv. „multifile searching“).
Tato výhoda vyniká např. ve srovnání se zakoupením jednoho CD-ROMu s jednou či dvěma databázemi. Jsou témata, na jejichž spolehlivé pokrytí může stačit jedna (např. úzce zaměřená) databáze. Většinou se však požadované téma objevuje v různých databázích, z nichž každá má svůj specifický výběr zpracovávaných informačních zdrojů, specifické deskriptorové zvyklosti a možnosti i strukturu. Vyhledávání ve více databázích současně se uplatňuje stále více v poslední době, kdy bylo umožněno :
• výrazně urychlit zpracování (v komerčních databázích se platí poplatek za dobu jejich využívání (tzv. connect time) a neúměrně dlouhý čas, strávený v jednotlivých databázích by se negativně projevil na výsledné ceně).
• vyloučit duplicitní záznamy (kdy je stejný článek či jiný materiál zpracován v různých databázích - a my si můžeme vybrat jen jednu z nich). Právě v této fázi můžeme náklady ušetřit, pokud si v případě duplicity vybereme databázi (nej)levnější.
Pokud nám stačí k určitému tématu jen základní informace, můžeme je často vyhledat "volně" na internetu či v jedné oblíbené databázi.
Pokud však máme uskutečnit důsledný průzkum dostupných informací k danému tématu, nabízí se právě "multifile searching".
Může se stát, že největší radost ve zpracované rešerši může způsobit objevení relevantních záznamů z databází, u kterých bychom to nejméně čekali. Může to otevřít nové obzory, možnosti či oblasti zájmu.
Možný český ekvivalent - "Paralelní vyhledávání"

Příklady použití

DIALOG
Způsobu vyhledávání v prvních např. dvaceti bázích dat najednou (tzv. multifile searching, v systému Dialog je tento postup nazýván OneSearch).
Multifile searching v STN International
pracuje se v režimu, kdy otevřeme několik databází (někdy i několik desítek) databází najednou. Rešeršér si musí ale uvědomit, že se spustí účtování za časy připojení do báze (connect time) všech otevřených bází dat, což může být velice nákladné (používá se občas pro určité speciální postupy).
Při otevření několika databází s podobnou tématikou lze vylučovat duplicitní dokumenty (speciálním příkazem, který je používán spíše pokročilými uživateli) a usnadní se a zlevní např. objednávka primárních dokumentů, sníží se často i rovněž cena rešerše (neplatí vždy, také není od věci vidět jeden problém z pohledů více databází).
Integrace informačních zdrojů v Jednotné informační bráně (JIB)
Základní “nástroje” pro fungování JIB představují programy MetaLib a SFX izraelské firmy ExLibris.
MetaLib je nástroj, který umožňuje základní paralelní vyhledávání v heterogenních zdrojích.

TDKIV – Česká terminologická databáze knihovnictví a informační vědy
Kromě základního vyhledávání je možné při práci s TDKIV použít vyhledávání ve více databázích – odkaz „Z více databází“ na stránce základního vyhledávání. Pomocí tohoto rozhraní lze vyhledávat paralelně ve třech databázích.
Využitím paralelního vyhledávání se zvýší šance, že hledaný řetězec bude nalezen alespoň v jedné z databází, resp. lze paralelní vyhledávání využít v případě, kdy vyhledávání v TDKIV nebylo úspěšné.

44. rejstříkvé služby typu dialindex, stnindex – rozbor, účel, princip, výhody, nevýhody
Existuje řada obsáhlých tištěných adresářů komerčně dostupných databází a stále rostoucí počet průvodců volně dostupnými zdroji na Internetu.
Jiný přístup k výběru databáze je ponechat vyhledávácí seznam dodavatele zjistit, které z jím dodávaných databází obsahují informace, které vás zajímají. Systém firmy Knight-Ridder Information "DIALINDEX" zjistí, které soubory služby DIALOG mají informace na zadané téma, odpovídající typ vyhledávání na STN by se provedl pomocí STNIndex

Výběr databáze a hostitelského centra (hosta) na základě zkušeností či speciálních metod výběru (např. DIALINDEX, STN Index, CrossFile a další), a následné příkazové funkce typu SELECT v STN International či RANK v DIALOG Corporation umožňující jednoduché srovnání dle určitých kritérií jsou nám později však nápomocné v rozhodování, jaký zdroj je lépe využít, aj.) jsou jedny z nejpodstatnějších postupů rešeršní strategie, což je považováno už za know-how informačního poradce.

V rámci systému Dialog existuje nástroj, který dokáže vyhodnotit, v kterých bázích dat se se vyskytuje nejvíce informací (zde dokumentů) k naší testované problematice. Tento nástroj se nazývá DIALINDEX (v jiných centrech jako je např. STN International je to STN Index, v centru DataStar je to CrossFile). Do akce se Dialindex uvede příkazem "BEGIN 411" a po několika následujících příkazech je nám schopen poskytnout statistiku, kterou v závěru můžeme automatizovaně sestavit podle četnosti, a to tak, že databáze s největším výskytem problematiky jsou na prvních místech (tuto funkci plní příkaz z rodiny příkazů "rank files" ).

Výhody, nevýhody?

45. služby typu dds – komparace, profese dds, obecný metodologický postup při zadávání služby dds, rovněž doporučeno podívat se na principy mvs a mmvs služeb v ČR

SLUŽBY TYPU „DOCUMENT DELIVERY“ (DDS):
databázová centra mají běžně služby typu DDS, neboli Document Delivery Services, kdy je uživateli během několika dnů (v případě nutnosti i rychleji) doručen primární dokument ve formě, kterou si přeje. DDS je jednou ze zajímavých a rychle se rozvíjejících služeb na Internetu. DDS se mohou pojit ke službám databázových center, službám velkých knihoven a informačních institucí, ale nemusí být vždy ve vztahu k podobným subjektům. Základem jsou ale přece jen přístupy k rozsáhlým informačním fondům. Za všechny DDS (těch velkých jsou desítky po celém světě a první úspěšné existují i u nás - viz systém INVIK Státní technické knihovny na http://www.stk.cz/) uveďme propracovaný systém Britské národní knihovny zvaný Document Supply Centre (http://portico.bl.uk/services/bsds/dsc) nebo geograficky nám nejblíže systém jedné z největších německých technických knihoven TIB Hannover (http://www.tib.uni-hannover.de/). Výběr takových DDS služeb by byl dlouhým seznamem.

Způsob dodávky primárního dokumentu
Dokument primárního charakteru, pokud nám není dostupný z místa, kde jsme vyhledání relevantních dokumentů realizovali (například z plnotextové báze dat nebo z elektronického časopisu v digitálních knihovnách), je možno získat „klasickou cestou“ meziknihovních a mezinárodních meziknihovních výpůjčních služeb (MVS, MMVS). Službu mezinárodních meziknihovních služeb mají možnost v ČR provozovat např. následující knihovny:
.. Národní knihovna ČR
.. Státní technická knihovna
.. Knihovna Akademie věd
.. Moravská zemská knihovna v Brně
.. Univerzitní knihovna Olomouc
MVS a MMVS se dnes vyvíjejí v souladu s posledními trendy v oblasti dodávání primárních dokumentů a celá řada činností odpovídá mezinárodním standardům. Jejich činnost je dnes podpořena technologicky (např. přenos kopií dokumentů v digitální podobě, které pak mohou být koncovému uživateli poskytnuty také elektronicky nebo následně tištěným výstupem, nejčastější dodání je ale zřejmě do e-mailových schránek).
Cesta MVS a MMVS je však pouze jednou z cest, jak uspokojit koncového uživatele primárním dokumentem. Nevýhodou (a ne nepodstatnou a jdoucí až do měsíců, obyčejně jde o týdny) může být celkem pomalejší dodávání primárního dokumentu, což u některých struktur uživatelů (řídící pracovníci, obchod, ale i vědci dynamicky se vyvíjejících vědeckých oborů) není žádoucím uspokojením uživatelských požadavků.

Document Delivery Services (DDS) cestou databázových center:
Uživatel systému zpracovává rešeršní úlohu (sám nebo prostřednictvím informačního pracovníka) v bibliografické bázi dat. Primární dokument není připojen k dokumentu. Přístup do elektronické knihovny uživatel nemá přímý, anebo vůbec, protože nevlastní licenční práva apod. Cesta získání primárního dokumentu přes klasické služby typu MVS nebo MMVS je zdlouhavá a nepřijatelná.
Je ale možné dokumenty získat dialogovou komunikací s databázovým centrem, v kterém rešeršní úlohu zpracováváme. Služby typu DDS poskytuje téměř každé větší databázové centrum, které je pak zašle do několika dnů i hodin – klasicky tištěným výstupem a klasickou poštou nebo kurýrem spěšně, je možný výstup na disketu, nejčastěji však elektronickou poštou (e-mail) do elektronické schránky (mail-box) zřízené u databázového centra (přiděluje oprávněnému uživateli), anebo do jeho internetové poštovní schránky. U některých dokumentů (či vysloveně na přání zákazníka) je možné obdržet DDS na faxovou adresu (fax-delivery service). U posledně jmenované služby se tak děje například v případě obchodních informací, informací o firmách. Rešeršér – koncový uživatel nebo zprostředkovatel – zadá číslo faxové stanice, kam má být primární dokument doručen. Faxové rozhraní (dokonce pro obousměrnou komunikaci – např. objednání faxem služeb DDS a obdržení výstupu faxem) je
velmi často používaným rozhraním a databázovými centry je vždy nabízeno. Systémy elektronické pošty neeliminovaly zcela rozhraní – uživatel/zákazník - systém.

Ovládání služeb typu DDS obecně ze strany koncového uživatele je následující:
.. znalostí příkazového (komunikačního, dotazovacího) jazyka
.. ovládáním grafického uživatelského rozhraní daného systému (GUI – graphic user interface), kde existuje možnost volby objednání dokumentu.
Primární dokument tak můžeme objednat podstatně rychlejší cestou a „uživatelsky pohodlněji“.
Jde z pochopitelných důvodů o službu dražší, ale často ještě únosnou a výhodnou vzhledem k nejcennějšímu faktoru, a to k času experta, který je uživatelem této služby. (Často se tyto služby však hradí z peněz korporačních a uživatel nemusí náklady nést na soukromém kontu).

Profese „document delivery professional“
Dialogové služby producentů a databázových center zlepšující přístup k plnotextovým dokumentům, ze strany koncového uživatele redefinují novou roli informačního profesionála (knihovníka) v této oblasti [WETTLER, 1998, s.73]. Nahrává tomu skutečnost, že množství systémů zaměřených na plné texty v jakékoliv systémové podobě, které byly naznačeny v předchozím textu, přibývá.
Obdržet primární dokument je na jedné straně uživatelsky jednodušší díky přátelskému uživatelskému rozhraní, ale systémů primárních elektronických informací přibývá a orientace mezi nimi není jednoduchá. Vyvstává také aktuální otázka tzv. outsourcingu služeb a přenesení této činnosti na zprostředkovatele vně instituce, anebo tuto službu začlenit do struktur například informačních institucí, informačních útvarů korporací apod. V případě přenášení těchto funkcí vně, budeme stále více komunikovat s expertem, pro kterého se ujímá pojmenování „document delivery specialist“ (rovněž akronym DDS). V době Internetu a komunikace síťovými prostředky se tato pozice skutečně redefinuje.
Mohu učinit dílčí závěr, že DDS ve smyslu Document Delivery Specialist musí ovládat metody vyhledávání informací, být flexibilní v ovládání vyhledávacích systémů komerčních i volně na Internetu přístupných, v podstatě mít všechny atributy specialisty rešeršéra (online retrieval specialist, online searcher).

Závěr ke službám DDS
Je vhodné kombinovat služby DDS v různých formách. Při hodnocení se zvažuje účel dalšího zpracování dokumentu (například elektronické), cena a uživatelská dostupnost a jednoduchost rozhraní. Některé služby nejsou pro koncového uživatele typu experta, vědeckého pracovníka, studenta běžně dostupné. Důvodem jsou např. práva intelektuálního vlastnictví (copyright). Účelnost DDS služeb posoudí nejlépe koncový uživatel služby. DDS služby by měly být uvažovány z hlediska uspokojení informačních požadavků a potřeb koncového uživatele. DDS se stávají pomalu standardem pro mnoho uživatelů. Uživatel je často odrazen od využívání informačního systému, neboť získání primárních dokumentů je pro něj obtížné až nereálné, v systému informačních služeb včetně DDS služeb se pak zákonitě neorientuje. Implementace služeb typu DDS do uživatelského rozhraní a komunikace s databázovým rozhraním je dnes strategií center v duchu „primární informace ke koncovému (konečnému) uživateli“.

46. Vyhledávání v plnotextových bázích dát - specifika, zásady, výhody, nevýhody, srovnání s vyhledáváním v bibliografických bázích dat
Báze dat plných textů (full text) jsou dynamickým trendem posledních několika let a většinou již nepotřebujeme dohledávat primární dokument (pokud ovšem nevyžadujeme např. fotografie a další složitější obrazové informace v originálním textu obsažené - současné velké databázové systémy pracují totiž s grafickou informací omezeně a výběrově oproti zdrojům např. na optických nosičích - discích, výjimkou jsou také mnohé elektronické časopisy, které jsou vystavovány v síťových elektronických prostředích včetně internetu tak, aby byly uživateli snadno prohlížitelné webovskými prohlížeči, tzv. browsery). Díky plnotextovým databázím je možné naplnění současného trendu moderních informačních služeb - primární dokument dopravit co nejkratší cestou k uživateli. V případě plnotextových bází dat je tedy k dispozici kompletní text primárního dokumentu již v přímé dialogové komunikaci. Stačí zvolit jen vhodný zobrazovací formát a dokumenty si elektronicky přeposlat.Výhodou také je, že v plných textech můžeme provádět vyhledávání. Vyhledávání v plnotextových bázích dat vyžaduje ovšem použití speciálních vyhledávacích prostředků a nástrojů, neboť jinak konečné výstupy mohou obsahovat mnoho šumů a nerelevantních výsledků.
Příklad:
Většina plnotextových databází má charakter zpravodajských databází (NLDB - Newsletter Database - http://www.cas.org/ON-LINE/DBSS/nldbss.html), ale v poslední době se tento trend dostává i do oblasti vědeckých a technických informací - viz databáze PCTFULL (http://www.cas.org/ON-LINE/DBSS/pctfullss.html), která obsahuje patentové informace. Mezi plnotextové databáze bychom mohli zařadit celou řadu do ČR v posledních letech konsorciálně nakoupených systémů (za všechny například systém ProQuest http://www.proquest.cz/cojeto.htm).
Příklad:
V databázových centrech jsou uloženy plnotextové zdroje jako Washington Post On-line, Washington Times, New York Times a stovky dalších významných titulů z celého světa, jsou k dispozici databáze jako např. Newsletter Database, Investext, ABI/Inform, PROMT, World Reporter, kde je vhodné použít nástrojů typu proximitních operátorů, např. (n), (w), (s), ADJ, ADJACENCY, (a), WITH, NEAR, SAME, SENT, THRU. Tento typ operátorů umožňuje nalézt dokumenty s výskytem hledaných termínů na určitý počet slov vzdálených od sebe, a to v závislém pořadí, či naopak nezávislém, v jedné větě, odstavci, případně jich použít v určitých položkách (polích), jako je titul, deskriptorové pole apod. Bez proximitních operátorů, např. jen s využitím booleovských operátorů, bychom dosahovali velmi rozptýlených a nepřesných výsledků. Výsledky by byly relevantní možná z hlediska výskytu termínů, ale ne pertinentní k informačním potřebám uživatele. V plnotextových bázích dat se plně projevují jistá omezení booleovského modelu vyhledávání.

47. Studijně rozborová činnost
Produkty
Druhy: Výtahy (V), Informační zprávy (IZ), Studijně rozborové práce (SRP); hloubka, rozsah a náročnost zpracování, pracnost, míra uplatnění analýzy a syntézy a míra tvůrčího přínosu zpracovatele.
Typy: Signální elaboráty, Přehledové elaboráty, Speciální elaboráty; cíl který má být dosažen.
V kondenzované souhrny faktografických inf. vybraných k tématu z jednoho zdroje.
IZ kompilát faktor. inf. z více zdrojů ke konkrétnímu tématu.
SRP analytickosyntetická povaha, vyčerpávající průzkum, neustálá syntéza závěrů, návrhy řešení, spoluúd. zad. & zprac.
Signální el. – rychlá inf. o novinkách a okolnostech.(hlavně V nebo IZ); Přehledové el. – doplňování poznatkové zákl. uživ., pravidelnost, podklad pro rozhodování (IZ); Spec. el. – o konkrétně zadaných problémech, specifikovaný pož. (V, IZ, SRP) .

Jde o analyticko-syntetické dokumenty (pro lepší představu se nebojme ne sice přesného, ale aspoň přibližného označení – kompilátu, a to na vysoké intelektuální úrovni) obvykle „vyšší informační hodnoty“, které vznikají jako výraznější intelektuální nadstavba rešeršní (vyhledávací) činnosti.

Při rešeršní činnosti si dokumenty vyhledáváme (nebo necháme vyhledávat) v rozličných informačních systémech automatizované i neautomatizované povahy (databázové systémy, digitální knihovny, katalogy knihoven, fondy odborných článků, fondy studií, fondy šedé literatury, fondy statistických informací apod.) a získáváme první podklady pro řešení našich informačních potřeb a informačních požadavků. Samotné získání podkladů (například tzv. primárních nebo sekundárních dokumentů) nestačí, ale je nutno dokumenty prostudovat a informačně a obsahově zpracovat, vytěžit pro účely našich informačních potřeb, případně potřeb konečných uživatelů, pro které takovou činnost děláme.

Výsledkem je pak souvislý kvalitně zpracovaný text (po formální a obsahové stránce) reprezentující širší excerpční základnu zpracovávaných a průběžně citovaných informačních pramenů (které jsou nakonec souhrnně uvedeny v bibliografickém soupisu) na téma, které obvykle je určeno nějakému rozhodovacímu a řídícímu stupni (např. vrcholový management výrobní nebo obchodní společnosti, vysocí ministerští nebo vládní úředníci, představitelé organizací všech typů, šéfové výzkumu a vývoje apod.).

Formální úprava konečného textu může mít pro většinu nezasvěcených lidí méně obvyklou podobu a strukturaci, jako je např. číslovaní odstavců, silný odkazovací a citační aparát, rozdělení textu do vlastní „zprávy“ či „studie“ a do tzv. „souhrnu“, který zprávě předchází a má klíčový význam po obsahové stránce i pro přehlednost. Výsledný materiál je také doplněn tzv. analytickým listem s klíčovými slovy a abstraktem a základními údaji o práci.

Existuje více metodik na zpracovávání studií obecně, ale výsledkem a cílem je vždy analyticko-syntetický materiál, který je přehledný, může se číst běžnými způsoby čtení i metodami efektivního čtení, je vhodný a přímo vybízí pro listování a nelineární vnímání informací. Informace v dokumentu typu SRČ jsou více „průhledné“, snadno doložitelné, cituje se v textu, je odkazováno i na jiné očíslované odstavce, a to z důvodu nejen jisté etiky a respektování intelektuálního vlastnictví, ale pro průkaznost faktů a myšlenek. Autor takové SRČ práce si počíná maximálně objektivně a nepodléhá pokud možno účelovým výkladům. Na základě takové objektivizované SRČ práce může řídící pracovník lépe získat potřebné informace a znalosti a rozhodnout.

48. Nadstavba zpracování výstupů z on-line systému - jaká může být, uveďte příklady (např. vizualizace informací, data miningové metody apod.), intelektuální nadstavba, služby na míru uživateli s využitím rešeršních služeb
Data mining ([dejta majnyn], angl. dolování z dat) je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Někdy se chápe jako analytická součást dobývání znalostí z databází (Knowledge Discovery in Databases, KDD), tak například Berka (2003), jindy se tato dvě označení chápou jako souznačná.
Data mining se používá v komerční sféře (například v marketingu při rozhodování, které klienty oslovit dopisem s nabídkou produktu), ve vědeckém výzkumu (například při analýze genetické informace) i v jiných oblastech (například při monitorování aktivit na internetu s cílem odhalit činnost potenciálních škůdců a teroristů).
Metodologie data miningu
Společnou podstatou všech metodologií je následnost několika kroků:

* Obchodní/praktický - formulace úlohy a porozumění problému. Ani automatické vyhledávání znalostí nelze provádět zcela naslepo.
* Datový - vyhledání a příprava dat pro analýzu. Statistické algoritmy většinou potřebují data připravená v určité podobě, a proto není možné použít přímo surových dat z obchodních databází.
* Analytický - hledání informace v datech, vytváření statistických modelů a podobně. Využívají se nejrůznější metody od jednoduchých tabelací a vizualizací až po sofistikované přístupy jako je genetické programování. Asi nejčastěji používanými metodami však jsou logistická regrese s automatickým výběrem proměnných, rozhodovací stromy a neuronové sítě. Výstup této fáze bývá dvojí: Jednak obecnější znalosti (např. že svobodní klienti nejčastěji nakupují pozdě večer, zatímco ženatí po obědě), jednak matematické modely (např. postup, jak vytipovat potenciálního klienta pro daný produkt).
* Aplikační - zjištěné poznatky a modely je třeba uvést do praxe, například spuštěním reklamní kampaně nebo reorganizací webových stránek.
* Kontrolní - je třeba zajistit zpětnou vazbu (jak efektivní byla obchodní akce) a v případě déledobě nasazovaných modelů i kontrolovat, zda model příliš nezestárl a zachovává si svoji efektivitu.
49. Interview s uživatelem v rešeršní činnosti, zásady efektivního rozpoznání informačních potřeb uživatele
Informační potřeby jsou vždy velice individuální. Ani dva uživatelé pracující na stejném úkolu nebudou mít stejné informační potřeby. Faktorů ovlivňujících jejich informační potřeby je mnoho. Mezi nejdůležitější patří obor, ve kterém uživatel pracuje, země a kultura, ze které vychází, uživatelova osobnost, pracovní zkušenosti, pohlaví věk, časové možnosti, dostupnost informací, jejich cena a případné přehlcení uživatele informacemi.

OBOR A DRUH PRÁCE A POSTAVENÍ UŽIVATELE
Zaměstnání uživatele má velký vliv na jeho informační potřeby. Některá povolání, jako třeba novináři, mají přímo za cíl práci s informacemi, ale samozřejmě i lékaři, právníci a ostatní tvůrčí povolání potřebují ke své práci nové informace. Závisí na každém oboru a jeho dynamice, která určuje rychlost stárnutí informací.
Postavení uživatele a jeho úloha v pracovním procesu jsou dalšími faktory, které ovlivňují potřeby uživatele. Potřeby vedoucího pracovníka, vědce nebo pracovníka z praxe jsou odlišné.
Ve výzkumu je rychlejší dynamika nových informací. Každá vědecká komunita pracuje s informacemi jinak. Především je velký rozdíl mezi obory humanitně-společenskovědními a přírodovědnými. Také fáze výzkumu ovlivňuje potřebu informací a jejich druh.
Pro řízení jakéhokoliv podniku jsou potřeba informace o konkurenčním prostředí, o nových trendech, legislativní informace apod. Pro řídící pracovníky je typické, že mají málo času. Proto jsou pro ně důležité tzv. nástavbové služby jako studijně rozborové zprávy, či pouze výtahy v rozsahu jedné až jedné a půl stránky.
Zvláštní skupinou jsou studenti. Jejich informační potřeby jsou dány většinou osnovami a doporučenou literaturou. Takže jsou poměrně jasné a většinou i snadno uspokojitelné.
Pracovník v praxi samozřejmě potřebuje také nové informace. Závisí na činnosti, kterou vykonává, na možnosti a vůli se vzdělávat v daném oboru.
Rozhovor je asi nejoblíbenější a nejlepší metodou jak zjistit informační potřeby. Používá se ve standardizované (řízené) a nestandardizované (volné) formě. Jeho výhody jsou, že je tazatel v přímém kontaktu s uživatelem. Zabraňuje nedorozumění při nepochopení otázky dotazovaným nebo naopak dotazovaný může vysvětlit lépe co svou dopovědí myslí. Otázky by měly postupovat od obecných ke konkrétním. Rozhovor by měl být předem domluven a trvat přibližně 30 nejdéle však 60 minut. Uživatel by se měl při něm cítit dobře. Informační pracovník může sledovat neverbální komunikaci i reakce uživatele a může reagovat na vzniklé situace. Při rozhovoru se mohou objevit i zcela neočekávané otázky a odpovědi.
50. Příprava (trenink) rešeršních specialistů - struktura, problematika, vhodné metody přípravy různých skupin uživatelů
Možnost předplatného on-line služeb vedla k omezení vyhledávání na CD-ROM. K rozšíření databází na CD-ROM přispěla právě skutečnost, že vyhledávání v těchto databázích je uživatelům účtováno formou předplatného. O’Leary si dokonce v roce 1993 pohrává s odvážnou myšlenkou, že kdyby databázová centra nabízela předplatné už o pět let dříve, databáze na CD-ROM by byly patrně rozšířeny daleko méně. Flat-rate model použil poprvé Telebase Systems při zavádění svého EasyNet service v roce 1985 [11]. Dnes většina databázových center nabízí placení za služby mimo jiné i formou předplatného. Kontrakty bývají uzavírány s obchodním zástupcem databázového centra podle individuálních potřeb a možností zákazníka.
Zákazníci preferují předplatné ze tří důvodů: (1) chtějí se pojistit proti neočekávaně vysokým účtům, (2) chtějí mít možnost nadměrně využívat systém, (3) přejí si zbavit se tlaku narůstajících poplatků, které se načítají při každém použití systému [2]. Předplatné především osvobozuje rešeršéry od neustálého stresu, který doprovází práci pod velkým časovým tlakem. Také dává uživatelům pocit zadostiučinění, který pramení z toho, že jsou schopni využívat svých dovedností a znalostí k účelnému vyhledávání. Předplatné přispívá i k příznivějšímu klimatu pro školení a trénink nových rešeršérů.
Bezplatné a tréninkové databáze
Některé on-line centrály nabízejí několikrát měsíčně zlevněné nebo zcela bezplatné databáze. Smyslem je, aby se uživatelé seznámili s nově zaváděnými nebo méně využívanými databázemi. Nabídka je dvojí - výsledné informace jsou placené a časový limit zdarma ( happy hours), nebo je vše zdarma (freetime) [20]. Ve freetimu uživatel může obvykle během limitovaného časového intervalu vyzkoušet všechno, co by jinak často draze platil. Konkrétní datum, kdy bude databáze dostupná v tomto zvýhodněném režimu, je uživatelům včas oznámeno. Omezený přístupový čas zdarma je také často nabízen novým uživatelům.
Kromě zlevněných databází, které jsou dostupné za zvýhodněné ceny pouze v konkrétní datum, nabízejí databázová centra svým uživatelům i tzv. cvičné databáze, které jsou cenově zvýhodněné trvale. Jsou opět dostupné zcela zdarma nebo s velmi redukovanými cenami. Tyto databáze ale nejsou aktualizovány a obsahují pouze zlomek dat “originální databáze”, takže nemohou uživatelům nabídnout vyčerpávající a aktuální informace.
Nejlépe propracovaný systém školení, tutoriálů a on-line kurzů má databázové centrum Dialog Corporation. Možnost vyzkoušet si vyhledávání v databázích je dnes velmi bohatá. Kromě různých demoverzí se nabízejí např. u databázového centra Dialog tzv. ONTAP (On-line Training and Practice) databáze. Většinou má ale uživatel možnost v tréninkových databázích zdarma vyhledávat pouze v časově omezeném zlomku originální databáze (Dialog, DataStar, DIMDI, STN International). Cvičné databáze jsou dostupné většinou všem zájemcům, ale některé z nich mohou být dostupné jen pro registrované uživatele (např. STN Sneak Preview). Jedině Ovid nabízí komukoliv, tedy i neregistrovaným uživatelům, možnost dva týdny vyhledávat v ostrých databázích. DIMDI zpřístupňuje na svých stránkách zdarma databázi MEDLINE a některé další databáze. Informační pracovníci z akademických knihoven a z knihoven středních škol si mohou vyhledávání v LexisNexis Universe vyzkoušet díky FREE Web Trials (zkušební heslo je platné 30 dní). Účastníci školení Dow Jones Interactive mohou zkušební heslo používat následně ještě týden. Zdarma je také možné si v některých databázových centrech vytipovat relevantní databáze (DataStar, STN Free Search Preview).

51. Marketingová podpora uživatele/zákazníka databázových center či dialogových služeb obecně
Důležitou otázkou nadále zůstává, jak se bude měnit cenová politika databázových center v budoucnosti a zda se vůbec nějak změní přístup databázových center k cenám. Už dnes je zřejmé, že databázová centra musí v budoucnosti nabídnout co nejširší spektrum možností placení za služby, aby si každý zákazník mohl vybrat podle svých individuálních potřeb a možností. Za nejvýraznější trendy cenové politiky databázových center můžeme považovat :
• eliminaci poplatků za connect time
• specifikaci cen a produktů pro různé tržní segmenty - ceny šité na míru pro konkrétní situace
• předplatitelské kontrakty pro korporativní zákazníky
• platby za výstupy pro koncové uživatele
• orientaci na koncového uživatele - zjednodušení cenových struktur, nabídka služeb přes portály, platby kreditní kartou
• propracovaný systém slev - množstevní slevy, slevy pro akademické instituce, pro nové uživatele, pro studenty, atd.
• poskytování některých služeb zdarma - propagační akce (hrazené z reklam), tréninkové a cvičné databáze
O omezení poplatků za čas připojení se už hovoří poměrně dlouho, i když velká světová databázová centra, mezi která patří DataStar, STN International, Questel-Orbit a Ovid, stále ještě od této metody neupustila a Dialog dokonce od roku 2002 na přání zákazníků znovu zavedl poplatky za connect time jako alternativu k DialUnits. Výhod tohoto způsobu účtování využívají stále ještě hlavně zkušení rešeršéři. Do budoucnosti se ale počítá spíše s tím, že tradiční modely - především tedy connect time - budou nahrazeny kombinací jiných metod, které se více soustřeďují na hodnotu (cenu) vyhledané informace. Budoucnost patří flexibilním cenovým strategiím, vyhovujícím jak běžným koncovým uživatelům, tak velkým firmám, a proto budou dominovat především platby za výstupy pro uživatele, kteří služeb databázových center nevyužívají příliš často, kombinované s předplatným pro časté a velké uživatele.
S rostoucím důrazem na individuální vztahy s klienty se dá očekávat větší cenová diferenciace a modifikace produktů a služeb pro individuální potřeby. Největšího ocenění se dostane těm databázovým centrům, která dokáží 1) data integrovat tak, aby vyhovovala specifickým požadavkům trhu, a 2) nabídnout cenové strategie zaměřené na různé tržní segmenty. Rozdílný bude v podstatě způsob, jakým budou databázová centra účtovat stejné služby různým skupinám uživatelů. V nabídce nebudou chybět ani různé verze produktů (např. derivátů z jednoho zdroje) s rozdílnou kvalitou a cenou. To na druhé straně bohužel povede k obtížnějšímu porovnávání cen za on-line produkty.
Databázová centra, která se snaží o masové pronikání na trh, nabídla zcela specifické podmínky koncovým uživatelům. Vycházela přitom z faktu, že nezkušený koncový uživatel neovládá dotazovací jazyky ani principy rešeršní strategie. Vyhovují mu proto jednoduché předdefinované vyhledávací masky, grafická prostředí a jednoduchý a přehledný způsob účtování za služby. Těmto uživatelům nemá smysl účtovat poplatky za vlastní proces vyhledávání, protože většinou při vyhledávání tápou a dopouštějí se mnoha chyb a omylů. Služby jako DialogSelect, Dialog1, STNEasy, Dow Jones Interactive, Genios atd. vycházejí vstříc právě této skupině uživatelů. Účtují si pouze poplatky za zobrazené nebo vytištěné záznamy, články, reporty apod. Trend směrem k poplatkům za nalezené informace bude mít mimořádné důsledky pro on-line vyhledávací techniky. Je pochopitelné, že uživatelé budou muset zásadně změnit své rešeršní návyky.
Koncoví uživatelé nemusí ani využívat přímo služeb databázového centra, ale mohou informace vyhledávat prostřednictvím tzv. portálů, které integrují související informace a služby v co největším komfortu na jednom místě a kde databázová centra vystupují coby “neviditelný” poskytovatel dat. Za služby je většinou možné zaplatit ad hoc pomocí platebních karet. Portály zaměřené na uživatele poskytují v poslední době i profesionální on-line centra, jako příklad můžeme jmenovat PowerPortal u databázového centra Dialog.
U velkých podniků, informačních institucí a knihoven budou stále oblíbenější neomezené předplatitelské plány, díky kterým je snadné s předstihem určit, jak velkou částku z rozpočtu je třeba vyčlenit. Výhodné budou jak roční kontrakty, tak především smlouvy uzavřené na více let dopředu. Individuálně dohodnuté předplatitelské kontrakty nejvíce vyhovují v případech, kdy uživatelé nadměrně využívají systém, ale jsou nepraktické pro příležitostně využívané databáze. Databázová centra proto pravděpodobně zavedou předplatné pro své hlavní zdroje a u méně používaných zachovají stávající způsob účtování pay-as-you-go. Předplatné bude důležitou součástí cenových politik databázových center, protože jednoduše neexistuje žádný jiný způsob, jak zasáhnout masový trh, o který on-line průmysl usiluje. Předplatné je pro databázová centra také jedinou cestou, jak si mohou vybojovat zpět své zákazníky, kteří si oblíbili databáze na CD-ROM.
Velkým organizacím bude poskytováno široké spektrum slev a servisních služeb. Opomenuti nezůstanou ale ani menší uživatelé nebo jednotlivci. V propagaci on-line databázových služeb sehrají důležitou úlohu databáze poskytované zdarma a různé zkušební a cvičné databáze. Pro uživatele, kteří se teprve budou rozhodovat mezi službami jednotlivých center, to bude vítaná příležitost, jak si práci se systémem vyzkoušet nanečisto. Zkušební bezplatné přístupy k novým databázím a službám jsou ale důležité i pro registrované uživatele, kteří tak mají možnost seznámit se s novou databází.
Databázová centra mohou nabídnout bezplatně základní informace na internetu a doufat, že přilákají vysoký počet návštěvníků, z nichž někteří posléze využijí sofistikovanější placené služby. V prostředí on-line databázového průmyslu se dá počítat např. s bezplatným zveřejněním bibliografických záznamů a placeným přístupem k plným textům. Aby mohla databázová centra některé své služby nabízet za velmi nízké ceny nebo zdarma, musí dát na svých stránkách prostor reklamě, což bylo ještě před několika lety nemyslitelné. Obsahově bude reklama odpovídat požadavkům konzumentů a přímo korespondovat se zaměřením databázového centra.
Jen tak mohou databázová centra odolat nátlaku nepřeberného množství informací, které jsou zdarma dostupné na internetu. V éře internetu spočívá konkurenční výhoda tradičních databázových center stále především v kvalitním obsahu a retrospektivě zpřístupňovaných databází, které se slučují s potřebami jejich uživatelů. Zanedbatelné není ani hledisko úspory času a jistota, že jednou vystavená data za čas nezmizí, jak se na serverech WWW často stává.

53. Výstupní formáty dokumentů - účel a význam, příklady, vztah ceny a formátů
lektronický dokument obvykle transformujeme z jednoho vstupního formátu do několika výstupních. Každý z výstupních formátů nabízí jiné možnosti, dle oblasti svého určení.
Dokument by měl efektivně využívat všech nabízených možností daného formátu (obsahy, rejstříky, vkládání obrázků, odkazy).
Formáty dokumentů rozdělujeme do několika základních kategorií:
formáty vhodné pro tisk a distribuci (PDF, PostScript, RTF)
elektronická nápověda (HTML Help, Java Help, man, info)
webové stránky (HTML a XHTML)
proprietální formáty
Formáty vhodné pro tisk a distribuci
PostScript (PS) je programovací jazyk, sloužící pro popis vzhledu stránky. Byl vyvinut společností Adobe v osmdesátých letech minulého století. Ačkoliv se však jedná o programovací jazyk, díky svým velkým možnostem a složitosti se v něm nepracuje „přímo“, ale využívají se nástroje pro generování postscriptových souborů. Zřejmě nejčastěji využívaným prohlížečem tohoto formátu je program Ghostscript, který zvládne i jeho konverze do jiných formátů.
Je s ním úzce spjat formát EPS (Encapsulated PostScript), který byl navržen za účelem reprezentace a přenosu grafických dat mezi platformami. Využívá se proto především pro ukládání obrázků.
PDF (Portable Document Format) vytvořila také firma Adobe. Je de facto nástupcem PostScriptu. V současné době se dá považovat za standardní formát, vhodný pro šíření elektronických dokumentů (články, knihy, prezentace, aj.). Umožňuje sdružit formátovaný text spolu s vektorovou i bitmapovou grafikou do jednoho souboru. Soubor je vnitřně komprimovaný, proto bývají PDF dokumenty relativně malé. Jeho hlavní výhodou je zajištění naprosto stejného vzhledu dokumentu na obrazovce i na tiskárně. Drobnou nevýhodou naopak může cena mateřského nástroje pro generování tohoto formátu (program Adobe Acrobat), avšak existuje celá řada alternativních programů, které dokáží s tímto formátem pracovat. Pro jeho prohlížení je nezbytné mít nainstalovaný speciální prohlížeč, obvykle Adobe Acrobat Reader, existují však i některé alternativní prohlížeče, např. XPDF pro Linux.
RTF (Rich Text Format) byl navržen společností Microsoft. Jedná se opět o jakýsi popisovací jazyk, jenž charakterizuje dokument. Byl navržen jako výměnný formát pro přenášení dokumentů mezi různými programy. Formát je široce podporován, např. v kancelářských balících Microsoft Office, OpenOffice.org, ale i v dalších programech, které pracují s formátovaným textem.
Formáty pro elektronickou nápovědu
HTML Help je formát nápovědy, užívaný na platformě Windows. Umožňuje spojit HTML stránky a obrázky do jednoho souboru, který zároveň nabízí obsah dokumentu, rejstřík a full-textové prohledávání. Windows obsahují vestavěný prohlížeč těchto souborů. Soubory HTML Help jsou preferovaným způsobem dokumentace k programům na této platformě. Existuje však i prohlížeč HTML nápovědy pro unixové operační systémy.
Java Help je dokumentační systém, vyvinutý společností Sun pro programovací jazyk Java. Díky provázanosti s tímto jazykem umožňuje generování přehledné a platformově nezávislé dokumentace k programům přímo ze zdrojových kódů. Dokumentace je postavena na bázi HTML.
Linuxové příkazy man a info tvoří jádro dokumentace tohoto operačního systému. Obsahují hypertextovou dokumentaci jak k programům, tak k jednotlivým částem programovacích jazyků.
Webové stránky
Jediným formátem, vhodným pro tvorbu webových stránek je samozřejmě značkovací jazyk HTML, resp. jeho novější varianta XHTML.
Proprietální formáty
Tyto formáty jsou úzce spjaty s konkrétním softwarovým produktem. Typickým představitelem je například formát Microsoft Word (DOC). Záleží jen na autorovi příslušného software, jaké možnosti bude formát dokumentu nabízet. Dokumenty se z těchto formátu zpravidla za účelem sjednocení a univerzálnosti konvertují do formátů uvedených výše.
54.Současné modely platby informačních služeb a využívání informačních systémů
Poplatky za proces vyhledávání
Poplatky, které se váží na vlastní proces vyhledávání, jsou účtovány databázovým centrem na měsíční/roční bázi nebo v jiných časových intervalech. Částky mohou být fixní nebo variabilní. Zatímco počáteční náklady obvykle vyžadují zvláštní dotace, náklady na vyhledávání v on-line databázích už bývají zahrnuty do rozpočtu organizace. Nejčastější jsou dnes dva způsoby úhrady za služby databázových center:

• předplatné (flat-fee, fixed-fee, all-you-can-eat)
• platby jen za uskutečněné operace (pay-as-you-go)
Účtování za čas připojení
Placení za čas připojení je výhodné, protože je jednoduché. Profesionální rešeršéři mohou princip jednoduše vysvětlit koncovým uživatelům a uživatelé mu snadno porozumí. Náklady na vyhledávání se dají vypočítat a odhadnout dopředu, takže uživatelé přibližně vědí, kolik jejich rešerše bude stát ještě před tím, než začnou s vyhledáváním.
Nápad použít connect time jako základ pro účtování služeb je v dnešní době překonán. Jedním z nedostatků je fakt, že čas, po který je uživatel k systému připojen, neodpovídá ani zdrojům, které jsou využívány, ani objemu informací, které jsou vyhledány [6]. Nevýhodné je také to, že náklady na vyhledávání kolísají v závislosti na vytížení on-line systému. Metoda kalkulace ceny na základě délky doby, po kterou je uživatel k systému připojen, má také nevýhodu v tom, že konečná částka zaplacená uživatelem je hodně závislá na použitém softwarovém a hardwarovém vybavení a v nejlepším případě i na schopnosti uživatele rychle psát.
Poplatky za využití systémových prostředků (resource unit pricing)
Zatímco poplatky za connect time nebo za výstupy jsou celkem dobře predikovatelné, u poplatků za resource unit je celá situace komplikovanější. Uživatelům jsou účtovány poplatky za dobu zpracování, přístup k diskům, vstupní a výstupní operace a využití dalších počítačových zdrojů spojených s konkrétním dotazem. Zastánci tohoto způsobu účtování argumentují tím, že tento model přesně reflektuje komplexnost dané rešerše a spravedlivě účtuje uživatelům poplatky za počítačové operace, které sami spustí. Čím je tedy dotaz obtížnější, tím více uživatel za vyhledávání zaplatí. Mezi další výhody patří například fakt, že nejsou postihováni pomalí písaři a uživatelé, kteří v systému vyhledávají v době jeho nejvyššího pracovního vytížení. Výrazným nedostatkem je pak na druhé straně obtížná předvídatelnost výše poplatků

DialUnits
DialUnits (Dialog Interactive Language Units) reprezentují využití systémových zdrojů nezbytných pro uskutečnění vyhledávacího příkazu. DialUnits se negenerují jen při použití vyhledávacích příkazů, ale při použití všech příkazů (EXPAND, SELECT, atd.), přičemž některé příkazy (jako např. REPORT, SORT a RANK) využívají systémové zdroje daleko intenzivněji, takže jejich použitím se generuje větší počet DialUnits. DialUnits se negenerují při použití administrativních příkazů (jako např. COST, DISPLAY SETS, LOGOFF, EDIT nebo HELP). Pro výpočet nákladů na vyhledávání je třeba počet generovaných DialUnits vynásobit cenou za 1 DialUnit, která je stanovena individuálně pro každou databázi.

Předplatné (flat-fee, fixed rate)
Možnost předplatného on-line služeb vedla k omezení vyhledávání na CD-ROM. K rozšíření databází na CD-ROM přispěla právě skutečnost, že vyhledávání v těchto databázích je uživatelům účtováno formou předplatného. O’Leary si dokonce v roce 1993 pohrává s odvážnou myšlenkou, že kdyby databázová centra nabízela předplatné už o pět let dříve, databáze na CD-ROM by byly patrně rozšířeny daleko méně. Flat-rate model použil poprvé Telebase Systems při zavádění svého EasyNet service v roce 1985 [11]. Dnes většina databázových center nabízí placení za služby mimo jiné i formou předplatného. Kontrakty bývají uzavírány s obchodním zástupcem databázového centra podle individuálních potřeb a možností zákazníka.
Zákazníci preferují předplatné ze tří důvodů: (1) chtějí se pojistit proti neočekávaně vysokým účtům, (2) chtějí mít možnost nadměrně využívat systém, (3) přejí si zbavit se tlaku narůstajících poplatků, které se načítají při každém použití systému [2]. Předplatné především osvobozuje rešeršéry od neustálého stresu, který doprovází práci pod velkým časovým tlakem. Také dává uživatelům pocit zadostiučinění, který pramení z toho, že jsou schopni využívat svých dovedností a znalostí k účelnému vyhledávání. Předplatné přispívá i k příznivějšímu klimatu pro školení a trénink nových rešeršérů.
Poplatky za výstupy
• zobrazený záznam/dokument (display charge)
• nebo vytištěný záznam/dokument (print charge)
• nebo přetažený záznam/dokument (downloading)
Poplatky za zobrazení (display charge)
Po zadání příkazů TYPE nebo DISPLAY (uvedené příkazy platí pro databázové centrum Dialog) se uživateli zobrazí ve zvoleném formátu výsledky jeho vyhledávání. Je důležité pečlivě zvolit jak formát zobrazení, tak i konkrétní počet zobrazených záznamů, protože se platí za každý záznam. Poplatky za on-line zobrazení se týkají bibliografických citací, abstraktů, plnotextových dokumentů nebo jiných informací zobrazených během relace. Protože zobrazené informace mohou být okamžitě uloženy na pevný disk, jsou poplatky za zobrazení a downloading u většiny databázových center identické.
Poplatky za tisk (print charge)
Pro vytištěné záznamy existuje dvojí taxa - za záznamy vytištěné offline (v databázovém centru) nebo on-line (u uživatele). Poplatky za tisk offline obvykle neobsahují výdaje za poštovné, ale někdy zahrnují manipulační poplatky. Většina on-line databázových center zavedla standardní cenu za vytištění plnotextového záznamu z každé databáze. Za formáty tisku, které obsahují méně informací než plnotextový záznam, jsou účtovány snížené částky z cen plného textu. V některých případech je účtována i cena za vytištění jednotlivých stránek, citací, odstavců, znaků nebo polí.
55. Stárnutí informací a volba informačního systému, zvolení efektivní informační - rešeršní strategie
Stárnutí informace znamená snížení její hodnoty v čase. Hodnota informace se mění, protože vznikají nové nebo přesnější poznatky, které zpětně ovlivňují současné teorie, shromážděná data nebo metody.
Hlavní metodou zjišťování stárnutí informací je citační analýza. Bibliografická citace v závěru článku říká, které informační zdroje byly v práci použity a jaké je jejich datum vydání. Bibliografická citace je využita v citačních rejstřících. K jedné bibliografické citaci jsou uvedeny všechny citace, které na ni odkazují. Další metodou je zjišťování rozložení výpůjček ve vztahu k datu vydání publikace.
Stárnutí informací a citační analýza
Otázkou je, zda lze pomocí citací měřit stárnutí informací; jinak také stárnutí (zastarávání) literatury. Jestliže si zkusíme z jednoho ročníku časopisu vypsat všechny použité bibliografické citace a rozdělíme je podle roku vydání, získáme přehled, jak jsou citace rozděleny podle roku vydání. V případě časopisu běžného roku dostaneme obvykle odkazy na literaturu vydanou v posledních několika letech, tj. na nejnovější práce. Můžeme vytvořit graf znázorňující vztah mezi rokem vydání (na ose bude uveden v obráceném pořadí: současnost - minulost) a počtem citací v roce. Dostaneme kvazi exponenciální křivku, která bude klesat ve směru od nejnovější k nejstarší literatuře.
Pro každou funkci, která se mění exponenciálně s časem, lze definovat časový interval zvaný poločas. Klasickým příkladem je poločas rozpadu radioaktivní látky. Poločas rozpadu je doba, která je třeba, aby se rozpadla polovina určitého množství radioaktivní látky. Citovaná vědecká díla nezanikají, ale mění se jejich užití vyjádřené počtem citací, a ten může být i nulový.
Stárnutí informací lze měřit informačním poločasem, dobou, během níž byla vydána díla odpovídající polovině všech v současnosti citovaných publikací.
Příkladem originální a reprezentativní české práce, která obsahuje průzkum časové struktury citací je [12]. Průzkum časového rozložení citací se týkal časopisu Čs. oftalmologie (ČO), ročníků 1974, 1979, 1980 a 1981. Celkový počet citací v uvedených ročnících činil 4140 citací. Seznam citovaných časopisů uveden není.
Stáří citací je určováno tak, že citace na publikace s týmž vročením jako zdrojový ročník ČO mají stáří 0, citace na publikace z předcházejícího roku stáří 1, atd. Výsledky jsou obsaženy v níže uvedeném grafu, který zahrnuje frekvenční a součtovou křivku procentuálního počtu citací v jednotlivých letech až do stáří 20 let. Na součtové křivce je medián časového rozdělení četností všech citací roven 8,1 roků, tj. poločas stárnutí publikací je 8,1 roku. Autor se zabýval především vzestupnou částí frekvenční křivky, neboť zkoumal dostupnost citovaných publikací v čase. Pro zjišťování stárnutí má naproti tomu význam sestupná část křivky.
56. Pre-internetovské a internetovské období ve vztahů k on-line službám zejména databázových center
Databázová centra, jež první vznikala už v 60. letech, byla a jsou přístupná po profesionálních sítích zcela nezávislých na Internetu (např. SPRINTNET, TYMNET, NEXTEL, DATEX-P a desítky dalších větších sítí typu WAN - Wide Area Network). Nicméně velký vývoj internetovských technologií, které ovlivnily i vztah zprostředkovatelů - vystavovatelů a producentů dat, zamíchal oblastí nazývanou "informační průmysl", jehož oporou vždy byla především velká a střední databázová centra.
Plnotextové báze dat jsou přístupné přes dialogový (on-line) přístup již od 70. a 80. letech nezávisle na internetu a následně již s jeho využitím od 90. let, a to zejména přes WWW rozhraní. Ve většině případů je tato platforma přístupu k primárním dokumentům na komerční bázi.
Služby databázových center jsou na jedné straně velmi podobné, jako byly před 20-30 lety, ale na druhou stranu se mění přístupové možnosti, uživatelská rozhraní a nabídka komplexnosti služeb. V současnosti je vhodné kombinovat nejen proces vyhledávání, ale zároveň efektivní přístup k primárnímu dokumentu. To vše centra umožňují s naprostou samozřejmostí a přehledem.
Internet – celosvětová veřejná počítačová síť se vyvinula v 60. letech z počítačové sítě ARPANET, což byla síť, kterou dala vytvořit vláda USA pro americké ministerstvo obrany, v době studené války. Výsledkem výzkumu u Rand Corporation byla geniální síť, která ve své době vyvolala senzaci, protože byla bez centrálního řízení a při výpadku kteréhokoliv počítače v síti nedošlo ke zhroucení celé sítě, jak to bylo za časů centrálních počítačů.
Síť ARPANET byla zveřejněna v roce 1964 a již další rok se zrodil on-line systém vyhledávání bibliografických informací a ve spolupráci s NASA a vznikl systém RECON (Remote Console Information Retrieval Services), přes který se vyhledávaly informace v informačních databázích . Ve své době obsahovala opravdu rekordní počet půl milionů záznamů.
V bývalém ČSSR vznikly centra VTEI – vědecké, technické a ekonomické informace, které se začaly utvářet po roce 1970 a plných 20 let tvořily jednotnou soustavu informační sítě v tehdejším Československu. Střediska VTEI působila ve vědeckých knihovnách, výzkumných ústavech, akademii věd apod. Už na začátku 70. let se začalo uskutečňovat hromadné zavádění automatizace bibliograficko-informačních služeb. Do roku 1975 se využívaly systémy velkých bibliografických databází, mezi nejznámější patřily CHEMBASE, INSPEC, INIS, COMPENDEX apod. V 80. letech pak VTEI měla přístup do databází Dialog, BRS, Data-Star, ORBIT, Questel a dalších.
Nárůst počtu publikovaných dokumentů vedl ke vzniku nových služeb informačního průmyslu, bylo rozšířeno vydávání referátových periodik, později dokumentografických bází dat, vznikli noví producenti sekundárních informačních zdrojů a databázová centra, subskripční agentury, poskytovatelé on-line přístupů k elektronickým informačním zdrojům a také komerční dodavatelé dokumentů. Nové možnosti pro šíření informačních zdrojů pak přinesly moderní informační technologie, které ovlivňovaly především oblast elektronického publikování. Elektronické publikování tedy nabídlo další změnu v komunikaci vědeckých informací.

Tyto trendy, jejichž nejvýznamnějším projevem je přechod od přímého vlastnictví dokumentů směrem k zajištění přístupu k nim, se začaly projevovat již v průběhu 80. let 20.století. Další zřetelné zvýrazňování rozdílů mezi tradičním a virtuálním knihovnickým prostředím je pak možné sledovat v 90. letech 20. století. Virtuální prostředí zrušilo geografická omezení, která dříve výrazně ovlivňovala nejen přístup k informačním pramenům, ale také dostupnost informací o nich. Elektronické publikování změnilo způsoby šíření, zpracování, zpřístupňování i uchovávání dokumentů. Dostupnost informací o publikovaných dokumentech, snadnost jejich lokalizace i možnost zajištění „okamžitého“ přístupu k nim, dnes směřují k tomu, že mnohé vědecko-informační instituce začínají uvažovat o zakoupení dokumentu až v okamžiku vzniku uživatelova požadavku daného dokumentu. Základem rozhodování je tedy schopnost určit nejvýhodnější způsob, jak uživatelům zajistit přístup k informacím, které potřebují.

Zpracování dat v polovině 50. let. Zpracování organizováno systémem vše v mém programu. Uživatel zahrnoval do svého programu dohromady: popis dat, data, uživatelské komunikační rozhraní, algoritmus použité metody zpracování, případně různé typy zpracování (modely). Každý program pracoval zvlášť s omezeným množstvím dat.
Od poloviny 60. let se objevují systémy s monitorem, uživatelské programy mohly pracovat nad více množinami dat. Data byla oddělena od programů, nicméně jejich popis zůstal fyzicky v programech. Konzistence těchto dat je udržována jen velmi problematicky a zhoršuje se rozvojem IS.
Uživatelská rozhraní – interakce s uživatelem mimo aplikace (80. léta)
V 80. letech se vynořují UIMSs (User Interface Management Systems) umožňující tvůrcům aplikací vysunout z aplikací interakci s uživatelem. Vznikají aplikace se standardizovaným rozhraním vzhledem ke komunikační vrstvě. Ta pak umožňuje uživateli přistupovat k aplikaci z různých variant rozhraní, např. z displeje, tiskárny, Internetu, speciálními datovými kanály apod.
Workflow – procesy mimo aplikace (90. léta)
90. léta jsou charakteristická nástupem programového vybavení workflow (český překlad není zatím ustálen), který umožňuje tvůrcům aplikací vymístit definici procesů mimo aplikace.

56. Pre-internetovské a internetovské období ve vztahů k online službám zejména databázových center

Databázová centra, jež první vznikala už v 60. letech, byla a jsou přístupná po profesionálních sítích zcela nezávislých na Internetu (např. SPRINTNET, TYMNET, NEXTEL, DATEX-P a desítky dalších větších sítí typu WAN - Wide Area Network). Nicméně velký vývoj internetovských technologií, které ovlivnily i vztah zprostředkovatelů - vystavovatelů a producentů dat, zamíchal oblastí nazývanou "informační průmysl", jehož oporou vždy byla především velká a střední databázová centra.
Plnotextové báze dat jsou přístupné přes dialogový (online) přístup již od 70. a 80. letech nezávisle na internetu a následně již s jeho využitím od 90. let, a to zejména přes WWW rozhraní. Ve většině případů je tato platforma přístupu k primárním dokumentům na komerční bázi.
Služby databázových center jsou na jedné straně velmi podobné, jako byly před 20-30 lety, ale na druhou stranu se mění přístupové možnosti, uživatelská rozhraní a nabídka komplexnosti služeb. V současnosti je vhodné kombinovat nejen proces vyhledávání, ale zároveň efektivní přístup k primárnímu dokumentu. To vše centra umožňují s naprostou samozřejmostí a přehledem.
Internet – celosvětová veřejná počítačová síť se vyvinula v 60. letech z počítačové sítě ARPANET, což byla síť, kterou dala vytvořit vláda USA pro americké ministerstvo obrany, v době studené války. Výsledkem výzkumu u Rand Corporation byla geniální síť, která ve své době vyvolala senzaci, protože byla bez centrálního řízení a při výpadku kteréhokoliv počítače v síti nedošlo ke zhroucení celé sítě, jak to bylo za časů centrálních počítačů.
Síť ARPANET byla zveřejněna v roce 1964 a již další rok se zrodil online systém vyhledávání bibliografických informací a ve spolupráci s NASA a vznikl systém RECON (Remote Console Information Retrieval Services), přes který se vyhledávaly informace v informačních databázích . Ve své době obsahovala opravdu rekordní počet půl milionů záznamů.
V bývalém ČSSR vznikly centra VTEI – vědecké, technické a ekonomické informace, které se začaly utvářet po roce 1970 a plných 20 let tvořily jednotnou soustavu informační sítě v tehdejším Československu. Střediska VTEI působila ve vědeckých knihovnách, výzkumných ústavech, akademii věd apod. Už na začátku 70. let se začalo uskutečňovat hromadné zavádění automatizace bibliograficko-informačních služeb. Do roku 1975 se využívaly systémy velkých bibliografických databází, mezi nejznámější patřily CHEMBASE, INSPEC, INIS, COMPENDEX apod. V 80. letech pak VTEI měla přístup do databází Dialog, BRS, Data-Star, ORBIT, Questel a dalších.
Nárůst počtu publikovaných dokumentů vedl ke vzniku nových služeb informačního průmyslu, bylo rozšířeno vydávání referátových periodik, později dokumentografických bází dat, vznikli noví producenti sekundárních informačních zdrojů a databázová centra, subskripční agentury, poskytovatelé online přístupů k elektronickým informačním zdrojům a také komerční dodavatelé dokumentů. Nové možnosti pro šíření informačních zdrojů pak přinesly moderní informační technologie, které ovlivňovaly především oblast elektronického publikování. Elektronické publikování tedy nabídlo další změnu v komunikaci vědeckých informací.

Tyto trendy, jejichž nejvýznamnějším projevem je přechod od přímého vlastnictví dokumentů směrem k zajištění přístupu k nim, se začaly projevovat již v průběhu 80. let 20.století. Další zřetelné zvýrazňování rozdílů mezi tradičním a virtuálním knihovnickým prostředím je pak možné sledovat v 90. letech 20. století. Virtuální prostředí zrušilo geografická omezení, která dříve výrazně ovlivňovala nejen přístup k informačním pramenům, ale také dostupnost informací o nich. Elektronické publikování změnilo způsoby šíření, zpracování, zpřístupňování i uchovávání dokumentů. Dostupnost informací o publikovaných dokumentech, snadnost jejich lokalizace i možnost zajištění „okamžitého“ přístupu k nim, dnes směřují k tomu, že mnohé vědecko-informační instituce začínají uvažovat o zakoupení dokumentu až v okamžiku vzniku uživatelova požadavku daného dokumentu. Základem rozhodování je tedy schopnost určit nejvýhodnější způsob, jak uživatelům zajistit přístup k informacím, které potřebují.

Zpracování dat v polovině 50. let. Zpracování organizováno systémem vše v mém programu. Uživatel zahrnoval do svého programu dohromady: popis dat, data, uživatelské komunikační rozhraní, algoritmus použité metody zpracování, případně různé typy zpracování (modely). Každý program pracoval zvlášť s omezeným množstvím dat.
Od poloviny 60. let se objevují systémy s monitorem, uživatelské programy mohly pracovat nad více množinami dat. Data byla oddělena od programů, nicméně jejich popis zůstal fyzicky v programech. Konzistence těchto dat je udržována jen velmi problematicky a zhoršuje se rozvojem IS.
Uživatelská rozhraní – interakce s uživatelem mimo aplikace (80. léta)
V 80. letech se vynořují UIMSs (User Interface Management Systems) umožňující tvůrcům aplikací vysunout z aplikací interakci s uživatelem. Vznikají aplikace se standardizovaným rozhraním vzhledem ke komunikační vrstvě. Ta pak umožňuje uživateli přistupovat k aplikaci z různých variant rozhraní, např. z displeje, tiskárny, Internetu, speciálními datovými kanály apod.
Workflow – procesy mimo aplikace (90. léta)
90. léta jsou charakteristická nástupem programového vybavení workflow (český překlad není zatím ustálen), který umožňuje tvůrcům aplikací vymístit definici procesů mimo aplikace.




57. Historie dialogových informačních systémů ve světě - od 60.let, etapy

Díky masivnímu nástupu technologické inovace ve výpočetní technice, která proběhla v 60. letech došlo k významnému posunu v technologii práce výpočetních systémů v dialogovém (online) režimu. Koncem 60. let a zejména v průběhu 70. let se ve světě prudce rozvinuly informační systémy, které dnes představují rozsahem informačních fondů uložených v počítačích, množstvím uživatelů a organizací práce na komerčním základě, skutečně nový druh průmyslu. Vznikají tzv. databázová centra. Jádrem dialogových služeb databázových center je systém, v němž na velkých hostitelských počítačích s mohutnou kapacitou vnějších pamětí, se ukládají soubory dat, získaných od různých producentů, zpravidla jako magnetopáskové služby, do bází dat, které tyto počítače prostřednictvím speciálně připraveného aplikačního programového vybavení zpřístupňují v dialogovém režimu. Na tato databázová centra se lze napojit prostřednictvím telekomunikačních sítí, které to v jednotlivých případech umožňují. Uživatel musí mít k dispozici terminál napojený do příslušné komunikační sítě. Kromě toho musí mít komunikační přístup zajištěný smlouvou s provozovateli těchto sítí a s provozovateli vybraných databázových center.

Dialog Corporation - Klasickým příkladem databázového centra ve světě informačních služeb je systém DIALOG. Jeho počátky sahají do roku 1963, kdy firma Lockheed Missiles and Space Company založila laboratoř pro výzkum a vývoj systému automatizovaného zpracování informací. V roce 1965 zde byl předveden dialogový systém vyhledávání v bázi bibliografických záznamů použitím techniky koordinovaného počítačového registru jako metody organizace souborů, v nichž probíhá interaktivní vyhledávání. V roce 1968 laboratoř vyhrála konkurs na získání kontraktu pro vyvinutí a zavedení automatizovaného informačního systému pro NASA. Na tomto základě byl vyvinut aplikační programový systém pro dialogové vyhledávání informací ve velkých bázích dat s názvem RECON (Remote Console Information Retrieval Services).
Vlastní komerční služba databázového centra společnosti s názvem Dialog Information Service, se sídlem centra v kalifornském Palo Alto, byla založena až v roce 1972. V roce 1992 se databázové centrum Dialog spojilo s evropským DataStar, dříve nesmiřitelným konkurentem, nyní koexistující pod jedním majitelem.

Dalším významným databázovým centrem je H.W. Wilson. Základní skupina databází pokrývá různorodé tematické oblasti. Firma nainstalovala pro způsoby vyhledávání záznamů systém WilsonWeb
Firma Wilson byla založena roku 1898 osobností, po které dostala i jméno, panem Halsey Williamem Wilsonem. Světový věhlas si firma, která v roce 1913 přesídlila do New Yorku z původního Minneapolis, získala již prvním počinem – v roce 1898 zahájila přípravu a publikování periodických sešitů světové bibliografie všech anglických knih „Cumulative Book Index“ s cílem pomoci tehdejšímu americkému knižnímu trhu a také knihovnám.
V roce 1901 firma začala tvořit univerzální a oborové bibliografické soupisy. Velkým přínosem, zejména pro knihovny, byla polytematická výběrová bibliografie článků z periodického tisku „Reader´s Guide to Periodical Literature“.
Od roku 1985 bylo zahájeno postupné dialogové zpřístupňování bází dat přes počítačové sítě v samotném databázovém centru firmy Wilson (systém WilSearch), později i prostřednictvím dalších partnerů, jako jsou společnosti a firmy OCLC, Ovid Technologies nebo SilverPlatter Information. Od 90. let začaly být báze zpřístupňované prostřednictvím CD-ROM ve vlastním systému firmy Wilson (Wilson OnDisc). Rok 1995 - v souvislosti s rozvojem nových informačních technologií, zejména WWW, zahájení zpřístupňování plných textů dokumentů připojovaných k základní skupině bibliografických bází dat. V roce 1997 firma Wilson uvádí nejnovější způsob vyhledávání ve svých bázích dat prostřednictvím technologie WWW v aplikovaném systému „WebSpirs“ firmy SilverPlatter nazvaném „WilsonWeb“.

LEXIS/NEXIS je databázové centrum orientující se na americkou legislativu a legislativu vybraných států. Významnou službou je služba EDGAR Plus nebo ScienceDirect.
V roce 1974 MDC provozně zavedlo systém online zpřístupňování plných textů dokumentů americké legislativy, v podstatě jakési elektronické knihovny využitelné různými právními profesemi, zejména v advokacii, s názvem LEXIS. Je až dosud nejpopulárnější službou tohoto druhu v USA. Vychází z podstaty americké soudní praxe a zpřístupňuje nejen právní předpisy, ale i texty zdokumentovaných ukončených právních případů. Vzhledem k postupně získanému v podstatě výlučnému – monopolnímu postavení v této oblasti (konkuruje mu pouze obdobný databázový systém s názvem WESTLAW), udržuje na relativně vysoké výši ceny za využívání.
Na konci 90. let se rozsah zachycení plných textů právních dokumentů rozšířil z původního zaměření jen na USA tak, že se inzeruje úplné pokrytí legislativy také Anglie, Francie, Kanady a ve výběru také Austrálie, Nového Zélandu, Mexika, Irska a Skotska.
Obdobně jako je od počátku LEXIS orientován na přímé, informačními specialisty nezprostředkované využívání profesionály v oblasti práva, vytvářel se od přelomu 70. a 80. let v centru MDC další databázový systém – MEDIS. Byl orientován na nejširší vrstvy opět jedné z nejrozšířenějších profesí v USA – lékařů.
Od roku 1995 je online zpravodajství v databázích LEXIS/NEXIS napojeno na známou agenturu CNN.

OCLC, organizace sídlící ve státě Ohio, nabízí svým členům počítačové knihovnické služby komplexní povahy. Jádrem celého systému je největší databáze na světě OLUC, která je v novější literatuře označována termínem Světový katalog. V současné době se nejvíce užívá služba First Search. OCLC (Online Computer Library Center) bylo založeno roku 1971 a do provozu bylo uvedeno o rok později. Centrum vzniklo na bázi sítě původních 54 školních a univerzitních knihoven ve státě Ohio.
Novou významnou výzkumnou činností OCLC je výzkum a vývoj v oblasti knihoven. Nejvýznamnější aktivitou je pak oblast metadat, zejména Iniciativy Dublinského jádra DCMI (Dublin Core Metadata Initiative), jež sídlí při OCLC.

Ovid Technologies se na scéně amerických online vystavovaných informačních služeb orientuje na akademickou a vědeckou obec. Vystavuje kolem 100 bází dat a používá systém BRS Search, který se úspěšně uplatnil i v jiných databázových centrech.
V roce 1976 se na scéně amerických online informačních služeb objevilo další databázové centrum, orientované výrazně na akademickou, vědeckou a výzkumnou obec, vyžadující převážně bibliografické zpracování světové literární, zejména časopisecké produkce. To vyjadřoval i dřívější název systému – BRS (Bibliographic Retrieval Service). Aplikační programový databázový systém BRS Search se uplatnil později i jako jádro technologie centra Data-Star a navíc byl velmi úspěšně šířen ve verzi pro osobní počítače.
Z prvních 10 vystavovaných databází se nabídka BRS rozrostla v 80. letech postupně až na zhruba 170, včetně bází plných textů dokumentů a nebibliografických vědeckých, převážně numerických databází, derivovaných na základě laboratorních výzkumů. Nejvýznamněji pokrývá lékařské obory včetně farmacie, dnes i v oblasti souvisejících nebibliografických obchodních informací.
V roce 1994 se centrum po odkoupení společností CDP Technologies přejmenovalo na Ovid Technologies, Inc. Nabídka databází se oproti 80. letům snížila na necelých 100 titulů, ale uživatelská obec se rozrostla. Změnil se také charakter většiny databází, a to na plné texty dokumentů, vystavovaných současně s jejich bibliografickými záznamy. Jedná se především o elektronické verze knih a časopisů.

Data-Star - toto databázové centrum vzniklo v době, kdy už byl i v Evropě informační trh v oblasti online služeb v podstatě obsazen. Přesto se systém umístěný do Bernu ve Švýcarsku prosadil překvapivě výrazně, a to nejen v evropském měřítku. Lze to přičíst nejen dobře zvolenému softwarovému selekčnímu systému BRS Search, který zde byl ještě vylepšen, ale zejména díky výběru vystavovaných databází, jejichž sortiment se rychle rozšiřoval a obsahoval kromě nejatraktivnějších dokumentografických také faktografické databáze, zaměřené především na průmyslový a obchodní management.
V roce 1993 byl odkoupen společností Knight-Ridder, která jeho systém služeb postupně integrovala se službami už v té době vlastněného amerického systému Dialog. Obě centra si dosud sice do jisté míry konkurovala, avšak obě měla a mají své hlavní konkurenty na svých kontinentech.

Francouzsko-americké databázové centrum Questel/Orbit se orientuje hlavně na humanitní vědy – vystavuje francouzské univerzální bibliografické databáze PASCAL a FRANCIS, ale také na patentovou literaturu a literaturu z oblasti obchodu.
. Rozvinulo se zejména v průběhu 80. let a bylo původně založené francouzskou vládou a pojmenováno Télésystémes-Questel.
V roce 1990 se systém Télésystémes-Questel přeměnil z původně národního francouzského databázového centra s vydatnou vládní i nevládní podporou na relativně nezávislý podnik s důrazem na mezinárodní rozsah svých informačních služeb. Kromě tradičních bází dat týkajících se vědeckotechnické a společenskovědní literatury a speciálně literatury patentové byly zaváděny zejména informační služby pro uživatele z oblasti obchodu, finančnictví a průmyslového podnikání.
STN International se sídlem v Německu produkuje přibližně 200 databází univerzálního typu, nicméně jeho síla je v databázích orientovaných na chemické a jim příbuzné obory. Podpůrné funkce jako STN Express nebo STN Search umožňují uživateli lépe komunikovat se systémem. Databázové centrum je provozováno 3 subsystémy: CAS (Chemical Abstract Service), JST (Japan Science and Technology Center) a FIZ Karlsruhe.
Databázové centrum fungující v 80. letech jako síť tří hostitelských počítačů rozmístěných na třech různých kontinentech. Dnes to jsou servery provozované jako subsystémy STN v dokumentačním centru CAS (Chemical Abstract Services), v tokijské firmě JST (Japan Science and Technology Corporation) a v německém centru FIZ Karlsruhe.
DIMDI (Deutsches Institut für Medizinische Dokumentation und Information) je největším a nejvýznamnějším centrem pro informační služby v lékařských a souvisejících oborech. Bylo založeno v roce 1969 v Kolíně nad Rýnem.

58. Historie dialogových informačních systémů u nás, 80.léta a výše, etapy, neopomenout online archeologii Dialog-2, Golem - základní informace, role a ukotvení těchto center, vztah uživatelské základny k ÚVTEI, NIS - porovnání se světem, zdůvodnění překonanosti nebo naopak chybějící role v současných dialogových službách v ČR - doporučuji průzkum v časopisech Čs informatika konce 80.let a začátku 90.let, rovněž 2 ročníky časopisu Infocus v 90. letech - vše dostupné ve velkých knihovnách typu NK, STK aj.

V bývalém ČSSR vznikly centra VTEI – vědecké, technické a ekonomické informace, které se začaly utvářet po roce 1970 a plných 20 let tvořily jednotnou soustavu informační sítě v tehdejším Československu. Střediska VTEI působila ve vědeckých knihovnách, výzkumných ústavech, akademii věd apod. Už na začátku 70. let se začalo uskutečňovat hromadné zavádění automatizace bibliograficko-informačních služeb. Do roku 1975 se využívaly systémy velkých bibliografických databází, mezi nejznámější patřily CHEMBASE, INSPEC, INIS, COMPENDEX apod. V 80. letech pak VTEI měla přístup do databází Dialog, BRS, Data-Star, ORBIT, Questel a další.
ÚVTEI – Ústřední vědeckých, technických a ekonomických informací se transformovalo po roce 1990 na tzv. NIS – Národní informační středisko, které ale po čase také zaniklo.
Brána Internetu se České republice otevřela koncem roku 1989. Totalitní režim nebyl příznivcem této sítě, a proto až počátkem roku 1990 se u nás začala budovat komunikační infrastrukturu a počítačovou síť. První sítí u nás byla síť FIDO, která měla minimální požadavky na komunikační síť a stačilo zcela být připojen komutovanou linkou. Další sítí byla síť EUNET. Koncem roku 1990 se k nám dostala evropská odnož sítě BITNET, šlo o síť EARN (European Academic and Research Network), která už ovšem vyžadovala připojení pevnou linkou.Spojení bylo realizováno pevným spojem Praha - Linec (rakouská síť ACONET) o rychlosti 9,6 kb/s.
U nás byla postupně od pol. 60. let budována centralizovaná soustava středisek vědecko-technických informací. Skládala se z informačních středisek v jednotlivých institucích - základní informační střediska, nad nimi byla vybudována soustava odvětvových a oborových informačních středisek - ODIS a OBIS (strojírenství - automobilový průmysl, chemický průmysl, medicína). Vedoucí úlohu mělo ÚVTEI a jeho ústřední technická základna, která koncem 70. a v 80.letech nakupovala centralizovaně zahraniční báze dat pro všechny významné průmyslové obory a zprostředkovávala z nich rešerše.
Zároveň se v těchto OBIS a ODIS vytvářely české databáze. Např. TRIS - informace z
dopravy - s retrospektivou od r. 1985 nebo Bibliographia Medica Cechoslovaca s retrospektivou již od r. 1977. Tato struktura se po r. 1989 se zásadní změnou ve financování rozpadla, většina OBIS a ODIS zanikla a s nimi i vytvářené databáze. Mezi výjimky patří bývalé ODIS pro dopravu, nyní DATIS - datové a informační centrum Českých drah, které nadále provozuje databázi TRIS, další výjimkou je databáze METAL vytvářená od r. 1966 ve Výzkumném ústavu hutnictví železa. Po privatizaci ústavu bylo založeno zájmové sdružení Informetal, které databázi na neziskovém principu nadále vytváří a zpřístupňuje. V současné době báze obsahuje více než 250 tisíc záznamů a je dodavatelem světové hutnické databáze METADEX. Fondy a služby některých zrušených středisek převzaly jiné instituce, především veřejné a vysokoškolské knihovny. Univerzita Pardubice převzala veškerý fond včetně databáze ADISA ze zrušeného OBIS pro polygrafický průmysl. Katedra polygrafie a fotofyziky UPa nadále databázi ADISA vytváří a poskytuje z ní rešeršní služby na objednávku a dodávky primárních dokumentů pro český polygrafický průmysl i další vědecká a vysokoškolská pracoviště.
Vrcholem této struktury bylo Ústředí vědecko-technických informací v Praze a jeho ústřední technická základna. V 80. letech zde byly centrálně nakupovány na magnetických páskách velké zahraniční databáze, např. Chemical Abstracts, Compendex (strojírenství), Derwent (patenty). Toto středisko zajišťovalo rešeršní služby typu SDI i jednorázové rešerše.
Z ÚVTEI vzniklo v r. 1991 Národní informační středisko, které se mělo stát centrem veřejných informačních služeb, ale náklady na nákupy zahraničních databází byly tak obrovské a poptávka po těchto službách ze strany českých firem a výzkumných a vzdělávacích institucí tak nízká, že NIS nedokázalo obstát v tržním prostředí a v pol. 90. let zaniklo. V r. 1991byla založena firma, která se nyní jmenuje Albertina icome Praha. Zajišťuje určitý soubor služeb pro informační sféru - více na adrese: http://www.aip.cz/sluzby.htm . Ovšem není to databázové centrum západního typu, které by zpřístupňovalo desítky a stovky databází. Tyto služby jsou distribuovány do jednotlivých velkých knihoven - Státní technická knihovna, Národní lékařská knihovna, vysokoškolské knihovny.

59. Druhy bází dat - podrobně s příklady
Databáze jsou obvykle oborově zaměřeny, ale setkáte se i s databázemi určitých druhů dokumentů (periodika, noviny) nebo určitých druhů dat (jízdní řády, statistická data). Struktura záznamů uložených v databázích je určující pro rozlišení druhů databází.
• Bibliografické databáze - většinou vznikly jako strojem čitelné verze referátových časopisů (např. Physics Abstracts, INIS, Engineering Index). Obsahují bibliografické záznamy dokumentů, které jsou doplněny abstrakty a klíčovými slovy popisujícími obsah dokumentů. Jde tedy o sekundární informaci o existenci primárního informačního pramene, jehož plný text v databázi již není a je třeba jej následně získat.
• Faktografické databáze - obsahují konkrétní údaje, které mají textový nebo numerický charakter, případně kombinovaný. Většinou již není nutné vyhledávat primární pramen, neboť tyto databáze nabízí přímo zdrojová informace. Můžete se setkat s následujícími typy faktografických databází:
• numerické (hlavně statistická data)
• faktové (slovně nebo pomocí tabulek shrnují podstatná fakta z původních pramenů)
• databáze typu průvodce (adresáře firem, katalogy výrobců, rejstříky)
• Plnotextové databáze - obsahují plné texty (full text) dokumentů, tedy primárních pramenů. Většinou se jedná o kompletní znění novin, zpravodajských textů, článků z časopisů a sborníků z konferencí, právních dokumentů, aj.
Bibliografické databáze - z bibliografických bází dat získáme zejména přesnou a úplnou citaci; většinou je k dispozici i abstrakt, významná je i formalizovaná terminologie (např. deskriptory, klíčová slova), "kódovníky" (např. SIC klasifikace pro průmyslové obory, mj. SIC klasifikace je stále obsažena v selekčních systémech bází dat, ale je postupně nahrazována novou klasifikací NAICS -- North America Industry Classification System) pro naše případné další hledání v databázích i v jiných informačních zdrojích, primární dokument zajišťujeme dodatečně (např. klasickou cestou meziknihovní výpůjční služby, ale stejně tak i elektronicky cestou tzv. document delivery services, neboli dodávkou primárních dokumentů, kde současný Internet nabízí velké možnosti). DDS služby jsou mimo tzv. digitální knihovny druhým rychlým způsobem dodání originálního -- primárního dokumentu.
Příklad:
Příklady bibliografických databází by mohly jít do tisíců, co do počtu, ale zmiňme jich jen několik pro navození představy: AGRICOLA (http://www.stn-international.de/stndatabases/databases/agricola.html), která je přístupná i zdarma na webu, a to z důvodu specifické informační politiky Spojených států, ANABSTR pro analytickou chemii (http://www.stn-international.de/stndatabases/databases/anabstr.html), AEROSPACE pro leteckou techniku a kosmonautiku (http://www.stn-international.de/stndatabases/databases/aerospac.html), INSPEC pro fyziku, elektroniku, informační technologie (http://library.dialog.com/bluesheets/html/bl0002.html).

Faktografické báze dat - faktografické báze dat uvádějí konkrétní údaje a mohou mít textový (např. „jaký je způsob ošetření při poleptání kyselinou sírovou“ nebo numerický charakter (poskytují parametry-např. „jaký je bod varu pro danou chemikálii“) (nebo kombinovaný). Není nutné dodávat primární pramen, neboť jde v podstatě již o primární informaci. Některé faktografické systémy však mohou odkazovat další literaturu a mít bibliografickou součást. Většinou již není nutné dodávat primární pramen, neboť je nabízena zdrojová informace. Význam faktografických bází dat dnes narůstá, za jistých okolností je možné zahrnout do této kategorie většinu statistických informací. Faktografické báze dat bývají dražší, protože jejich vznik vyžaduje velké vstupní náklady a výstup není vždy pro nejširší záběr uživatelů. Přesto jejich potřeba a vznik bývají důležité.
Příklady by mohly jít opět do stovek. Dobrým a téměř vzorovým příkladem jsou obory chemie, fyziky, materiálových věd, anebo i obchodu. Mezi nejznámější takové faktografické systémy velkého rozsahu v chemii patří báze dat BEILSTEIN (organická chemie, viz také blíže http://www.beilstein.com) a GMELIN (anorganická chemie, z jiných oborů ASMDATA (http://www.stn-international.de/stndatabases/databases/asmdata.html), která obsahuje popsané (např. mechanické, fyzikální, chemické) vlastnosti rozličných materiálů, nebo databáze fyzikálních dat DIPPR (http://www.stn-international.de/stndatabases/databases/dippr.html).

Plnotextové databáze - báze dat plných textů (full text) jsou trendem posledních 10 let a většinou již nepotřebujeme dohledávat primární dokument (pokud ovšem nevyžadujeme např. fotografie a další složitější obrazové informace v originálním textu obsažené - současné velké databázové systémy pracují totiž s grafickou informací omezeně a výběrově oproti zdrojům např. na nosičích CD-ROM). Je tu zajímavé doplnění s dalším trendem moderních informačních služeb, a to jak primární dokument dopravit co nejkratší cestou k uživateli - DDS službami). Plnotextové báze dat jsou typické také pro mnoho digitálních knihoven.
Vyhledávání v plnotextových bázích dat vyžaduje ovšem použití speciálních vyhledávacích prostředků a nástrojů, neboť jinak konečné výstupy mohou obsahovat mnoho šumů a nerelevantních výsledků.
Začátky – v 60. letech – LEXIS-NEXIS – právní dokumenty. Následně obchodní informace a novinářské informace.
Většina plnotextových databází má charakter zpravodajských databází (NLDB - Newsletter Database - http://www.cas.org/ONLINE/DBSS/nldbss.html), ale v poslední době se tento trend dostává i do oblasti vědeckých a technických informací - viz databáze PCTFULL (http://www.cas.org/ONLINE/DBSS/pctfullss.html), která obsahuje patentové informace. Mezi plnotextové databáze bychom mohli zařadit celou řadu do ČR v posledních letech konsorciálně nakoupených systémů (za všechny například systém ProQuest http://www.proquest.cz/cojeto.htm).
V databázových centrech jsou uloženy plnotextové zdroje jako Washington Post Online, Washington Times, New York Times a stovky dalších významných titulů z celého světa, jsou k dispozici databáze jako např. Newsletter Database, Investext, ABI/Inform, PROMT, World Reporter, kde je vhodné použít nástrojů typu proximitních operátorů, např. (n), (w), (s), ADJ, ADJACENCY, (a), WITH, NEAR, SAME, SENT, THRU. Tento typ operátorů umožňuje nalézt dokumenty s výskytem hledaných termínů na určitý počet slov vzdálených od sebe, a to v závislém pořadí, či naopak nezávislém, v jedné větě, odstavci, případně jich použít v určitých položkách (polích), jako je titul, deskriptorové pole apod. Bez proximitních operátorů, např. jen s využitím booleovských operátorů, bychom dosahovali velmi rozptýlených a nepřesných výsledků. Výsledky by byly relevantní možná z hlediska výskytu termínů, ale ne pertinentní k informačním potřebám uživatele. V plnotextových bázích dat se plně projevují jistá omezení booleovského modelu vyhledávání.

Databáze katalogů, rejstříků, adresářů - do této kategorie můžeme zařadit zejména rejstříky a katalogy firem, výrobků, ale i osobností.
Databáze jsou dnes buď poskytovány prostřednictvím sítí (např. internet) – v tzv. on-line režimu, nebo se prodávají na přenosných nosičích (CD ROM, DVD) - tzv. off-line režim. Databáze uložené na přenosných nosičích existují také v síťových verzích, které umožňují databáze zpřístuňovat v lokálních sítích. Oba režimy mají své výhody a nevýhody:
off-line:
výhody: nevýhody:
• jednorázové roční předplatné (odpadá placení za přístup do databáze a dobu vyhledávání v databází, za zobrazené záznamy, neplatí se telekomunikační poplatky)
• není problém s telekomunikačním připojením
• vhodné pro začátečníky • aktualizace dat probíhá se zpožděním v různých časových intervalech (týden, měsíc, čtvrtletí adt.)
• lze pracovat pouze s jednou (nebo jen s omezeným počtem) databází
on-line:
výhody: nevýhody:
• platba jen za uskutečněné transakce
• průběžná aktualizace záznamů
• návazné služby (EDD aj.)
• různé slevy a výhodnější režimy
• větší retrospektiva fondu
• možnost průřezového vyhledávání ve více databázích najednou • vysoká cena
• časový tlak
• různý vyhledávácí software
• může se přerušit spojení
60. Typologie dokumentů a jejich vztah k rešeršní strategii, vhodné doplnit četnými příklady

Primární dokumenty -
1. knihy, monografie, mat. z konferencí, slovníky, encyklopedie
2. periodika-časopisy, period.sborníky, ročenky
3. spec.dok.-patent. literatura, technické zprávy, firemní lit., rukopisy
Sekundární dokumenty – katalogy, bibl. soupisy, referáty, rešerše
Terciální dokumenty – adresář, přehled o sekundárních dokumentech

pozn: Normy – odraz technologického rozvoje, nesmí se kopírovat – prodej, nahlížení!
Konference – kuloáry – nejdůležitější! Sborníky (i periodické)
Katalogy – www.nkp.cz - SIGLA (např. ULA001, CBA001…) – lokace. Třídění Kongresové knihovny

Současné elektronické informační zdroje můžeme z hlediska cesty k nim všeobecně rozčlenit:
• přístupné přes profesionální dialogové (synonymicky: interaktivní, on-line, online, spřažené) systémy, a to nezávisle na Internetu, ale i prostřednictvím Internetu
• přístupné volně na Internetu
• přístupné neinteraktivně, tj. off-line (např. v podnicích, výzkumných institucích, ale ani v samotných databázových centrech off-line distribuce informací nezanikla, ale došlo k vymezení specifických rolí)
• přístupné na optických médiích (nejčastější je dnes využíván optický disk typu CD-ROM),
• přístupné v kombinacích různých způsobů (např. webovského rozhraní a interaktivního vstupu do profesionálního on-line systému, např. typu databázového centra, kombinace databázových zdrojů na nosičích CD-ROM a Internetu, instalace profesionálních komerčních zdrojů do prostředí intranetu a extranetu, a dokonce i kombinace tištěných výstupů, které jsou nasnímány zařízením typu scanner a vystaveny na některém zmíněném médiu).


61. druhy a zaměření databázových center – srovnání, rychlá analýza (fast analýza)
Při shromažďování informací se můžeme rozhodnout, zda využijeme desítky až tisíce různorodých zdrojů na Internetu nebo zda budeme pracovat se zdroji soustředěnými do jednoho místa – databázového centra. Dat.centra začala vznikat už v 60. letech 20.století.

Databázové centrum je především podnikatelský subjekt. Je definován následujícími zásadami jeho působení:
• jde o subjekt, který vlastní superpočítače a je připojen do telekomunikační sítě;
• vlastní aplikační databázový systém umožňující vyhledávání;
• nakupuje od producentů databáze;
• uzavírá smlouvy s uživateli, kteří platí databázovému centru poplatek za využívání služeb.


Databázové centrum - informační instituce (zpravidla komerční) zpřístupňující vybrané databáze v online režimu.

V DATABÁZOVÝCH CENTRECH SE VYUŽÍVÁ OBECNĚ SPECIFICKÝCH KOMUNIKAČNÍCH PROSTŘEDKŮ, NAPŘ. DOTAZOVACÍCH JAZYKŮ.
PŘED VLASTNÍM VSTUPEM DO DATABÁZOVÝCH CENTER JE NUTNÉ PROVÁDĚT DŮMYSLNÉ INFORMAČNÍ A PRACOVNÍ PŘÍPRAVY, NEBOŤ V NAPROSTÉ MÍŘE MODEL PLACENÍ SLUŽEB JE NA BÁZI NIKOLI PŘEDPLATNÉHO, ALE NA MODELU "PAY-AS-YOU-GO" , ZJEDNODUŠENĚ ŘEČENO - PLATÍME DOBU PŘIPOJENÍ K SYSTÉMU A ZOBRAZENÉ ČI PŘETAŽENÉ DOKUMENTY.

Databázová centra – dělení:
• Malá, střední, velká
• Mezinárodní, národní, regionální
• Univerzální, oborově zaměřená
• Zdrojová (konečně informace, práce s primárními doku – fakt.a plnotext.dtb.), referenční (pouze odkazy, ne ta v referenčních službách, práce se sekundárními nebo terciál.doku)
62. největší dtb.centra ve světě – srovnání jejich služeb na základě vámi stanovených kritérií, tabulky doporučeny

Databázová centra
K největším současným trendům v oblasti zdrojů informací patří vedle prosazování digitální formy i zpřístupňování databází prostřednictvím rozsáhlých světových dialogových systémů. Nejtypičtějším představitelem jsou databázová centra, jejichž účelem je on-line zpřístupnění velkých množství databází současně tisícům uživatelů.
DATABÁZOVÁ CENTRA (NAPŘ. STN INTERNATIONAL, QUESTEL/ORBIT, OVIS, DIALOG A DATASTAR, LEXIS/NEXIS, GBI, GENIOS, DIMDI). NEJVĚTŠÍCH DTB.CENTER (UŽÍVÁ SE ROVNĚŽ VÝRAZU "VENDOR" ) JE NĚKOLIK DESÍTEK.
Databázová centra většinou nakupují databáze informací od producentů včetně licencí na jejich on-line vystavování, vyhledávání a distribuci záznamů, pouze výjimečně je také samy vytvářejí. Od informací volně dostupných na Internetu se liší především svou hodnotou.

Charakterizuje je záruka přesnosti, úplnosti a včasnosti. Největší databázová centra jako Dialog, Lexis-Nexis, UMI a IAC obsahují i 500 databází z různých disciplín a oblastí.

Tradičně zde bývají zahrnuty informace z následujících oborů:
chemie, lékařství, společenské vědy, technologie, podnikání a finance, zemědělství, patenty a normy, legislativa, energetika a životní prostředí.
Firmy nejvíce využívají databáze zaměřené na podnikatelské prostředí, nacházejí zde informace o firmách a institucích (např. adresáře, výroční zprávy), informace o službách a výrobcích (katalogy), informace o financích (zprávy z kapitálových trhů, informace z burzy a finančních institucí), hospodářské informace (makroekonomické indikátory) a informace z vědy (výzkumné zprávy a projekty).

Databázové centrum poskytuje různé druhy bází dat (viz.ot.č.59). Jsou zde např. bibliografické databáze, plnotextové databáze, faktografické databáze a databáze typů rejstříků a katalogů.


1) Databázové centrum The Dialog Corporation je v současnosti největší databázové centrum na světě, které vzniklo spojením dvou původně konkurentů Dialog (USA) + DataStar (Švýcarsko).
Podrobně se s databázemi, tj. s jejich popisem můžete seznámit v tzv. Bluesheets a Datasheets. Podpora uživatelů je kromě jiného zajišťována i cvičnými databázemi a online kurzy.
Pro usnadnění komunikace s uživatelem zavedl služby DialogSelect, DialogWeb a DialogClassic.

Tématické zaměření jednotlivých databází
• COMPENDEX (široký záběr technických oborů)
• INSPEC (fyzika, elektronika a elektrotechnika, výpočetní technika)
• ICONDA (stavební inženýrství)
• METADEX (nauka o kovech a hutnictví)

2) DIMDI (Deutsches Institut für medizinische Dokumentation und Information)
http://www.dimdi.de/dynamic/de/index.html
německé informační a databázové centrum (Koln, založ. v r. 1969); využívání většiny databází vyžaduje password (MEDLINE v systému "grips-WebSearch" zdarma!);
zhruba 90 bází, zejména medicínských)

3) FIZ (Fachinformationszentrum, Karlsruhe) http://www.fiz-karlsruhe.de/
německé informační a databázové centrum, využívání databází vyžaduje password;
(10 databází s popisem)

4) OCLC, Inc. (Online Computer Library Center, Inc.)
americké knihovnicko-informační a databázové centrum (Dublin, Ohio, USA, založ. 1967, přejmenováno v r. 1981); využívání databází (včetně souborného katalogu) v rámci systému FirstSearch vyžaduje password;
(cca 75 bází)
Jádrem celého systému OCLC je databáze OLUC (Online Union Catalog), která se svými více než 47 mil. záznamy je největší databází na světě vůbec. V novější literatuře je již označována termínem Světový katalog (World Catalog). Je pravděpodobné, že databáze obsáhne v budoucnu všechny dokumenty publikované na světě ze všech vědních oborů, ve všech jazycích a za všechna historická období. Databáze neobsahuje analytické záznamy.

5) Ovid Technologies, Inc.
americké informační a databázové centrum (New York, založ. 1988, v r. 1994 zakoupeno bývalé DBC BRS Online); využívání databází (v režimu online i přes Ovid WWW Gateway) vyžaduje password;
(celkově po sloučení s firmou SilverPlatter asi 230 databází)


6) Questel.Orbit
mezinárodní (francouzsko-americké) informační databázové centrum (Paříž, Washington aj., založ. spojením bývalého Questel a ORBIT v r. 1994); (password nutný)
(cca 250 databází)
Zaměřuje se především na poskytování patentových informací. Vystavuje také základní vědeckotechnické databáze a základní francouzské univerzální bibliografické databáze PASCAL a FRANCIS.

7) STN International) http://www.stn-international.de/
nadnárodní DBC, evropské centrum je ve FIZ Karlsruhe, využívání bází licencováno;
(zhruba 210 databází), jejich rozdělení do tematických klastrů (skupin) ;

Významné databázové centrum pro oblast vědeckotechnických informací, hlavně pro přírodní a technické vědy i pro patentové informace.
Skládá se ze 3 nezávislých, ale technicky a organizačně spolupracujících center:

Chemical Abstracts Services (CAS), USA
FIZ Karlsruhe, Německo
Japan Information Center for Scientific and Technology (JICST), Japonsko


Databázová centra ...
WebSPIRS Ovid Web Gateway STN Easy DataStar Web Dialog@Site Cinahl Direct Community of Science
Hodnocení







Body 33 34 21 27 21 25 26
Retrospektiva 1966 + + + + + + +
Týdenní nebo měsíční aktualizace + + + + + + +
Online nápověda + + + + + + +
Kontextová nápověda + + + +
Více stupňů pokročilosti + + + +
Intuitivní ovládání + + + + + +
Snadná navigace + + + + + + +
Simultánní vyhledávání + + + +
Odstraňování duplikátů + + +
Rozšíření + + + + + + +
Wildcards + + +
Fráze + + + + +
Stopslova + + + + +
Mapping + +
Příkazový řádek + + +
Booleovské operátory + + + + + + +
Ostatní operátory + + + + + + +
Browsing + + + + +
Hledání v polích + + + + + + +
Omezení dotazu + + + + + + +
Hyperlinky + + +
Related records
Prohlížení abecedního seznamu MeSH + + + + +
Prohlížení hierrachie MeSH + + + + + +
Podhesla + + + + + +
Explode + + + + +
Rozlišování hlavních a vedlejších hesel + + + + + +
Modifikace dotazu + + + +
Kombinace kroků + + + + +
Uložení rešeršní strategie + + + + + + +
Ukládání záznamů + + + + + + +
Tisk + + + + + + +
E-mail + +
Standardní formáty + + + + + + +
Možnost měnit způsob řazení + + +
Označování záznamů + + + + + + +
Body 33 34 21 27 21 25 26
Hodnocení









65. Systém podpory uživatele ze strany databázového centra
* školicí činnost - veřejná školení, školení
* propagace - propagační materiály k informačním zdrojům, osvětová činnost, publikace v médiích
* technická podpora při řešení možných potíží s provozem informačních zdrojů
* administrativní podpora při řešení dodávek - celní projednání, řešení reklamací
* informační podpora - e-novinky, poštovní seznamy, databáze pomůcek

Poštovní seznamy slouží k zasílání informací o novinkách, školeních apod. v souvislosti s konzorciálními projekty a vybranými produkty. Informace jsou zasílány občasně e-mailem.
E-novinky nabízejí pravidelné informace o novinkách z oblasti elektronických informačních zdrojů v oborech, které si uživatel sám vybere. Nastavení oborů lze kdykoliv změnit pomocí osobního odkazu, který je uveden na konci každých e-novinek. Tento odkaz rovněž umožňuje zrušit zasílání e-novinek úplně.

E-novinky jsou rozesílány a obsahují tyto sekce:

* Úvodem
* Aktuální akce
* Na vlastní kůži (vyzkoušejte)
* Novinky z domova i ze světa
* Aktuálně z katalogu
* Mohlo by vás zajímat (nové pomůcky na webu apod.)
Poštovní seznamy
Věrnostní slevy

67. Ekonomické problémy, komerčnost dialogových informačních služeb - příklady ze světa i z ČR

Plnotextové báze dat jsou přístupné přes dialogový (online) přístup (tj. v 70. a 80. letech nezávisle na internetu, ale také již s jeho využitím v 90. letech, a to zejména přes WWW rozhraní). Ve většině případů je tato platforma přístupu k primárním dokumentům na komerční bázi.
Plnotextové databáze se v současné době stále ještě v převážné míře orientují na informace zpravodajského (novinářského) typu. Navíc zaměření těchto plnotextových bází dat míří do oblasti obchodních aplikací a hospodářských informací.

Koncový uživatel, člověk v komunikaci s informačním systémem či informační službou přímou či zprostředkovanou informační institucí nebo informačním specialistou, je středem celého problému, kolem kterého se odehrávají procesy vyhledávání informací. Není však nutné výhradně toto chápat jen jako důsledek „humanizace" přiblížení výpočetní techniky a informačních systémů člověku, ale je to zejména důsledek silného konkurenčního prostředí v oblasti vývoje a provozování počítačových a informačních systémů a snahou oslovit zákazníka a produkt/službu mu prodat. Přes humanistické poslání řady informačních systémů (nejen ve vědě, školství, medicínských oborech, v kultuře) uplatnit se v lidské společnosti a v její pospěch, potažmo ve prospěch člověka, který si rozumí s „počítačem" i bez větších technických a technologických dovedností, tu dominuje ekonomický diktát. Cílem je vyvinout nové (intelektuální kapitál), inovovat, a aspoň po krátkou dobu být na trhu „bezkonkurenční" či „konkurencí neohrožen", a umění a schopnost prodat.



Plnotextové báze dat jsou přístupné přes dialogový (on-line) přístup (tj. v 70. a 80. letech nezávisle na internetu, ale také již s jeho využitím v 90. letech, a to zejména přes WWW rozhraní). Ve většině případů je tato platforma přístupu k primárním dokumentům na komerční bázi.
Plnotextové databáze se v současné době stále ještě v převážné míře orientují na informace zpravodajského (novinářského) typu. Navíc zaměření těchto plnotextových bází dat míří do oblasti obchodních aplikací a hospodářských informací.

Koncový uživatel, člověk v komunikaci s informačním systémem či informační službou přímou či zprostředkovanou informační institucí nebo informačním specialistou, je středem celého problému, kolem kterého se odehrávají procesy vyhledávání informací. Není však nutné výhradně toto chápat jen jako důsledek „humanizace" přiblížení výpočetní techniky a informačních systémů člověku, ale je to zejména důsledek silného konkurenčního prostředí v oblasti vývoje a provozování počítačových a informačních systémů a snahou oslovit zákazníka a produkt/službu mu prodat. Přes humanistické poslání řady informačních systémů (nejen ve vědě, školství, medicínských oborech, v kultuře) uplatnit se v lidské společnosti a v její pospěch, potažmo ve prospěch člověka, který si rozumí s „počítačem" i bez větších technických a technologických dovedností, tu dominuje ekonomický diktát. Cílem je vyvinout nové (intelektuální kapitál), inovovat, a aspoň po krátkou dobu být na trhu „bezkonkurenční" či „konkurencí neohrožen", a umění a schopnost prodat.



68. Online dovednosti -- z hlediska psychologie, z hlediska inf. studií apod., pokus o jejich vymezení

Participace uživatele (vědeckého pracovníka, pedagoga, manažera aj.) na dialogovém zpracování rešerše, a to, jak může zasahovat do procesu vyhledávání informací a být součástí interakce, můžeme rozebrat celkem 3 způsoby:
• Uživatel zadá požadavek pouze verbálně, komunikuje při zadání se zpracovatelem a realizátorem (firma, informační instituce, informační kancelář, knihovna) jeho požadavku písemně nebo osobně, případně telefonicky, faxem, dnes i elektronickou poštou, ale není u vlastního zpracování požadavku
• Konečný uživatel je přítomen s rešeršním specialistou u terminálu a rešeršní dotazy může usměrňovat v průběhu vyhledávacího dialogu, aby realizovaná rešerše byla především obsahově relevantní (pertinentní). Technologii komunikace provádí však informační specialista a uživatel jí nemusí být zatěžován
• Uživatel si požadavek zpracovává samostatně bez asis-tence informačního experta, což mu dnes v případě neznalosti dotazovacího jazyka umožňují systémy řízených menu, anebo graficky orientovaná rozhraní, často dnes na bázi hypertextu, s prvky intuitivního ovládání apod.
V České republice se v žádném z předmětů oboru informační věda nestuduje problematika vztahu člověk-počítač. Na technických školách a vývojových pracovištích v ČR je tato záležitost chápána spíše jako technologická záležitost a je v izolovaných případech zkoumána z pohledů počítačové vědy. Je to pochopitelné, ale ne plně dostačující.
Z pohledu jiných oborů, například humanitních a sociálních, se pojem “human-computer interaction” (HCI) často zužuje na psychologické aspekty kolem komunikace “lidského zdroje” s počítačem, což je opět velké zjednodušení a značně nepřesné. Stejně tak tento poměrně mladý obor (přibližně 40 let) není zcela totožný s ergonomií (má k ní ale velmi blízko a kořeny jsou právě zde - viz dále v textu souvislosti s ergonomií) a není také součástí ani nepřesně používaného názvu oboru “inženýrská psychologie” (tento název se nejeví respektovaným v psychologických terminologiích, jeho obsah již ale ano).
Obor human-computer interaction je podobně jako informační věda oborem průnikovým. Je ovlivňován a naplňován zejména obory a oblastmi: počítačová věda, ergonomie, umění, design, psychologie,lingvistika, sociologie, filozofie, antropologie, fyziologie,umělá inteligence, inženýrské obory
Vztah oboru HCI k informační vědě je velmi úzký. Ve světě je rovněž chápán (možná i působením jeho představitelů v expertních strukturách a skupinách informační vědy) jako obor s vazbami a rozhraním k informační vědě. V zahraničí se touto problematikou zabývá pravidelně celá řada periodik z oblasti informační vědy nebo s ní hraničních periodik a řada autorů, kteří publikují některé své rozsáhlejší práce na rozhraní informační vědy a HCI a někteří z nich v rámci univerzit přednášejí na školách informační a knihovní vědy.
Human-computer interaction zkoumá “koncového uživatele” velmi detailně. Koncový uživatel a jeho okolí (a také jeho chování nebo informační potřeby) jsou rovněž zkoumány informační vědou a zaměřují se na něj aplikačně informační služby, které rovněž informační věda zkoumá a navrhuje jejich koncepci a optimalizaci. M. KÖNIGOVÁ [1984, s. 41-56] ve vztahu ke konstrukci informačního systému VTEI (tj. vědeckých technických a ekonomických informací) přímo deklaruje, že uživatel je v podstatě centrálním a určujícím činitelem celého informačního systému. Bez respektování potřeb konkrétních uživatelů systém pracuje do jisté míry naprázdno a z hledisek ekonomických neefektivně.
Koncový uživatel je intenzivně zkoumán oborem HCI v několika jeho oblastech, ale zejména je to v oblasti zvané uživatelské rozhraní. S pojmem “koncový uživatel” je spojena rovněž oblast návrhu a projektování informačních systémů. Podobné zájmy má i informační věda, a to nejen v projekční části, ale později ve zkoumání a vyhodnocování užívání systémů koncovým uživatelem.
Není pochyb, že uživatelské rozhraní, coby prostředník komunikace mezi informačním systémem (počítačem) a uživatelem (člověkem), ovlivnilo zájem o vyhledávání v informačních systémech a v elektronických zdrojích typu bází dat.
Uživatelské rozhraní můžeme velmi jednoduše definovat jako komunikační kanál mezi uživatelem a systémem.
Kvalita uživatelského rozhraní podmiňuje vztah uživatele ke zpřístupňovanému systému (např. k databázi). Optimální uživatelské rozhraní by mělo umožnit uživateli vyhledávat v dialogovém systému i bez znalosti informační problematiky, resp. také výpočetní techniky. Systém se má přizpůsobit uživateli, ne uživatel systému. Kritéria optimálnosti uživatelského rozhraní mohou být: snadná příprava na dialog, koncentrace na základní úkoly, snadná kontrola, spolehlivost, vhodná struktura vysvětlujících poznámek, nabídek a nápověd, malá možnost chyby při dialogu
V každém případě, uvažujeme-li uživatelské rozhraní pro interaktivní režim, máme bezvýhradně na mysli generace uživatelsky přátelských rozhraní a systémů (user-friendliness, user-friendly). Stanovení principu tzv. přátelskosti je však vágním vyjádřením a neexistují přesné specifikace, co je “ještě přátelské” a co “už ne”. Teprve po rozšíření dialogových systémů je možno rozumět termínu user-friendliness například takto:
• jako synonymum k pojmu “snadný k užívání”
• jako naznačení prvořadého cíle
• jako vykazování kvality “lidského přátelství”, tj. existuje předpoklad, že vztah člověk - počítač je interpersonální povahy a komunikace by měla být s ním příjemná
Systém přátelský k uživateli musí být schopný vyhovět všem kategoriím uživatelů a rychle a efektivně plnit jejich požadavky, musí mít flexibilní a adaptabilní rozhraní. Pojem lze i kvantifikovat, a to vyjádřením počtu minimálních kroků vedoucích k řešení a relevantním informacím. Dnes se u systému předpokládá kontextuální nápověda a učicí funkce.
Dialogový informační systém s dobře navrženým uživatelským rozhraním vyžaduje minimální přípravu uživatele k využívání a tím klade i čím dál nižší nároky na online dovednosti uživatelů.


FÁZE ŘEŠENÍ ÚKOLU
„Dva řešitelé téhož pracovního úkolu mohou mít velmi rozdílné informační potřeby.“ /9, s. 57/ Kromě všech ostatních faktorů má vliv na informační potřeby i v jaké fázi se daný pracovní úkol nachází.
Jednotlivé fáze jsou:
? formulace úkolu (analýza problému)
? příprava na řešení - zde vzniká informační potřeba (uživatel využívá vlastní informační aparát, neformální kontakty, komerční sítě, informační systém) získání sekundární (referátové časopisy, katalogy, bibliografie) a primární informace (výběr pramenů, jejich zpracování)
? provádění vlastního úkolu - uživatel se podílí na řešení daného úkolu a jak se seznamuje s problémem vznikají nové informační potřeby

OSOBNOSTNÍ CHARAKTERISTIKY
Jsou to charakterové vlastnosti každého jednotlivce. Z hlediska informačního pracovníka jsou nejdůležitější tyto: vytrvalost, přemýšlivost, spořádanost, motivace, vnímavost, temperament ..apod. Vytrvalost hledat nové informace, hledat do hloubky a ověřovat, vůle využívat nové strategie, systematičnost v přípravě na hledání, ve vyhledávání i uspořádávání vyhledaných informací.
Motivace pro získávání nových poznatků závisí na druhu pracovní činnosti, platovém ohodnocení i pracovník kolektivu a nadřízených.
KULTURNÍ ROZDÍLY
Země, ze které uživatel pochází, se také v mnohém odrážení na práci s informacemi. Například Američani používají většinou americkou literaturu.
VZDĚLÁNÍ, ZNALOSTI A PRAXE
Při hledání informací využívá uživatel své znalosti i praxi v oboru, i když informační zdroje se neustále vyvíjejí a mění. Pro sdělní svého požadavku uživatel potřebuje mít takové dovednosti jako je schopnost vyjádřit svůj požadavek a schopnost komunikace s informačním pracovníkem. Jazykové dovednosti jsou určujícím faktorem pro typ dokumentů, které bude uživatel požadovat.
POHLAVÍ
Muži a ženy přistupují k hledání jinak i jinak komunikují. Například muži se mnohdy ostýchají zeptat se na radu.
VĚK
S věkem souvisí zkušenosti, ale na druhou stranu zde může vzniknout bariéra například ve vztahu k informačním technologiím. Také nižší mobilita může odradit staršího člověka od návštěvy informačního pracoviště. Naopak starší člověk může využít více neformálních kontaktů.
ČAS
Pro mnohé uživatele je rozhodující časové omezení. Při nedostatku času uživatelé nehledají informace i když by je potřebovaly a mají motivaci.
DOSTUPNOST
Přestože počítače a především internet smazává prostorové bariéry v přístupu k informacím, tato otázka zde stále existuje. Počítače umožňují rychlý přístup ke spoustě informačních zdrojů, přes tzv. „use friendly interface“ neboli uživatelsky přívětivé rozhraní a také rychlé dodání primární informace.
Přesto je pro mnohé nepřekonatelná bariéra cena. Je to cena za informační technologie, informační systémy i přístupy do databází a dodání plných textů.

69. Uživatelská dokumentace dialogových informačních systémů, její struktura, užití
Druhy a obsahy dokumentací k IS

* jsou stanovené v používané metodice vývoje a zavádění IS v podniku
* a v metodice řízení projektů IS

Otázka

* Jaké skutečnosti je nutno uvažovat při stanovení druhů a obsahu dokumentací k IS ?

Otázka druhů dokumentací

* v první řadě je nutné si uvědomit, jaké typy uživatelů budou se systémem pracovat
* půjde o management podniku, správce informačního systému, různé typy koncových uživatelů
* vzniknou tak požadavky na různé dokumentace s obsahovou náplní zaměřenou na jednotlivé cílové čtenáře
* jednotlivé typy uživatelů požadují ke své práci informace nutné a postačující k vykonávání určených činností, k plnění svých povinností v rozsahu pravomocí a odpovědnosti
* tvůrce metodik dokumentací musí znát obsah činností jednotlivých typů uživatelů a strukturu dokumentací stanovit tak, aby zpracovatel dokumentace pokryl informační potřebu těchto uživatelů

Otázka podrobnosti dokumentací

* vhodně a dostatečně podrobně zpracována dokumentace
- spoustu nejasných a problémových stavů může vyřešit provozovatel (správce) systému
* příliš stručná dokumentace resp. některé části chybí
- provozovatel se musí obracet při řešení problému tam, kde know-how pro takové řešení je - na dodavatele systému
* v dostatečné podrobnosti zpracovaná dokumentace
- je důležitá pro řešení problémů ve vlastní režii provozovatele, bez závislosti na dodavateli systému

Otázka formy zpracování dokumentace

* struktura dokumentace musí kopírovat věcné oblasti problematiky cílového čtenáře
* v částech popisujících systém je dokumentaci nutné zpracovat v hierarchické struktuře na několika úrovních podrobnosti
* umožníme uživateli získat
- jednak celkový přehled o systému (obecněji pojaté kapitoly)
- jednak postupně pronikat do větších podrobností (zkušenější uživatelé, případy řešení problémů apod.).

Základní druhy dokumentací

* projektová (programátorská) dokumentace
* uživatelská dokumentace
* administrátorská (provozní) dokumentace

U každé dokumentace

* určení
* historie dokumentu
* vlastní dokument
* přílohy

Uživatelská dokumentace

* určená pro úsek provozu IS, tj. pro koncové uživatele systému
* měla by se skládat ze tří obsahově odlišných příruček
- technologická příručka
- operátorská příručka

Uživatelská referenční příručka

* obsahuje popis funkcí aplikace
* pokrytí provozní technologie funkcemi dané aplikace
* druhy zpracování a jejich význam
* dále popisuje vstupy:
- význam jednotlivých vstupních položek
- jejich strukturu a možné zadávané hodnoty
- vliv zadávaných hodnot na výpočet
* popis výstupů
- druhy sestav, jejich popis a použití
* příklady řešení standardních i specifických situací
- např. jak zaevidovat důchodce na částečný úvazek z hlediska zdravotního a sociálního pojištění, apod.
- uživatelská referenční příručka
70. Trendy a přístupy k vyhledávání v IS, trendy vývoje rešeršních systémů
Základní trend: kooperace v rámci interoperability systémů na základě spolupracujících komponent v celém procesu získávání, zpracování a zpřístupňování informací, tj. přechod od explicitní pevně svázané kooperace ke kooperaci nezávislé na použitých SW a HW za účelem zajištění pružné integrace dat a jejich zpřístupnění v rámci jednotného interface za využití moderních vyhledávacích metod umožňující interakci uživatele se systémem.
Základní předpoklad - interoperabilita: Interoperabilita je schopnost dynamické spolupráce mezi technicky různorodými a nezávislými komponentami z hlediska syntaktického, strukturálního a sémantického. Interoperabilitu kromě jiných umožňují i zde jmenované nástroje. Různé úrovně interoperability z hlediska použitých prostředků: webové vyhledávače, silné standardy - MARC, Z39.50; metada, jejich sklízení a otevřené standardy; zdroje s metadaty volně zapojené do kooperace - DC, XML, RDF; interoperabilita v oblasti propojování zdrojů např. OpenURL, ERL, dále pak propojení citlivé na kontext uživatele (open context-sensitive linking) - UpenURL a SFX. Významné jsou aktivity v oblasti ontologií (systém konceptů a vztahů mezi nimi).
Syntaktické interoperability se dosáhne vyznačením dat podobným způsobem, takže je možné sdílet data v různých systémech.
Strukturální interoperabilita vyjadřuje strukturu metadat. Strukturální interoperability se dosáhne pomocí datového modelu pro specifikaci sémantických schémat, takže se mohou aplikovat společně (např. RDF)".
Sémantická interoperabilita je "obsahové vyjádření struktury metadat, které dovoluje sémanticky kombinovat datové prvky z různých schémat, slovníků a jiných nástrojů a umožňuje tak vyhledávat informace napříč heterogenními distribuovanými databázemi, zejména v prostředí internetu zadáním jediného dotazu. Pomocí sémantické interoperability jsou řešeny např. případy, kdy jednotlivé zdroje používají různé termíny pro popis téhož pojmu (např. autor, tvůrce a skladatel) nebo naopak, používají stejné termíny pro různé pojmy. Sémantické interoperability lze dosáhnout užíváním standardů popisu obsahu zdrojů (např. AACR nebo Dublin Core, FRBR)."
Ontologie - metoda získávání znalostí. Dílčí ontologie souvisí s konceptualizací jednotlivých oblastí.
Ontologie, resp. tzv. topikové mapy umožňují členit textové univerzum z hlediska sémantiky. Kategorie je třeba propojit s koncepty.
Na základě interoperability mohou vznikat snadněji elektronické archívy, souborné katalogy virtuální i reálné, brány a portály.
Cílem je propojování informací, distribuované vyhledávání, relevantní (pertinentní) informace pro uživatele a sémantický web. Tzv. sémantický web předpokládá postupnou transformaci současného WWW srozumitelného pro lidi na WWW srozumitelného pro počítače (znalosti označené značkovacími jazyky nebo extrahované z textu).


Něco málo o rešerších...