Pierwsza strona
Warto wiedzieć

Anna Blażewicz

TECHNOLOGICZNE ASPEKTY DOSTĘPU DO INFORMACJI W ŚRODOWISKU ELEKTRONICZNYM


ROZDZIAŁ DRUGI

POJĘCIA PODSTAWOWE


2.1 BIBLIOTEKA CYFROWA
Biblioteka cyfrowa [10, 28, 29] - organizacja, która dostarcza zasobów, włączając w to wyspecjalizowaną obsługę, umożliwiając wybór i strukturalizację do zbiorów cyfrowo - kodowanych prac w taki sposób, że są one w każdej chwili dostępne (także ekonomicznie) przez daną społeczność. Ponadto zapewnia również interpretację, dystrybucję i spójność dokumentów, jednocześnie oferując równoczesny dostęp wielu użytkownikom, zmniejszając się bariery odległości oraz ponadczasowość przechowywanych informacji.
Biblioteka cyfrowa jest rozpatrywana w różnych ujęciach:
  • cyfrowość w definicji odnosi się do sposobu reprezentacji informacji w elektronicznych (lub innych) mediach. Cyfrowa reprezentacja kładzie nacisk na dodawanie większej funkcjonalności i użyteczności informacjom.
  • w ujęciu elektronicznym- odnosi się do technologii, która przetwarza informacje (urządzenia).
  • w ujęciu wirtualnym - odtwarza reguły obowiązujące w bibliotece standardowej (ludzkie doświadczenie i oddziaływanie z obiektami są w obu tych bibliotekach podobne).
Dobrym przykładem biblioteki cyfrowej jest zróżnicowany pod względem zawartości projekt JSTOR Uniwersytetu Michigan [37] a także projekt Uniwersytetu Berkeley [15]. W drugim projekcie dokumenty zawierały tekst, obrazki, zdjęcia, dane multimedialne oraz metadane (patrz punkt 2.9), które zostały przedstawione jako złożone, powiązane ze sobą warstwy rozproszone w różnych lokalizacjach.
Dzięki warstwom możliwe było stworzenie użytecznych dokumentów zawierających wiele informacji. Jak widać model taki jest dość skomplikowany i bardzo ważnym problemem jest tu dostęp i zarządzanie rozproszonymi dokumentami.
Biblioteka cyfrowa powstaje przy współpracy informatyków i bibliotekarzy. Korzystać może z niej natomiast bardzo wielu zróżnicowanych użytkowników co ukazuje rysunek 2.1.


Rys.2.1 Użytkownicy biblioteki cyfrowej

2.2 BIBLIOTEKA MOBILNA

Biblioteka mobilna [30] jest tradycyjnym rozszerzeniem standardowych bibliotek. Ten rodzaj biblioteki szczególnie rozwinął się w Australii. Ma za zadanie rozpowszechniać naukę i kulturę w odległych miejscach tego kraju, szczególnie ludziom mało mobilnym (ludzie starzy lub niepełnosprawni) a także młodym, mieszkającym w miejscach oddalonych od uczelni lub bibliotek publicznych. Bibliotekę mobilną stanowi samochód z literaturą dostępną na CD. Ma on stałą trasę i po upływie określonego, stałego czasu wraca w to samo miejsce. Marzeniem tego rodzaju bibliotek są usługi on-line, a także nawiązanie łączności satelitarnej z innymi bibliotekami. Problemy, jakim muszą sprostać te biblioteki to:
  • komunikacja
  • odpowiedni sprzęt
  • jakość dostarczanych informacji

2.3 E-JOURNAL

E-journal to okresowa literatura, która jest dostępna poprzez elektroniczne medium. Najczęściej jest ona umieszczana na stronach WWW. Są to głównie czasopisma.


2.4 WWW (WORLD WIDE WEB)

Sieć WWW [29] jest systemem działającym na bazie Internetu, o następujących własnościach:
  • Graficzny i łatwy w nawigacji - WWW umożliwia integrację tekstu, z grafiką, dźwiękiem i video oraz daje możliwość tworzenia skomplikowanych aplikacji i umieszczania materiałów multimedialnych. Poruszanie się po Internecie jest bardzo proste dzięki linkom do poszczególnych stron.
  • Wieloplatformowy - dostęp do Internetu nie jest zależny od sprzętu, oprogramowania czy też typu ekranu. Może to być PC, mainframe czy terminal tekstowy z modemem.
  • Rozproszony - informacje są rozproszone po całym świecie, dlatego możliwe jest zgromadzenie tak wielu danych w Internecie.
  • Dynamiczny - dane w Internecie są na bieżąco uaktualniane i dzięki temu użytkownicy w każdej chwili mogą mieć dostęp do najświeższych informacji.
  • Interakcyjny - możliwość wymiany informacji pomiędzy użytkownikiem a serwerem WWW. Ponadto WWW umożliwia komunikowanie się z ludźmi publikującymi strony oraz z ich odbiorcami.
  • Hipertekstowy - umożliwia czytanie i poruszanie się po tekście lub informacji wizualnej w sposób nieliniowy, zależny od tego, czego użytkownik chce się dowiedzieć.
Serwis WWW działa na serwerze, który podłączony do sieci obsługuje klientów wysyłając im żądane witryny internetowe. Witryna WWW to miejsce w sieci, w którym umieszczane są informacje. Każda taka witryna ma swój unikalny adres.


2.5 ARCHITEKTURA KLIENT - SERWER

Serwer stanowi każdy program, który oferuje usługę dostępną przez sieć. Serwer przyjmuje zamówienia, wykonuje usługę i zwraca wyniki zamawiającemu. Klient to program wysyłający zamówienie do serwera i oczekujący na odpowiedź od niego.


2.6 HTML (HYPERTEXT MARKUP LANGUAGE)

HTML to język służący do tworzenia stron WWW. Jest językiem opisu strony a nie wyglądu poszczególnych elementów. Powstał w oparciu o język SGML(Standard Generalized Markup Language).


2.7 DIGITALIZACJA

Złożony proces zamiany danych w postaci drukowanej na postać cyfrową, dostępną w Internecie [37]. W skład procesu digitalizacji wchodzą:
  • przygotowanie materiałów do skanowania
  • proces skanowania
  • edycja stron , zastosowanie OCR
  • tworzenie baz danych tekstu
  • kreowanie linków
  • indeksowanie
  • umieszczenie w sieci

2.8 KOMPRESJA

Proces mający na celu zmniejszenie objętości danych wejściowych [5]. Rozróżnia się następujące metody kompresji:
  • kompresja bezstratna - stosuje się ją do kompresji tekstu, gdyż w tym przypadku nie można pozwolić sobie na utratę danych, co prowadziłoby do zaniku słów. Podstawowe programy kompresujące to np.: pkzip, arj.
  • kompresja stratna - w tego rodzaju kompresji dochodzi do utraty danych, lecz można dzięki temu znacznie zmniejszyć rozmiar dokumentu. Stosuje się ją do kompresji obrazków. Odtworzony obraz nieznacznie różni się od pierwowzoru, lecz dla ludzkiego oka nie ma to większego znaczenia, ponieważ drobne różnice w odcieniach kolorów postrzegane są identycznie jak leżące blisko siebie punkty o różnych barwach, dla nich oko uśrednia kolory.
Celem kompresji jest wyeliminowanie powtarzającej się informacji. Możliwości kompresji zależą od jakości zeskanowanego dokumentu oraz gęstości informacji na stronie.


2.9 OCR (OPTICAL CHARACTER RECOGNITION)

OCR [8] jest jedną z metod kompresji danych. Oprogramowanie OCR rozpoznaje znaki tekstowe w zeskanowanym dokumencie i tworzy tekst wyjściowy w kodzie znaków ASCII, który może być edytowany. Po tym procesie pojemność dokumentu może zostać zmniejszona nawet do 15 razy. Wadą metody OCR jest to, że nie wszystkie znaki mogą zostać prawidłowo rozpoznane i potrzebne są wtedy ręczne poprawki. Dzięki metodzie OCR możliwe jest stworzenie pełnotekstowego indeksowania. OCR nie potrafi kompresować obrazków graficznych i zdjęć. Metoda OCR może być stosowana tylko do dokumentów tekstowych.


2.10 METADANE

Dane służące do opisu danych, umożliwiają ich wyszukiwanie oraz ułatwiają zarządzanie informacjami elektronicznymi [4]. Ponadto dostarczają wiadomości na temat formatu i powiązań pomiędzy zasobami. W bazie danych przykładowo metadane oznaczają te dane, które opisują własności poszczególnych pól. Jest to: nazwa pola, jego typ oraz długość. Innym przykładem metadanych jest spis treści czy linki umieszczane na stronach WWW. Dzięki metadanym można uzyskać szczegóły dotyczące stron elektronicznych oraz uzyskać dostęp do pełnotekstowych baz danych.



Początek strony  |   Spis treści   |   Poprzednia strona   |   Następna strona