Pierwsza strona
Warto wiedzieć

Anna Blażewicz

TECHNOLOGICZNE ASPEKTY DOSTĘPU DO INFORMACJI W ŚRODOWISKU ELEKTRONICZNYM


ROZDZIAŁ SIÓDMY

PROJEKT BIBLIOTEKI CYFROWEJ

Projektowana biblioteka cyfrowa ma udostępniać w pierwszym rzędzie materiały elektroniczne wszystkim studentom i wykładowcom poznańskiego środowiska akademickiego a także wszystkim innym, którzy są będą członkami. Dostęp do zasobów bibliotecznych ma odbywać się poprzez sieć lokalną LAN w budynku biblioteki, oraz poprzez sieć miejską MAN poza obszarem uczelni. Użytkownicy, którzy chcą dostać się do zasobów zarówno z zewnątrz jak i z wewnątrz budynku są identyfikowani na podstawie identyfikatora i hasła.
Biblioteka cyfrowa powinna zapewniać swoim użytkownikom możliwość przeglądania, wyszukiwania, zamawiania oraz rezerwacji wszystkich dostępnych pozycji. Ponadto powinna umożliwiać dostęp do innych pełnotekstowych baz danych, szczególnie czasopism. Jest to bardzo pożyteczna funkcja, ponieważ studenci mogą w bardzo łatwy i szybki sposób poszukać i uzyskać informacje na temat zagadnień, które ich interesują. Biblioteka powinna także posiadać w swoim wyposażeniu drukarki, tak by niektóre ze znalezionych informacji mogły być drukowane na miejscu z formatu PDF. Dzięki temu użytkownicy, którzy przyzwyczajeni są do materiałów drukowanych, mogą również w bibliotece cyfrowej korzystać z informacji w sposób dla nich najodpowiedniejszy.
Pełnotekstowe bazy danych mogą być zgromadzone na dyskach oraz CD-ROMach. Stacje robocze powinny być wyposażone w przeglądarki oraz programy potrzebne do odczytywania danych w różnych formatach. Oprócz udostępniania pełnotekstowych baz danych, istnieją także inne pożyteczne funkcje, jakie mogą spełniać biblioteki. Należy do nich między innymi dostęp do wybranych czasopism w kraju i zagranicą. Może on być zrealizowany za pomocą łączy do wybranych stron. W podobny sposób może być realizowany dostęp do materiałów oferowanych przez inne biblioteki oraz konsorcja biblioteczne. Biblioteki często łączą się w zakupie nowych materiałów, by zapewnić dostęp do zasobów elektronicznych w większym wymiarze. Z jednej strony jest to dużą ich zaletą, ponieważ zwiększa się ilość dostępnych materiałów, jednak z drugiej strony uczelnie posiadają informacje z wielu dziedzin, nie zawsze w pełni związanych z zagadnieniami wykładanymi na danej uczelni.
Ostatnią usługą, jaką dostarczają biblioteki jest możliwość zamawiania informacji w innych bibliotekach. Zamawianie może odbywać się dzięki poczcie elektronicznej, usługom telnetu, ftp lub wypełnieniu formularza na stronie WWW. Jak wiadomo taka usługa zamawiania materiałów w bibliotece elektronicznej jest dużą zaletą w porównaniu do zwykłej biblioteki, gdyż zamówione materiały mogą być dostępne w bardzo krótkiej chwili od czasu wysłania zamówienia. Rysunek 7.1 przedstawia proponowane rozwiązanie biblioteki cyfrowej Politechniki Poznańskiej.

Rys.7.1 Schemat implementacji biblioteki cyfrowej

Poniżej zostaną omówione poszczególne elementy wchodzące w skład biblioteki czyli sprzęt, oprogramowanie oraz sposoby pozyskiwania i dostępu do informacji.


7.1 POZYSKIWANIE MATERIAŁÓW WCHODZĄCYCH W SKŁAD BIBLIOTEKI CYFROWEJ

Celem biblioteki cyfrowej jest udostępnianie materiałów elektronicznych w jak największym wymiarze i jak największej liczbie użytkowników. Informacja elektroniczna będzie dostępna w dwóch formatach: HTML i PDF. Dzięki temu dany użytkownik będzie miał możliwość wyboru formy prezentacji informacji. Jest to przydatne w wielu przypadkach, ponieważ jak wykazały prowadzone badania (patrz punkt 3.3.1), większość użytkowników preferuje formę drukowaną od elektronicznej. Oczywiście stacje robocze muszą być wyposażone w dwa rodzaje przeglądarek elektronicznych Internet Explorer dla formatu HTML oraz Acrobat Reader dla PDF.
W celu uzyskania materiałów elektronicznych z formy drukowanej niezbędny jest odpowiedni skaner. Skanery dzielimy na: ręczne, mobilne i stacjonarne [26]. Skanery ręczne, zwane również domowymi służą do skanowania obrazu i tekstu o niskiej rozdzielczości w dowolnym formacie. Skanery mobilne są podobne do skanerów ręcznych, lecz posiadają dodatkowe urządzenie umożliwiające samoistne przesuwanie się skanera po skanowanej powierzchni. Skanery stacjonarne (inaczej stołowe) służą do skanowania formatów A3 lub A4; pojedynczą kartkę papieru przykrywa się wiekiem skanera. Najważniejsze cechy każdego skanera to:
  • GŁĘBIA KOLORÓW - skaner z 30 lub 36 bitową głębią kolorów jest w stanie wydobyć szczegóły ze zdjęć o małym kontraście.
  • ROZDZIELCZOŚĆ OPTYCZNA - gęstość elementów światłoczułych na listwie przesuwanej nad skanowaną ilustracją. Im jest ich więcej, tym więcej szczegółów jest w stanie wychwycić skaner. § ROZDZIELCZOŚĆ INTERPOLOWANA - umiejętność sztucznego podwyższania rozdzielczości otrzymywanego obrazu cyfrowego. Między dwa wczytane punkty obrazu wstawiane są kolejne, których jasność i kolor wyliczone są przez program na podstawie wartości punktów sąsiednich. Zwiększanie rozdzielczości interpolowanej zwiększa wielkość ilustracji, lecz obraz nie zawiera przez to więcej szczegółów.
  • ROZPOZNAWANIE PISMA (OCR lub ICR) - optyczne rozpoznawanie znaków z graficznego wizerunku liter. Dzięki programowi OCR można ilustrację zawierającą tekst przetworzyć w dokument tekstowy, który wtedy może być edytowany dowolnym edytorem tekstu. Często jednak wymaga on później ręcznych poprawek, ponieważ podobne litery np. 'l' i 'ł', mogą być źle interpretowane. Błędy mogą wynikać także z jakości tekstu, im jest bardziej wyblakły, tym większe prawdopodobieństwo pomyłki. Mimo wszystko lepiej jednak jest dokonać drobnych poprawek niż ręcznie wklepywać w klawiaturę kilkustronicowy tekst. Oczywiście dotyczy to przede wszystkim tekstów drukowanych, gdyż szansa na odczytanie przez skaner pisma ręcznego jest minimalna, chociaż niektóre programy OCR mają opcję uczenia. Przy zakupie warto zwrócić uwagę czy program OCR rozpoznaje polskie znaki, ogonki.
  • OPROGRAMOWANIE (sterownik) - program odpowiadający za efektywność procesu skanowania (kalibracja, podgląd w trakcie prescanu, wielozadaniowość podczas skanu, płynna regulacja rozdzielczości, skalowanie obrazu) komfort pracy, oraz czasochłonność. Obecnie podstawowym i ogólnie przyjętym sposobem komunikacji programów z połączonymi do komputera urządzeniami graficznymi jest standard TWAIN.
  • KALIBRACJA - regulacja przetwarzania informacji o obrazie mająca na celu zapewnienie maksymalnej zgodności przedstawianych kolorów z oryginalnymi barwami.
Kupując skaner stacjonarny trzeba zwrócić uwagę na fakt czy jest on jedno - czy trójprzebiegowy, ta cecha ma wpływ na szybkość i jakość pracy. W skanerze trójprzebiegowym głowica skanująca odczytuje dokument trzy razy, za każdym razem skanując jedną składową RGB, co w niektórych wypadkach daje niewyraźny skan, spowodowany np. minimalnym przesunięciem się dokumentu. Skaner jednoprzebiegowy robi to samo podczas jednego przebiegu głowicy. Na rynku istnieje wiele skanerów różnych firm między innymi MICROTEK, MUSTEK, HP oraz AGFA. Wymienione stanowią tylko część z nich.
Na potrzeby biblioteki cyfrowej wystarczy skaner stacjonarny, płaski np. MICROTEK PHANTOM 636 lub HP ScanJet 3200C. Oba są jednoprzebiegowe i umożliwiają skanowanie z rozdzielczością 600´1200 dpi oraz 30-bitową skalę koloru. Skaner HP ScanJet 3200C jest wyposażony w zintegrowany moduł automatycznego rozpoznawania tekstu (OCR) firmy Recognita. Formaty plików możliwe do uzyskania dzięki skanowaniu to dla obrazów: mapa bitowa BMP, TIFF i TIFF z kompresją (TIF), PCX, JPEG, FlashPix (FPX), GIF, PNG, WMF (Windows Meta File) oraz RTF. Natomiast do tekstu : TXT oraz RTF (Rich Text Format). Oprócz skanera potrzebne jest także oprogramowanie do obróbki tekstu. Może to być Paint Shop Pro lub Adobe Photoshop. Umożliwiają one komunikację ze skanerem w standardzie TWAIN.
Gdy jest wybrany odpowiedni skaner trzeba określić reguły skanowania dotyczące zarówno obrazu jak i tekstu. Tabela 7.1 przedstawia parametry skanowania obrazków i tekstu.
Tab. 7.1 Parametry skanowania obrazów i tekstu biblioteki cyfrowej

parametry skanowania

obrazy do przeglądania

obrazy do druku

tekst

rozdzielczość

300 dpi

600 dpi

300 dpi

głębia koloru

- 24-bity dla obrazów kolorowych

- 256 dla obrazów z odcieniami szarości

- 30 - bitów dla obrazów kolorowych

- 10 - bitów dla obrazów z odcieniami szarości

tryb czarno-biały

dokładność skanowania

75%

95%, gdyż przy wyższej wartości nie ma różnicy w wyglądzie obrazu, natomiast znacznie wzrasta objętość pliku

95%


Uwagi dotyczące przechowywania obrazu:
  1. W bibliotece każdy obrazek powinien być przechowywany w dwóch kopiach, w lepszej i gorszej jakości. Celem takiego przechowywania jest umożliwienie czytelnikom drukowania bardziej czytelnych obrazów. Natomiast, gdy chce on przeglądać dany dokument obraz powinien być mniejszy, przez co szybciej będzie dostępny na danej stronie. Obrazki większe mogą być przechowywane na dyskach magnetycznych i ściągane w razie potrzeby.
  2. Zeskanowane zdjęcia powinny być później przerabiane za pomocą programów takich jak Paint Shop Pro czy Adobe PhotoShop
  3. Proponowane rozwiązanie to kompresja zdjęć zgodnie z regułami opisanymi w rozdziale 5.3. Czyli kolorowe i szare zdjęcia o gładkich przejściach kolorów będą skanowane w formacie JPEG, natomiast rysunki o ostrych jednolitych kolorach oraz czarno-białe w formacie GIF.
Uwagi dotyczące tekstu:
  • Po skanowaniu tekst powinien być przetworzony za pomocą programu Recognita. A następnie udostępniony w dwóch formach: formie HTML dzięki narzędziu Netscape Composer oraz formie PDF za pomocą Adobe Acrobat.

7.2 OPROGRAMOWANIE BIBLIOTEKI CYFROWEJ

Na proponowane oprogramowanie biblioteki cyfrowej składają się następujące elementy:


7.2.1 SERWER WWW

Serwer WWW [29] to program działający na komputerze w sieci Internet, który jest odpowiedzialny za odpowiedź na żądania przeglądarki i wysłanie jej odpowiednich plików. Jest on niezbędny do publikowania dokumentów w sieci. Ponadto zarządza danymi wprowadzanymi przez użytkowników w formularzach przeglądarek oraz łączy wprowadzone dane z odpowiednimi programami, np. bazami danych. Serwery WWW i przeglądarki komunikują się ze sobą za pomocą protokołu HTTP (Hypertext Transfer Protocol). Jest to specjalny język utworzony do obsługi próśb o pliki i transferu dokumentów hipertekstowych w sieci.
Przy wyborze serwera WWW trzeba kierować się pewnymi zasadami, które zostaną opisane poniżej [16]. Pierwszą z nich jest skalowalność i możliwości danego serwera. Ponieważ biblioteka cyfrowa wraz z upływem czasu będzie posiadać coraz więcej danych, serwer powinien efektywnie i sprawnie nimi zarządzać. Wybrany serwer powinien zostać przetestowany w środowisku z wieloma danymi. Ponadto powinien zapewniać bezpieczne połączenia oraz transakcje bazodanowe o dużej prędkości.
Drugą cechą jest niezawodność i dostępność. Serwer powinien być dostępny przez 24 godziny siedem dni w tygodniu. By to było możliwe logi serwera powinny być zmieniane bez przeszkody w pracy systemu. Serwer powinien także posiadać zabezpieczenia na wypadek procesów kończących się niepowodzeniem, by wyeliminować przerwania w świadczonych usługach.
Kolejna z cech to możliwość współpracy serwera ze zróżnicowanym oprogramowaniem. Obecnie aplikacje są oparte na otwartych standardach i mogą współpracować z różnymi środowiskami. Serwer powinien umożliwiać pracę zgodnie z protokołem HTTP 1.1. Powinien także mieć wbudowany standard SSL, który zapewnia bezpieczeństwo wymiany informacji oraz zarządzanie siecią zgodnie z protokołem SNMP. Dobry serwer powinien umieć współpracować z wieloma systemami operacyjnymi oraz sprawnie zarządzać środowiskiem heterogenicznym. Serwer powinien także dostarczać narzędzi do łatwej, centralnej administracji.
Ostatni czynnik stanowi sprawne zarządzanie aplikacjami oraz szybki dostęp do bazy danych.
Obecnie istnieje wiele serwerów przeznaczonych do różnych zastosowań. W przeciwieństwie do serwerów bezpłatnych (Apache), serwery firmy Netscape mają więcej opcji administracyjnych i mogą radzić sobie z dużymi obciążeniami, co dla biblioteki cyfrowej Politechniki Poznańskiej będzie często spotykanym zjawiskiem. Firma Netscape dostarcza również pomocy technicznej.
Proponowane rozwiązanie to serwer Netscape Enterprise Serwer 3.6. W tabeli 7.2 zostaną przedstawione cechy wybranego serwera WWW.

Tab.7.2 Cechy Netscape Enterprise Serwer

cechy

Opis

uruchamiany na platformie Windows NT oraz platformach Unix'owych

posiada zdolność współpracy zarówno z systemem Windows NT oraz systemami takimi jak: Sun Solaris, HP-UX, IBM AIX i Unix. Aplikacje mogą być rozproszone na różnych platformach sprzętowych i systemach operacyjnych.

HTTP 1.1

możliwość użycia wszystkich funkcji HTTP 1.1

certyfikaty SSL 3.0 oraz X.509

dostarcza mechanizmów zabezpieczenia: autoryzacji, kodowania informacji. Klient Netscape Enterprise Serwer może przeprowadzać identyfikację za pomocą adresu IP, nazwy DNS, identyfikatora i hasła użytkownika lub certyfikatu cyfrowego X.509.

wirtualne serwery

aż 256 sieciowych serwerów może znajdować się na jednej maszynie, co zmniejsza koszty administracyjne oraz dostarcza większej elastyczności w działaniu systemu.

zaawansowane cechy baz danych

umożliwienie zaawansowanych cech baz danych takich jak: procedury zachowywania, kursory bazo-danowe łączące kilka żądań sieciowych oraz połączenia z wieloma bazami danych jednocześnie przy zapewnieniu elastyczności w tworzeniu bazo-danowych aplikacji.

zapewnienie poprawnej pracy procesów

monitorowanie pracy procesów umożliwia automatyczne wykrycie i ponowne uruchomienie procesów źle działających bez interwencji operatora.

zdalne zarządzanie

bezpieczny, oparty na wyszukiwarkach interfejs administracji umożliwia zdalne zarządzanie wszystkimi serwerami z dowolnej lokalizacji oraz przy użyciu dowolnej wyszukiwarki.

zarządzanie klastrami

możliwość uruchomienia, zatrzymania lub uaktualnienia plików konfiguracyjnych wielu zdalnych serwerów jednocześnie.

możliwość dołączania aplikacji Javy

możliwość implementacji Javy a także JavaScript 'u.

łatwe współdzielenie dokumentów

możliwość publikacji dokumentów poprzez ich dzielenie lub współpracę

automatycznie uaktualnianie linków

linki są automatycznie uaktualniane, kiedy dokument jest przeniesiony lub ma zmienioną nazwę. Sprawdzana jest także ważność linków.

wiele formatów plików

możliwość utrzymania wyszukiwania i zarządzania wieloma formatami plików, poza plikami HTML.

wyszukiwanie pełno-tekstowe

możliwość wyszukiwania pełno-tekstowego oraz meta-danych.



7.2.2 SYSTEM OPERACYJNY SOLARIS

Środowisko operacyjne SolarisTM 7 to platforma dla przetwarzania sieciowego [25]. System Solaris firmy Sun Microsystems jest w pełni 64-bitowy, o najwyższej niezawodności, dostępności i wydajności.
64-bitowa technologia umożliwia wzrost wydajności oraz pojemności dla całego szeregu aplikacji takich jak: poszukiwanie danych, ich analizowanie oraz pracę wyszukiwarek WWW. Dzięki 64-bitom aplikacje mogą bezpośrednio adresować większą ilość danych z pamięci, a nie z dysku. Tak więc operacje, które zajmowały dużo czasu, np. zapytania do bazy danych, teraz przeprowadza się dużo krócej. Efektem staje się szybszy dostęp do informacji, zwiększona efektywność pracy i obniżenie kosztów operacyjnych.
Środowisko operacyjne Solaris 7 obsługuje intensywny ruch w sieci, ogromne zbiory danych i rozwiązuje zadania wymagające najwyższych wydajności. Dzieje się tak dzięki skalowalności środowiska 64-bitowego. Środowisko operacyjne Solaris 7 jest skalowalne od komputera typu desktop aż po centrum przetwarzania danych, a więc może być dostosowane do zmieniających się potrzeb użytkownika. Technologia ta umożliwia aplikacjom dostęp do większej ilości plików jednocześnie. W tym samym czasie może pracować więcej procesów systemowych, co w efekcie powoduje, że na serwerze będzie pracować więcej aplikacji. Solaris 7 udostępnia dodatkowo więcej połączeń sieciowych, dzięki czemu serwery mogą obsłużyć znaczną liczbę użytkowników.
Solaris 7 jest dobrym wyborem dla newralgicznych systemów. Zapewnia niezawodność, dostępność i łatwość obsługi (cechy RAS) klasy mainframe, jednakże jego cena jest ułamkiem kosztów mainframe'a. Ze środowiskiem Solaris 7 zintegrowana została funkcja dynamicznej rekonfiguracji, która pozwala na nieprzerwaną pracę systemu nawet w przypadku awarii płyty systemowej. Co więcej, administrator może wymienić uszkodzony komponent bez przerywania pracy użytkowników.
Standardy otwarte - takie jak TCP/IP czy NFS, które są zintegrowane ze środowiskiem Solaris 7 - sprawiają, że Solaris łatwo współpracuje z innymi platformami programowymi.
Przenoszenie danych z sieci prywatnych do publicznych wymaga wbudowania funkcji bezpieczeństwa. Środowisko operacyjne Solaris 7 zapewnia dobrą weryfikację użytkowników, integralność i prywatność danych, dzięki czemu są one zabezpieczone przed nieautoryzowanym dostępem. Solaris upraszcza także zarządzanie bezpieczeństwem sieciowym, ponieważ usługi dostępowe, jak np. logowanie użytkownika nie muszą być modyfikowane podczas zmian w procesie weryfikacji użytkowników.


7.2.3 BAZA DANYCH

Proponowany system zarządzania bazą danych to Sybase, ponieważ oprogramowanie biblioteczne Horizon współpracuje z taką właśnie bazą danych. Ponadto baza danych Sybase umożliwia przedstawianie danych w międzynarodowym formacie danych bibliotecznych - MARC . Taki format danych obowiązuje w większości bibliotek cyfrowych i dzięki temu mogą one komunikować się ze sobą. Poniżej zostanie przedstawiona krótka charakterystyka standardu MARC.
Badania nad tym standardem rozpoczęły się w 1965 roku w Ameryce i Anglii [22]. Standard MARC miał być przyjazny dla wszystkich rodzajów publikacji bibliotecznych, elastyczny w zastosowaniu różnych aplikacji oraz użyteczny w zintegrowanych systemach zarządzających bibliotekami. Pomimo współpracy badaczy z różnych krajów w latach 70-tych powstało wiele standardów opisujących strukturę rekordu bibliotecznego. Między innymi: UKMARC, INTERMARC i USMARC. Występujące różnice w opisach rekordów uniemożliwiły komunikację systemów bibliotecznych stosujących inny standard opisu danych. Jednym z rozwiązań tego problemu było stworzenie międzynarodowego formatu UNIMARC , który byłby w stanie zamienić dowolny format MARC na UNIMARC i potem przystosować go do formatu danej biblioteki. Formaty MARC przedstawia rysunek 7.2.
Ogólnie rekord typu MARC to bibliograficzny rekord możliwy do odczytania za pomocą komputera. Dzięki takiemu zapisowi dane są przedstawione w ten sam sposób, co ułatwia ich znalezienie i zarządzanie.

Rys. 7.2 Formaty MARC

Bibliograficzny rekord zawiera: opis danej pozycji, reguły dostępu do danego rekordu, czyli sposoby jego wyszukiwania, listę kategorii do wyszukiwania związanych z daną pozycją oraz numer określający przynależność pozycji do danej kategorii.
Książki charakteryzują się tym, iż nie można ich definiować za pomocą równej liczby liter i pól, ponieważ każda z nich posiada inny tytuł, autora oraz często istnieją one w powiązaniu z innymi pozycjami i wtedy potrzebne jest dodatkowe pole określające przynależność książki do danej serii. Dlatego rekord MARC nie ma określonej liczby pól oraz nie mają one zdefiniowanej długości. Ponadto każdy rekord zawiera spis treści, który opisuje jego zawartość. Dzięki takiej strukturze dowolna książka może być opisana za pomocą powyższego schematu oraz każda informacja ją opisująca może być w łatwy sposób wyszukana. Większość bibliotek stosuje standard MARC do opisu danych, przez co informacje danej biblioteki mogą być łatwo przekazywane do innych bibliotek. Ponadto większość systemów bibliotecznych obsługuje ten właśnie standard opisu informacji. Biblioteki mogą zmieniać system zarządzający i mają przy tym pewność, że ich dane będą kompatybilne z nowym systemem.
Format UNIMARC, jak każdy inny format MARC składa się z trzech elementów:
  • STRUKTURY REKORDU - odpowiedzialnej za kontrolę reprezentacji danych. Dane przechowywane są w ciągu znaków zwanymi polami.
  • OZNACZEŃ PÓL I PODPÓL REKORDU - w formacie MARC zostało zdefiniowane kilka reguł w celu identyfikacji danych w rekordzie. Dane podlegające identyfikacji to między innymi: autor, tytuł oraz tematyka danej pozycji. Dzięki takiej identyfikacji możliwe jest równoczesne wyszukiwanie informacji w wielu kategoriach oraz pomijanie niepotrzebnych elementów rekordu. UNIMARC umożliwia także formatowanie rekordów w celu ich wyświetlenie lub drukowania.
  • DANYCH REKORDU - dane przechowywane są w polach rekordu i dzielą się na dane bibliograficzne oraz dane szyfrowane. Te drugie opisują język tekstu, typ publikacji oraz numery kontrolne, natomiast dane bibliograficzne są opisane zgodnie z międzynarodowym standardem opisu danych bibliograficznych. UNIMARC ułatwia opis, pozyskiwanie i kontrolę nad danymi bibliograficznymi.
Rysunek 7.3 przedstawia strukturę podstawowych elementów rekordu MARC.

Rys.7.3 Struktura rekordu MARC

Pliki pełnotekstowe różnych typów: np. graficzne i tekstowe, będą znajdować się na serwerze, CD-ROMach oraz również na taśmach magnetycznych. By umożliwić użytkownikom dostęp do nich, po wyszukaniu ich w bazie danych, zostanie wykorzystane jedno z pól standardu MARC. Pole 958 w bazie danych opisuje dokument związany i wypełnia się je w celu stworzenia rekordu bibliograficznego wywołującego obraz, pełny tekst, animację, dźwięk lub inny rodzaj dokumentu. Podpola 958 są następujące:
  • $a - RODZAJ DOKUMENTU ZWIĄZANEGO. Jest to zdefiniowany przez bibliotekę kod, określający typ związanego dokumentu, np. plik graficzny JPEG, tekstowy TXT itd.,
  • $b - NOŚNIK. Jest to nazwa nośnika przechowującego dokument związany. Spowoduje ona logicznej nazwy nośnika z fizycznym sterownikiem stacji roboczej,
  • $c - NAZWA PLIKU ZAWIERAJĄCEGO DOKUMENT. Należy podać nazwę dokumentu ze ścieżką dostępu, ale bez oznaczenia napędu dyskowego,
  • $d - OPIS DOKUMENTU MULTIMEDIALNEGO. Opis dokumentu, który ma być odtworzony, np. Zbiorowe zdjęcie uczestników konferencji.
Przykładowy opis pola 958 wygląda następująco:
958 ## $aTXT $bCD $c\dokumenty_tekstowe\Bogurodzica.txt $dtekst Bogurodzicy
Podświetlenie linku tekst Bogurodzicy spowoduje uruchomienie notatnika i wyświetlenie zawartości pliku o nazwie Bogurodzica.txt znajdującego się w katalogu dokumenty tekstowe na CD.


7.2.4 ZINTEGROWANY SYSTEM HORIZON

Sercem każdej biblioteki cyfrowej jest system nią zarządzający. Powinien on umożliwiać katalogowanie, przegląd i wypożyczanie książek. A ponadto również ich rezerwację i monitorowanie. Powinien posiadać także przyjazny interfejs użytkownika np. GUI , umożliwiający prezentację plików i opcji w przejrzysty sposób. Proponowany system biblioteczny Politechniki Poznańskiej to HORIZON, który oprócz powyższych cech posiada także wiele innych właściwości, ułatwiających zarządzanie biblioteką cyfrową [13].
Jest to system zintegrowany, dzięki czemu wszelkie dane zmienione w jednym z modułów , są automatycznie uaktualniane w pozostałych. System HORIZON został oparty na bazie architektury klient-serwer. Klientami systemu mogą być wszystkie PC pracujące pod systemami operacyjnymi aplikacji HORIZON-a.
Ważnym jego atutem jest wykorzystanie standardu MARC, przede wszystkim UNIMARC i USMARC oraz interfejsu Z39.50 do komunikacji z innymi systemami. System HORIZON umożliwia pełne uwierzytelnianie użytkowników na podstawie ich identyfikatorów i haseł umieszczonych w bazie danych. HORIZON udostępnia zarówno dane multimedialne jak i pełnotekstowe baz danych.


7.2.5 WEBPAC

WebPAC jest oprogramowaniem serwera funkcjonującym jako gateway pomiędzy protokołem HTTP oraz Z39.50. Dzięki niemu przeglądarki WWW mogą być klientami dla przeszukiwań wszystkich baz danych Z39.50, włączając w to biblioteczne OPAC. WebPAC pozwala końcowym użytkownikom przeszukiwać zasoby biblioteczne na miejscu, lub na odległość przez Internet i dzięki zastosowaniu przeglądarek, wszystkie zasoby, niezależnie od źródła przedstawione są za pomocą jednolitego, graficznego interfejsu. Z punktu widzenia biblioteki jest to bardzo korzystne, ponieważ zna ona tylko oprogramowanie serwera WebPAC, zamiast wielu wersji oprogramowania klienta OPAC.
WebPAC został przetestowany przy obciążeniu dużej ilości transakcji oraz był używany w kilkunastu dużych bibliotekach. Za każdym razem udowadniał, że jest najlepszym, niezawodnym rozwiązaniem, nawet w przypadkach dużego obciążenia serwera.


7.2.6 PROTOKÓL Z39.50

Protokół Z39.50 jest międzynarodowym standardem wyszukiwania informacji [17, 23]. Głównym celem tego standardu jest zapewnienie komunikacji między różnymi systemami, tzn. zdolności przeszukiwania odległych baz danych i zwracania rekordów spełniających wyniki zapytania. Działanie protokołu jest oparte na modelu klient-serwer. Klientem Z309.50 może być WinPAC. Służy on do wyszukiwania danych w zewnętrznych krajowych oraz międzynarodowych bibliograficznych bazach danych Z39.50. Bazując na protokole ANSI Z39.50 WinPAC pozwala na optymalny dostęp do bibliograficznego pozyskiwania informacji. Jako klient Internetu oferuje on obok poszukiwań również import bibliograficznych zestawów danych do lokalnego zastosowania systemu HORIZON. WinPAC jest oprogramowaniem przeznaczonym dla bibliotekarzy.
Protokół Z39.50 określa formaty i procedury wymiany informacji odbywającej się pomiędzy klientem i serwerem. Sposób komunikacji pomiędzy klientem a serwerem za pomocą OPAC odbywa się w następujący sposób [9]. W pierwszej kolejności użytkownik OPAC wybiera docelową bazę danych, która ma być przeszukiwana i wpisuje kryterium zainteresowań. Następnie oprogramowanie OPAC wysyła zebrane dane do klienta Z39.50, który jest zintegrowany z systemem bibliotecznym. W dalszej kolejności klient przetwarza otrzymane dane na zapytanie protokołu Z39.50 i przesyła je do serwera, umieszczonego w docelowej bazie danych. Serwer tłumaczy otrzymane dane na bazo-danowy język, wysyła je do docelowej bazy i w zamian otrzymuje w odpowiedzi zbiór rekordów. Następnie otrzymane dane wysyła do klienta, który podaje je do oprogramowania OPAC odpowiedzialnego za przedstawienie otrzymanych informacji użytkownikowi.
Podczas takiej komunikacji pomiędzy klientem a serwerem, żądanie klienta może zawierać zapytanie lub parametry określające szukaną kategorię. Klient wskazuje jedną lub wiele baz danych, w których dane zapytanie ma być realizowane. Określony może zostać także sposób zwracania wyników. Dane mogą być transmitowane w postaci pełnych rekordów, za pomocą krótkiego opisu lub mieszanej wersji zawierającej oba rozwiązania. Ponadto można określić format zwracanych danych (np. USMARC).
W porównaniu do poprzednich wersji protokołu najnowsza posiada znaczne ulepszenia. Dotyczy to między innymi sposobu przesyłania informacji. Obecnie, jeśli klient chce otrzymać znaczną ilość rekordów, które nie mieszczą się w jednej wiadomości, nie musi za każdym razem przesyłać informacji z prośbą o następne, jak to było dawniej, lecz dostaje je w przychodzących, kolejnych wiadomościach. Jest to znaczne usprawnienie komunikacji, szczególnie w sytuacji, gdy przeszukiwana baza danych znajduje się w znacznej odległości od klienta. Poza tym serwer jest w stanie wydobyć szczegółowe informacje ze zróżnicowanej bazy danych, dotyczące między innymi konkretnych stron danego artykułu, rozdziału lub obrazków. Znalezione informacje mogą również zawierać opis struktury bazy danych, z której pochodzą, czyli np. typ zastosowanych w bazie indeksów, strukturę rekordów oraz nazwy ich pól.
Główną zaletą protokołu Z30.50 jest fakt, iż przy wyszukiwaniu informacji nie wymaga on znajomości struktury baz danych systemów docelowych. Ma to ogromne znaczenie, szczególnie w środowisku bibliotecznym, gdzie wiele systemów, zarówno tych małych jak dużych posiada własne technologie bibliotecznych baz. Ponadto protokół Z39.50 umożliwia wyszukiwanie różnych punktów docelowych w tym samym czasie, za pomocą jednego klienta.
Projektowana biblioteka elektroniczna Politechniki Poznańskiej powinna posiadać system biblioteczny, który zapewniałby obsługę tego protokołu, dzięki czemu użytkownicy mieliby dostęp do informacji nie tylko jednej, ich własnej biblioteki.


Początek strony  |   Spis treści   |   Poprzednia strona   |   Następna strona