Pierwsza strona
Warto wiedzieć

Anna Blażewicz

TECHNOLOGICZNE ASPEKTY DOSTĘPU DO INFORMACJI W ŚRODOWISKU ELEKTRONICZNYM


ROZDZIAŁ TRZECI

PRZEGLĄD PRZYKŁADOWYCH PROJEKTÓW Z ZAKRESU DIGITALIZACJI DOKUMENTÓW


3.1 ROLA PROFESJONALISTÓW W DOSTARCZANIU INFORMACJI W PRZYSZŁOŚCI WIDZIANA "OCZAMI NAUKOWCÓW"

"Profesjonaliści w dostarczaniu informacji powinni wyciągać ręce i zrywać dojrzałe owoce kwitnącego interesu. Jeśli nie potrafimy znaleźć sadu, możemy mieć pretensje tylko do siebie samych"
E. Stephen

Profesjonaliści dostarczający informację to wszyscy ci, dzięki którym mamy możliwość wyszukiwania i przeglądania artykułów, czasopism oraz innych rodzajów publikacji zarówno w formie elektronicznej jak i drukowanej [1]. Na przestrzeni kilku ostatnich lat obserwuje się znaczny przyrost użytkowników Internetu. Obecnie jest ich 95 milionów, natomiast za dwa lata szacowany jest wzrost o ponad 300 procent. Aby sprostać takiemu zainteresowaniu, profesjonaliści będą musieli ujednolicić dostęp do informacji pochodzących z różnych źródeł oraz przywiązać większą uwagę do przetwarzania zasobów. Kolejnym problemem jest standaryzacja praw autorskich. Użytkownicy nie będą chcieli korzystać z wielu różnych bibliotek elektronicznych, gdyż dostęp do każdej z nich wymagałby zawarcia osobnej umowy licencyjnej. Dodatkowym zagadnieniem, które powinni rozważyć profesjonaliści jest stworzenie tzw. portali, dzięki którym możliwy jest bezpośredni dostęp do informacji przez poszczególne grupy użytkowników. Portale dostarczają mechanizmów wyszukiwania informacji, umożliwiają dokonywanie zakupów on-line, korzystanie z poczty elektronicznej, dostęp do najnowszych wiadomości oraz dostosowywanie przeglądarki do swoich preferencji [11]. Oprócz powyższych zagadnień, występują również następujące czynniki, które mają wpływ na kształtowanie się dostępu do informacji w przyszłości:
  • komputery staną się coraz bardziej "ludzkie" - mają one coraz większe umiejętności w udzielaniu odpowiedzi, upodabniając się do ludzi. Przyczynia się także do tego zdolność rozpoznawania mowy ludzkiej.
  • szybsze połączenia sieciowe - umożliwiają lepszy dostęp do Internetu zarówno w pracy jak i w domu. Ważnym punktem rozwoju będą połączenia bezprzewodowe, dostępne nawet w społecznościach wiejskich.
  • znacznie poprawi się dostęp do informacji - personalizacja oraz portale to tylko nieliczne z usług dostępnych i rozwijanych w sieci.
  • nastąpi globalizacja ekonomii - użytkownik będzie miał większy dostęp do usług i dóbr internetowych, dostępne będą także informacje na temat cen i różnych aukcji w Internecie, co przyczyni się do zmniejszenia cen.

3.2 ZASTOSOWANIE INFORMACJI ELEKTRONICZNEJ W ŚRODOWISKACH AKADEMICKICH

Wymiana i dostęp do informacji w środowisku akademickim może odbywać się na wiele sposobów [35]. Najprostszym i najbardziej popularnym jest poczta elektroniczna. Innym rozwiązaniem jest dostęp do bibliotek cyfrowych on-line lub na płytach CD. Ponadto studenci mają możliwość ściągania materiałów przy wykorzystaniu usług ftp. Często organizowane są także konferencje internetowe. Wyszukiwanie informacji jest znacznie ułatwione poprzez dostępne oprogramowanie oraz linki, umożliwiające szybkie przemieszczanie się między różnymi dokumentami.
Takie i wiele innych możliwości daje Internet, dlatego zapotrzebowanie na niego jest szczególnie widoczne w środowiskach akademickich, gdzie możliwość wymiany informacji między naukowcami z różnych dziedzin jest kluczowym elementem sukcesu.
Ponadto Internet stwarza dobre warunki nauki dla studentów a także wszystkich tych, którzy mają zamiar się uczyć. Organizowane są dla nich kursy nauki poprzez sieć. Daje to możliwość wyboru dowolnego kursu, niezależnie od zamieszkania danego studenta czy sprzętu, jaki ma do dyspozycji. Takie kursy są organizowane po to by wzbogacić zajęcia na uczelni lub są przeznaczone także dla tych studentów, którzy z różnych przyczyn nie mogą lub nie chcą uczęszczać do szkół wyższych. Mowa tu między innymi o ludziach z uszkodzeniami wzroku i gorszym przyswajaniem wiedzy [7]. Jest ich stosunkowo dużo np. w Kanadzie procentowy rozkład w 18 uniwersytetach jest 57% uczniów mających problemy z nauką, 37% z uszkodzonym zmysłem wzroku oraz 6% z fizycznymi uszkodzeniami.
Internet daje im duże możliwości nauki. W celu pomocy tym ludziom Uniwersytet Brytyjski CILS (British Columbia College and Institute Library Services) oferuje specjalny program nauczania. Jest to jednak bardzo kosztowne i wymaga dużej wiedzy o tych ludziach, ich potrzebach oraz umiejętności przystosowania się do nowych rozwiązań technologicznych. Tylko niewiele bibliotek uniwersyteckich może sobie na coś takiego pozwolić. Organizacja CILS oferuje swoim studentom książki Braille'a oraz książki z dużymi czcionkami. Rysunek 3.1 pokazuje jakie materiały do nauki preferują użytkownicy z uszkodzeniami wzroku.



Rys.3.1 Środki nauki wykorzystywane przez uczniów niewidomych

Rysunek 3.2 pokazuje jakie materiały do nauki preferują użytkownicy z wolniejszym przyswajaniem wiedzy.


Rys. 3.2 Środki nauki wykorzystywane przez uczniów z wolniejszym przyswajaniem wiedzy

Jak wynika z ankiety największe powodzenie u obu grup mają kasety, natomiast teksty elektroniczne przydają się szczególnie studentom niewidomym. Dla nich organizacja CILS przygotowuje różne kursy w zależności od rodzaju choroby oraz dostępu do komputera i umiejętności jego obsługi. Dokumenty dostępne są w formatach WordPerfect, Word lub w plikach otrzymywanych przez pocztę elektroniczną. Materiały są dostarczane w formacie ASCII, lub drukowanym. Wtedy trzeba je zamienić na postać elektroniczną - następuje ich skanowanie. Jednak nawet najlepszy skaner jest tylko w 99% dokładny, co przy dużych książkach oznacza poprawę do 16 tysięcy błędów. CILS stosuje OCR do poprawy błędów. Następnie obrazki są przedstawiane w standardzie NBA Manual. Ostateczna wersja książki jest tak przygotowana, by w pełni zaspokoić potrzeby użytkowników.
Oprócz projektów przeprowadzanych na rzecz studentów z uszkodzeniem wzroku, na całym świecie projektuje się te dotyczące wszystkich innych grup akademickich oraz ich nauczycieli. Poniżej zostaną przedstawione kluczowe z nich.


3.3 WYSZUKIWANIE INFORMACJI PRZEZ NAUKOWCÓW Z RÓŻNYCH DZIEDZIN - CHEMIKÓW, MATEMATYKÓW, FIZYKÓW I ASTRONOMÓW

3.3.1 RODZAJE PUBLIKACJI UŻYWANE PRZEZ NAUKOWCÓW

Metody dostępu i wyszukiwania informacji poprzez naukowców są zmienne i zależą od pojawiających się nowych systemów informacyjnych [2]. Chemicy, fizycy i astronomowie, by pogłębiać wiedzę korzystają z bieżącej literatury (czasopism). Matematycy, natomiast oprócz tego, w celu prowadzenia badań stosują starsze materiały. Informacje matematyczne często przedstawiane są w postaci monografii. Istnieje wiele różnych rodzajów materiałów, z jakich korzystają naukowcy przy prowadzeniu badań. Jak wynika z sondażu przeprowadzonego wśród pracowników Uniwersytetu w Oklahomie książki mają największe powodzenie. Poniższa tabela przedstawia narzędzia, wspomagające nauczanie:


Tab. 3.1 Narzędzia wspomagające nauczanie

narzędzia
chemicy,
biochemicy
matematycy
fizycy,
astronomowie
monografie
65
23
60
książki
94
92
93
czasopisma
53
15
40
nadbitki przed publikacyjne
12
0
6
udział w konferencji
12
7
6
materiały konferencyjne
12
7
0
rozmowy
12
15
13

Wśród narzędzi wspomagających prowadzenie badań największą popularnością cieszą się czasopisma oraz nadbitki przed publikacyjne co pokazuje tabela 3.2.

Tab.3.2 Narzędzia wspomagające prowadzenie badań

narzędzia
chemicy,
biochemicy
matematycy
fizycy,
astronomowie
monografie
76
85
53
książki
19
23
33
dzienniki
90
92
87
nadbitki przed publikacyjne
43
92
67
udział w konferencji
71
92
60
materiały konferencyjne
43
54
47
rozmowy
48
97
33

W nauce najbardziej przydatnym narzędziem wśród wszystkich grup naukowych są książki. Zarówno chemicy, fizycy jak i astronomowie używają również monografii i czasopism, natomiast do prowadzenia badań najczęściej korzystają z literatury bieżącej - czasopism. Matematycy również wykorzystują czasopisma, lecz przydatne są dla nich także nadbitki przed publikacyjne, konferencje, jak również rozmowy z ludźmi. Matematycy najmniej spośród wszystkich grup korzystają z monografii do nauki, lecz najwięcej do celów badawczych.
Czasopisma stanowią najczęstsze źródła informacji bieżącej. Pracownicy korzystają z nich najczęściej w formach pokazanych w tabeli 3.3.

Tab.3.3 Korzystanie z czasopism przez naukowców

Metoda
chemicy,
biochemicy
matematycy
fizycy,
astronomowie
prenumerata czasopism drukowanych
55
23
38
czytanie egzemplarzy bibliotecznych
75
62
75
kopiowanie egzemplarzy bibliotecznych
90
100
81
prenumerata czasopism elektronicznych
5
8
6
biblioteki cyfrowe
5
8
19
dokumenty elektroniczne dostępne za darmo
20
31
44

Najwięcej pracowników korzystało z dokumentów bibliotecznych, kopiując je potem do własnego użytku. Wielu prenumerowało czasopisma, na czwartym miejscu znajduje się korzystanie z dokumentów w wersji elektronicznej. Jest to spowodowane zbyt małą dostępnością takich artykułów oraz niską świadomością zalet materiałów elektronicznych. 65% respondentów opowiedziało się za materiałami drukowanymi, a 23% preferowało informację w formie elektronicznej. 16 % chciałoby mieć dostęp do obu typów materiałów z możliwością drukowania elektronicznych.


3.3.2 WYSZUKIWANIE INFORMACJI

Zdobywanie informacji ze starszych roczników wydań zostało przedstawione w poniższej tabeli 3.4.
Legenda:
5a - 5% przeglądało artykuły
7b - 7% korzystało z Science Citation Index
13c - 12% używało Stanford Public Information Retrieval System

Tab. 3.4 Sposoby wyszukiwania informacji z poprzednich lat

metoda
chemicy,
biochemicy
matematycy
fizycy,
astronomowie
słowa kluczowe na końcu artykułów
95
92
94
słowa kluczowe na końcu rozdziałów książek
65
62
25
szukanie wg streszczeń/indeksów
70
69
56
rozmowy
35
69
50
przeglądanie starszych czasopism
20
23
19
inne
5a
7b
12c

Niewątpliwie najlepszą metodą znajdowania informacji z poprzednich lat są słowa kluczowe w czasopismach a także szukanie wg streszczeń/indeksów. Naukowcy uważają, że elektroniczny spis treści byłby bardzo pomocny w znajdowaniu potrzebnych informacji. Teraz na Uniwersytecie w Oklahomie jest on dostępny tylko w formie drukowanej.
Powyższy przegląd miał na celu ukazanie preferencji wyboru rodzaju informacji oraz dostępu do niej na przykładzie naukowców z Uniwersytetu w Oklahomie. Te wiadomości są istotne dla bibliotekarzy zarówno tych tradycyjnych jak i zarządzających cyfrowymi bibliotekami., by lepiej służyć swoim klientom.


3.4 PROJEKT SUPERJOURNAL

3.4.1 OPIS PROJEKTU

SUPERJOURNAL PROJECT [6] to projekt trwający trzy lata (1996-1998) zrealizowany w Wielkiej Brytanii. Badania zostały przeprowadzone na podstawie analizy logów systemowych, które były sprawdzane przez 22 miesiące (luty 1997 - listopad 1998). Brano pod uwagę programy z jakich użytkownicy korzystali oraz przydatność poszczególnych narzędzi wyszukujących. Dane zbierane były miesięcznie i analizowane za pomocą statystyk.
Przeprowadzano także wywiady z 55 użytkownikami dotyczące cech przydatności danych usług oraz stopnia zadowolenia podczas korzystania z nich. Dyskutowano w grupach w dwóch uniwersytetach oraz przeprowadzano ankiety sieciowe dokonane wśród użytkowników projektu SuperJournal. Na podstawie powyższych badań określano poziom zadowolenia z dostępnych funkcji oraz motywacje do korzystania z magazynów elektronicznych.
Implementacja biblioteki elektronicznej przebiegała wg etapów pokazanych w tabeli 3.5.

Tab.3.5 Etapy implementacji biblioteki elektronicznej SuperJournal

udostępnienie
cechy
    pierwsze:
    listopad 1996
  • udostępnienie zasobów za pomocą hasła
  • wyszukiwanie:
    • czasopism
    • pełnotekstowe dokumenty dostępne w formacie PDF
  • narzędzia wyszukujace:
    • dwa typy wyszukiwarek - NetAnswer i Isiste
    • wyszukiwanie informacji na podstawie nagłówków artykułów i abstraktów
    • wyszukiwanie wg nazwisk autorów oraz słów kluczowych
  • przechowywanie informacji na temat preferencji użytkowników
  • zawiadamianie użytkownika poprzez pocztę elektroniczną o nowościach
  • system linków pomiędzy artykułami oraz do zewnętrznej bazy danych
    drugie:
    maj 1997
  • wyszukiwanie:
    • wg tytułów, nagłówków i obrazków
  • artykuły są dostępne także w formacie HTML, wszędzie tam gdzie wydawca dostarczy format PDF oraz HTML (lub SGML)
  • narzędzie wyszukujące:
    • dostępne trzy typy wyszukiwarek - dodano RetrievalWare
    • przeszukiwanie wszystkich pełnotekstowych dokumentów PDF
    trzecie:
    kwiecień 1998
  • stworzenie listy interesujących artykułów dla każdego użytkownika (bezpośredni dostęp do nich w przyszłości)
  • bezpośrednie linki do bibliografii
  • zachowywanie odniesienia do artykułu na ekranie lub poprzez e-mail w standardowym formacie
  • zachowywanie bibliografii
  • zachowywanie rezultatów wyszukiwania informacji z NetAnswer
    czwarte:
    sierpień 1998
  • umożliwienie użytkownikom bezpośredniego dostępu do listy czasopism, bez ekranów początkowych
  • usługa zawiadamiania dostosowana do osobistych preferencji
  • linki z bibliografii do abstraktów zrealizowane w formacie PDF
  • wyszukiwanie łańcuchowe


3.4.2 CECHY PROJEKTU

Biblioteka cyfrowa SuperJournal posiada następujące cechy:
  • wyszukiwanie - SuperJournal umożliwia 2 typy interakcji z systemem: takie gdy użytkownik, wie dokładnie czego szuka i osiąga cel poprzez hiperłącza oraz takie gdy użytkownik nie chce korzystać z dostępnych środków wyszukujących. Wyszukiwanie poprzez system linków może odbywać się na kilka sposobów:
    • skokowe - użytkownik porusza się od najwyższego do najniższego poziomu poprzez wybrane poziomy (nie wszystkie),
    • łańcuchowe - przeglądanie wszystkich poziomów podczas jednej sesji,
    • poziome - przeglądanie artykułów znajdujących się na tym samym poziomie w hierarchii
  • wyszukiwanie za pomocą oprogramowania: Isite, NetAnswer i RetrievalWare. Zaimplementowane zostały trzy rodzaje wyszukiwarek, by umożliwić wszechstronne wyszukiwanie i porównywanie wyników. Oprócz wyszukiwania wg tematów: słów kluczowych, autora, tytułu artykułu lub czasopisma, czy stosowania operatorów logicznych, studenci mają możliwość:
    • przeglądania i wybierania danych ze spisu autorów i słów kluczowych (Isite),
    • szukanie poprzez przykłady (RetrievalWare)
    Gdy wyniki zostaną wyświetlone studenci mają możliwość obejrzenia opisu lub pełnego tekstu. Mogą także zachować rezultaty poszukiwań (NetAnswer).
  • dostosowanie cech systemu zgodnie z upodobaniami użytkownika - tworzenie zakładek do ulubionych pozycji, preferowana wyszukiwarka, wybranie strony domowej, ustawianie automatycznego wyjścia z systemu, zmiana osobistego identyfikatora oraz konfiguracja skrzynki pocztowej.
  • system zawiadamiania użytkownika:
    • zawiadomienia wysyłane pocztą elektroniczną - użytkownik ma możliwość wyboru czasopism z jakich chce otrzymywać wiadomości,
    • zawiadomienia osobiste - ustawiane przez odbiorcę, w zależności od profilu informacji jakie chce otrzymywać.
3.4.3 WYNIKI BADAŃ

Poniżej opisane zostały wnioski wyciągnięte na podstawie obserwacji systemu czyli analizy logów systemowych.
Wyszukiwanie okazało się najskuteczniejszą metodą zdobywania informacji niezależnie od wieku, stanowiska i dziedziny nauki badanych. Wykres 3.3 przedstawia szczegółowe informacje dotyczące przeszukiwania przy pomocy linków.



Rys.3.3 Metody przeszukiwania dokumentów


Ulubionym sposobem poruszania się między dokumentami było jak widać wyszukiwanie łańcuchowe. Użytkownicy przy wyszukiwaniu informacji często posługiwali się przeglądarkami. Najczęściej jednak nie używali w tym celu żadnych kluczowych słów. Tabela 3.6 przedstawia wyrazy, którymi głównie posługiwali się użytkownicy przy wyszukiwaniu określonych danych.

Tab.3.6 Wyszukiwanie wg pól

Isite                                        NetAnswer

pola

ilość zapytań

odsetek zapytań

ilość zapytań

odsetek zapytań

żadne

947

68.23

580

39.56

słowa kluczowe

174

12.54

543

37.04

autor

105

7.56

234

15.96

tytuł

87

6.27

206

14.05

streszczenie

66

4.76

71

4.84

nazwa czasopisma

50

3.60

157

10.71

miejsce pracy

3

0.22

-

-

słowa z artykułu

4

0.29

-

-

wydawca

-

-

4

0.27

adres

-

-

19

1.30


Wyrazy, które najczęściej były używane w celu znalezienia informacji to słowa kluczowe, autor oraz tytuł artykułu. Z tabeli widać także, iż większym powodzeniem cieszyła się przegladarka NetAnswer.
Ponadto studenci i naukowcy wspólnie stwierdzili, iż mechanizm klastrów również znacznie ułatwia wyszukiwanie dokumentów, poprzez to iż łączy on ze sobą powiązane tematycznie materiały. Ten mechanizm jest ponadto odzwierciedleniem biblioteki standardowej, gdyż książki w bibliotece ułożone są tematycznie. Także użytkownicy mogą stosować swe przyzwyczajenia również w bibliotece cyfrowej. Uważają oni również za pomocne stworzenie klastrów użytkowników.
Po znalezieniu szukanych informacji użytkownicy woleli czytać artykuły z ekranu w formie HTML, natomiast drukować z plików PDF. Tabela 7.7 pokazuje ile razy użytkownicy przeglądali 5 przykładowych czasopism w obu formach.

Tab.3.7 Ilość przeglądanych dokumentów w formie HTML i PDF

 

MC1

 

MC4

 

MGP1

 

MGP13

 

MGP6

 
 

HTML

PDF

HTML

PDF

HTML

PDF

HTML

PDF

HTML

PDF

ilość

5

44

14

75

173

288

35

40

247

634


Rysunek 3.4 ukazuje podsumowanie (HTML i PDF):


Rys. 3.4 Porównanie HTML i PDF
Jest to interesujące, gdy wziąć pod uwagę fakt, iż dokumenty w formacie PDF znacznie dłużej są ściągane przez sieć. Użytkownicy, po znalezieniu żądanego dokumentu, wybierają formę PDF i następnie ją drukują. Większość, bo aż 45.6% drukuje artykuł bez wglądu do niego, natomiast 36.5% dogłębnie czyta artykuł zanim zdecyduje się na jego wydrukowanie. Są też i tacy, którzy czytają streszczenie 32.7% i w zależności od treści decydują się na jego wydruk. Użytkownicy, którzy w ogóle nie drukują artykułów stanowią mniejszość, tylko 7.7%.
Oprócz wniosków wyciągniętych na podstawie logów systemowych były też te z przeprowadzonych ankiet (podczas korzystania z systemu SuperJournal).
Użytkownicy uważali, że zwracane wyniki nie zawsze były adekwatne do tego co chcieli otrzymywać, czasem długo musieli na nie czekać oraz różne wyszukiwarki zwracały często inne wyniki.
Wielu spośród czytelników ceniło sobie dobrą jakość wydruku, bardzo zbliżoną do oryginalnego czasopisma oraz tym samym podobny wygląd. Użytkownicy często napotykali na problemy związane z drukowaniem. Jak wynika z badań w wielu przypadkach rezygnowali oni z dalszego drukowania.
Dostosowywanie interfejsu do potrzeb użytkowników, było przez 80% z nich uważane za dodatkowy atut. Jednak tylko 3.8% stwierdziło, że jest to jedną z głównych zalet SuperJournal.
System zawiadamiania użytkownika został przyjęty z mieszanymi uczuciami. Część (56%) uważała go, podobnie jak w powyższym przypadku za dodatkowy atut, niektórzy za rzecz utrudniającą pracę, natomiast poniżej 14% użytkowników stwierdziło że jest on niezbędny.
Wiele z napotkanych problemów można byłoby uniknąć, gdyby użytkownicy byli bardziej świadomi, tego co system może im zaoferować oraz jak można go najefektywniej wykorzystać.

3.4.4 PODSUMOWANIE

Podsumowanie wszystkich dostępnych usług w systemie SuperJournal przedstawia tabela 3.8.

Tab.3.8 Opis usług dostępnych w systemie SuperJournal

funkcje ocena przydatności poszczególnych funkcji satysfakcja użytkowników z funkcji dostępnych w projekcie SuperJournal

podstawowe wyszukiwanie

czasopisma powinny być pogrupowane tematycznie (system klastrów)

- czasopisma w jednym miejscu

- łatwość obsługi

 

wyszukiwarki

powinno być dostępne wyszukiwanie wg tytułów i streszczeń

bibliografia powinna być przeszukiwalna

drukowanie

drukowane materiały powinny być dobrej jakości

- dostępna opcja do drukowania

- dobra jakość

- sfrustrowani przez pojawiające się techniczne problemy

dostosowywanie do klienta

nie jest to niezbędne

3.8% stwierdziło że lubi tą funkcję

systemy zawiadamiające

opinie zróżnicowane, więcej za zawiadomieniami poczty elektronicznej niż osobistymi

315% stwierdziło że lubi tą funkcję

zachowywanie

nie jest niezbędne

6.7% stwierdziło że lubi tą funkcję

wyszukiwanie przygotowaw- cze (poprzez linki)

nie jest niezbędne, dobrze gdy jest

8.6% stwierdziło że lubi tą funkcję

linki do zewnętrznych zasobów

nie jest niezbędne, dobrze gdy jest

9.5% stwierdziło że brak linków do zewnętrznych zasobów jest wadą systemu



Początek strony  |   Spis treści   |   Poprzednia strona   |   Następna strona