МегаПредмет

ПОЗНАВАТЕЛЬНОЕ

Оси и плоскости тела человека Оси и плоскости тела человека - Тело человека состоит из определенных топографических частей и участков, в которых расположены органы, мышцы, сосуды, нервы и т.д.


Отёска стен и прирубка косяков Отёска стен и прирубка косяков - Когда на доме не достаёт окон и дверей, красивое высокое крыльцо ещё только в воображении, приходится подниматься с улицы в дом по трапу.


Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) - В простых моделях рынка спрос и предложение обычно полагают зависящими только от текущей цены на товар.

Тема: Глобальні мережі правової інформації.





Лабораторна робота №5

Виконала студентка групи 1П-09

Тема: Глобальні мережі правової інформації.

Мета:

Ø Ознайомитися з глобальними мережами праової інформації.

Ø Навчитися виконувати пошук правової інформації в Global Legal Information Network – GLIN

Ø Навчитися виконувати пошук документації з Європейського законодавства

КОНТРОЛЬНІ ПИТАННЯ:

1. Визначте критерії для вибору стратегії пошуку правової інформації в Інтернет.

2. Назвіть основні складові Глобальної мережі правової інформації GLIN та схарактеризуйте їх.

3. Назвіть основні інструменти пошуку інформації з Європейського законодавства в Інтернет та схарактеризуйте їх.

4. Які категорії інформаційно-пошукових систем видокремлюють?

5. За якими критеріями можна оцінити роботу інформаційно-пошукової системи?

 

 

Окно для поиска

Окно GLIN

Рисунок 1 Окно юридическая информация

Рисунок 2 Информация для контактов

Рисунок 3 Ссылки на систему GLIN

Рисунок 4 Параметры поиска в Glin

Рисунок 5 Россия

Рисунок 6 Ангола

Рисунок 7 Камерун

Відповіді на контрольні питання:

1. Існують три базові стратегії, які можуть бути використані:

перегляд пошукових каталогів - найчастіше це неефективна стратегія, яка дає безсистемні результати. Пошук здійснюється кроками, через вибір загальній категорії, потім - підкатегорії і т. д. за існуючою ієрархією. Складність такого пошуку полягає в тому, що користувач повинен визначити, до якої категорії належить його тема, а при відсутності стандартів кожен каталог має свою систематику і специфічне наповнення;

перехід по гіперпосиланнях від стартової сторінки. Ефективність цієї стратегії залежить від вибору початкового сайту або Web-сторінок. Більшість мегапорталів мають рейтинги сайтів, позначені як "Top" або "Cool". Такі рейтинги створюються за кількістю відвідувань їх користувачами. Але інформаційні потреби різних користувачів не збігаються, тому в таких рейтингів слід ставитися з обережністю. В той же час, як показує практика, більшість користувачів одного профілю мають однакові інформаційні потреби, а тому відвідують одні і ті ж тематичні сторінки, які можна розглядати як спеціалізований вхід в Інтернет. Тим, хто починає пошук правової інформації, можна, зокрема, рекомендувати сайт Верховної Ради України "Закони та підзаконні акти України в Інтернет" - http://www.rada.gov.ua/ (див. підрозд. 5.5); "Інформаційний бізнес-портал в Інтернет - LIGA ONLINE" -http://www.liga.kiev.ua; "Нормативні акти України - он-лайн" - http://www.nau.kiev.ua/;

пошук за допомогою пошукових систем. На відміну від каталогів, такий пошук не обмежується окремої категорії. Ця стратегія може бути використана і для пошуку першої сторінки.

 

 

Використовуючи пошукові системи Інтернет, потрібно враховувати такі фактори, що впливають на результативність пошуку:

 

кожна пошукова система Мережі має свою спеціалізацію;

пошук здійснюється не з повними текстами документів, а за їх пошуковими образами, при цьому кожна система має оригінальний механізм роботи з ключовими словами. Зокрема, якщо база даних системи невелика, то в неї записується більше термінів, в іншому випадку пошуковий образ документа відбираються "вагомі" ключові слова;

 

 

База індексів пошукової системи - поле конкурентної боротьби

Власники (автори) Web-серверів зацікавлені в тому, щоб їх URL адреси були відомі пошуковим системам, оскільки це прямий шлях до кінцевих користувачів. Крім звичайних прийомів при цьому застосовуються і нетрадиційні. Так, служби Lycos і AltaVista повідомили про зафіксовані спроби реєстрації вузлів з неправильними адресами і спроби видалення адрес з бази індексів, можливо, з метою нанесення збитку конкурентам. Деякі розробники намагаються ввести в оману роботів пошукових систем за допомогою "приманок" - до Web сторінки включаються популярні ключові слова, набрані невидимим шрифтом (таким, що збігається з кольором з фоном). Це може призвести до неправильної оцінки релевантності сторінки.

 

і запити, і їх інтерпретація реалізуються в пошукових системах по-різному. Більшість систем надають користувачу можливість сформулювати простий запит у формі фрази природному мовою без загальних слів, союзів і приводів або складний запит, який враховує специфіку пошукового апарату системи. Складний запит дає можливість варіювати різні параметри пошукового процесу.

Для того щоб підвищити ефективність пошуку, слід провести попередній аналіз теми інформаційного запиту і визначити:

унікальні слова, спеціальні терміни, назви, абревіатури або акроніми для даної теми. Пошук за такими словами найбільш ефективний. Для точного завдання граматичної форми слова слід розрізняти великі та малі літери, у деяких системах з цією метою також використовується символ "!". Якщо розшукується назва, перед відповідним словом може зазначатися оператор "title:";

співтовариства, організації, установи або окремих осіб, сайти або Web сторінки яких можуть містити потрібну інформацію або корисні посилання. Знайдені сторінки можуть стати стартовими для подальшого пошуку;

стійкі вирази (словосполучення, фрази), що стосуються даної теми, наприклад "правове регулювання" або "набуття чинності закону". Для такого пошуку слід використовувати лапки (дужки) або оператори відстані. Це уточнює запит і зменшує кількість документів, видаваних;

інші слова, які можуть виникати у будь-якому документі з заданої теми. Ключові слова найчастіше використовуються іменники, рідше - приводи і зовсім рідко - дієслова, прислівники, прийменники, союзи.

 

 

2,

Для науковців, які працюють у галузі права, законотворців, юристів з міжнародної торгівлі та багатьох інших фахівців украй необхідним є знання не тільки вітчизняного законодавства, а й міжнародного, так само як законів інших країн. Задовольнити таку потребу мала на меті Міжнародна правова база даних, створена 1976 року на базі Бібліотеки Конгресу США (The Library of Congress of the United States of America, http://lcweb.loc.gov). Ця база виправдала себе як простий та ефективний засіб швидкого і надійного доступу до складових правового середовища різних країн і з часом видозмінилася у Глобальну мережу правової інформації (GLIN, Global Legal Information Network, http://www.loc.gov/law/glin/, рис. 3.5).

GLIN було засновано на таких принципах:

Можливості GLIN доступні і для учасників системи (СONTRIBUTOR), які підтверджують свій статус введенням ідентифікатора і пароля, і для будь-яких інших зацікавлених осіб (GUEST).

Основні елементи бази даних GLIN такі:

· повні тексти документів офіційною мовою держави походження;

· резюме або витяги з документів англійською мовою;

· тезауруси англійською та іншими офіційними мовами.

· У GLIN використовуються такі тезауруси:

· тезаурус GLIN (Thesaurus for the Global Legal Information Network) — англомовний тезаурус, який розвивається з 1950 року. Він декларується як незвичайний і, можливо, унікальний засіб пошуку правової інформації через прагматичність, орієнтацію на тривале використання, багатофасетність індексування світового законодавства;

· словник індексів законодавства (Legislative Indexing Vocabulary, LIV) — тезаурус, розроблений Службою досліджень Конгресу (Congressional Research Service) для роботи з матеріалами щодо законодавства та державної політики;

· тезаурус тематичних термінів для графічних матеріалів (Thesaurus for Graphic Materials I: Subject Terms, TGM_I), який містить тисячі термінів і численні перехресні посилання для індексування візуальних матеріалів;

· тезаурус жанрів і фізичних характеристик графічних матеріалів (Thesaurus for Graphic Materials II: Genre and Physical Characteristic Terms, TGM_II), розроблений підрозділом гравюр і фотографій Бібліотеки Конгресу (Prints and Photographs Division) з введенням інформації з інших сховищ архівних зображень.

Для створення, підтримки і роздрукування тезаурусів використовується новітня платформонезалежна інтерактивна система управління тезаурусами Lexico (розробник — Project Management Enterprises, Inc.). Система створена на основі мови програмування Java, підтримує клієнт-серверну архітектуру з тонким клієнтом, доступна через Web. Lexico забезпечує створення інтерактивних тезаурусів, які містять терміни, зв’язки між ними, а також обґрунтування, супроводжувальну документацію та відомості про затверджений статус кожного терміна.

Lexico забезпечує такі основні лексикографічні функції:

· взаємні посилання — термін вищого рівня (Top term), термін нижчого рівня (Lower term), ширший термін (Broader term), вужчий термін (Narrower term), пов’язаний термін (Related term), «використовує» (Use), «використовується» (Used for);

· автоматичне занесення всіх названих посилань при встановленні зв’язку між термінами;

· автоматична підтримка ієрархії тезауруса;

· ведення пояснювальних приміток.

Lexico не обмежує максимальну довжину елементів тезауруса, кількість рівнів ієрархії та кількість термінів, які можуть брати участь у певному зв’язку. Система автоматично впорядковує терміни за алфавітом, запобігає дублюванню елементів, установленню неправильних зв’язків або зв’язків з невизначеними термінами.

Для неавторизованих користувачів доступні тільки функції пошуку даних. Внесені зміни, якщо вони припускаються конкретним варіантом інсталяції, не будуть записані в тезаурус. Пропонується надсилати свої пропозиції електронною поштою.

Для пошуку термінів у тезаурусі задаються такі реквізити:

· тип запиту:

· Term — запис з терміном — пошук терміна, найближчого за написом до введених символів;

· Keyword — ключове слово з контексту — пошук слова, найближчого до введених символів за ключовим словом, включаючи терміни, що містять це слово. Рекомендується для визначення релевантних термінів, коли перше слово невідоме. Наприклад, запит «war» («війна») приведе до видачі термінів «Moral aspects of war» («Моральні аспекти війни»), «Nuclear war» («Ядерна війна»), «War casualties» («Втрати на війні»);

· опції пошуку терміна: «Term records» — на екран будуть виведені терміни, зв’язки і примітки; «Hierarchy» — передбачається виведення тільки ширших та/або вужчих термінів, «Hyperlinks» — зв’язки з іншими базами даних.

Крім операцій з нормативними актами, членам GLIN також надається можливість вводити, шукати та оновлювати резюме правових документів (Legal Writings), до яких відносять статті з оглядом законів, звіти, думки, коментарі. Для систематизації матеріалів такі документи повинні, де це можливо, мати зв’язок з основними документами, вже розміщеними у GLIN, шляхом вказівки унікального номера резюме закону. При цьому для підтримки цілісності матеріалів окремої країни дозволяється встановлювати зв’язок тільки з резюме законів цієї країни (навіть якщо документ стосується законодавства інших країн).

Крім резюме законів та правових документів, GLIN містить відокремлений розділ «Guide to Law Online» («Гід права on-line») — анотований гіпертекстовий гід безплатних правових та урядових матеріалів усього світу, доступних в режимі on-line. Цей гід містить посилання тільки на найбільш корисні та надійні сайти, хоча включення сайту до списку не означає схвалення Правової Бібліотеки Конгресу, Дирекції бібліотечних послуг або Дирекції правових досліджень. Жодний із вказаних сайтів не визнано як такий, що повністю відповідає вимогам GLIN щодо повноти, точності та офіційно підтвердженої достовірності текстів, що вони їх надають. Перевага надається сайтам, які пропонують повні тексти законів, положень, судових рішень, а також коментарі юристів, написані для фахівців з права. До списку також включено урядові сайти, які надають загальну інформацію про себе та свої агенції.

У «Guide to Law Online» виділено підрозділи матеріалів Сполучених Штатів Америки («GUIDE: United States»), національних (GUIDE: Nations), міжнародних та міжнаціональних (GUIDE: International and Multinational) та об’єднаних за темами (GUIDE: Subjects) матеріалів.

 

3.

Вибір інструмента пошуку документації з Європейського законодавства залежить від поставлених цілей і має враховувати особливості конкретних сайтів і баз даних.

Головним інструментом загального бібліографічного пошуку є Каталог бібліотек Європейської Комісії (European Commission Libraries Catalogue, ECLAS, http://www.europa.eu.int/eclas/).

 

Існує три способи пошуку в базі даних ECLAS: простий пошук, експертний пошук і пошук за допомогою тезауруса. Якщо точна назва документа, що розшукується, невідома, можна скористатися пошуком за словом з назви або вибрати термін у термінологічній пошуковій системі («thesaurus search system»). Пропонуються дескриптори англійською і французькою мовами. Для пошуку матеріалів із законодавства ЄС ключовим словом є «EU/EC law» або «EU/EC policy» разом з іншими критеріями. До більшості дескрипторів, які стосуються європейських питань, на початку додається «EU/EC».

· «Експертний пошук» рекомендується використовувати для пошуку інформації щодо певної статті договору або вторинного законодавчого акта. При цьому вводиться номер потрібного документа CELEX. Ця функція не є повною, але якщо у документі існує хоча б одна стаття з визначеного питання, система виведе посилання до її тексту.

· За допомогою підрозділу ECLASPro можна записати запит у формі профілю пошуку, і ECLAS щотижня надсилатиме електронною поштою нові посилання на публікації або статті в цій галузі.

· Колекція ECLAS не обмежується матеріалами з Європейської тематики, при цьому вона містить документи всіма мовами. Навіть за умов відсутності фізичного доступу до цієї бібліотеки її каталог може стати в нагоді для подальшого пошуку. Каталог також містить опцію «Ресурси Інтернет» (Іntеrnеt Resources) з переліком доступних в Інтернет сайтів і документів, які вважаються важливими.

Безпосередньо тексти нормативних документів можна знайти у базах EUR-Lex і CELEX.

EUR-Lex (http://www.europa.eu.int/eur-lex) — база даних з поточного Європейського законодавства одинадцятьма європейськими мовами. EUR-Lex було реалізовано у рамках політики прозорості ЄС — з 1 січня 2002 року все чинне законодавство Співтовариства доступне для користувачів Інтернет. EUR-Lex надає безкоштовно будь-який закон чи підзаконний акт, затверджений Європейськими установами, протягом 45 діб з дати його публікації в Офіційному журналі Європейських Співтовариств . Після цього даний документ можна придбати на Celex або замовити на компакт-диску .

CELEX (http://www.europa.eu.int/celex) є найбільшою повною платною регулярно оновлюваною базою даних з Європейського законодавства, яка містить усі угоди, що їх було коли-небудь укладено, директиви та рішення Європейського Суду одинадцятьма мовами.

І EUR-Lex, і CELEX надають користувачеві документи у форматах HTML, PDF, TIFF.

· Відмінність між порталом EUR-Lex і законодавчою базою CELEX, крім платності послуг останньої, полягає у способі реалізації. Якщо завдання полягає у пошуку повного тексту документа Співтовариства, адекватним інструментом для цього є EUR-Lex. CELEX є інструментом, який було розроблено спеціально для юристів-професіоналів і має такі додаткові корисні опції: доступ до всіх актів прецедентного права, доступ до заходів з імплементації на національному рівні, огляд двома мовами, більший набір пошукових критеріїв, вибір мови експертного пошуку, опція «Звузити пошук» («Narrow down your search»), аналітична інформація (дескриптори, дати, перехресні посилання та ін.), он-лайн підтримка і панель допомоги.

Якщо відомі точні дані документа (наприклад, Directive 97/15 EC), EUR-Lex передбачає пошук чинного акта за його номером. У системі виділено окремі опції пошуку директив, рішень і регламентів. Аналогічно організується пошук і через підписну базу даних CELEX. В EUR-Lex може бути організований пошук документа за датою публікації. CELEX має більші можливості — як критерій пошуку можуть бути задані дата прийняття, дата публікації в Офіційному журналі, дата набрання чинності, дата вступу у дію або дата закінчення дії акта.

· Пошук за словом у тексті/назві, яке можна задати, коли точні реквізити документа невідомі, неефективний, оскільки у більшості випадків результати не точні і містять величезну кількість посилань. Тому і EUR-Lex, і CELEX пропонують схожі опції пошуку за темою. Документи в базі індексуються відповідальними особами. Процедура пошуку полягає у послідовному виборі потрібного розділу. Результати, що їх одержують у такий спосіб, є відносно повними, але слід враховувати той факт, що іноді документ Співтовариства може належати двом різним розділам. Навіть якщо пошуковий індекс містить записи в різних розділах, може статися так, що доведеться розширити межі пошуку.

· Варто зважати, що результати пошуку в EUR-Lex та CELEX надаються по-різному — у кожній загальній категорії CELEX виділено підкатегорії, EUR-Lex обмежується загальними актами. При цьому CELEX надає анотацію до кожного документа з переліком актів, якими вносяться зміни, тоді як EUR-Lex просто зазначає їх існування. У режимі експертного пошуку в CELEX можуть бути використані дескриптори багатомовного тезауруса EUROVOC.

Період між датою прийняття акта однією або кількома установами і датою публікації в Офіційному журналі Європейських Співтовариств може варіюватися від кількох днів до кількох місяців.

Крім CELEX та EUR-Lex, на ринку пошукових інструментів діють приватні компанії, які пропонують портали зі зведеною інформацією щодо Співтовариства, включаючи законодавство, яке зазвичай одержується з бази даних CELEX.

Доступ до документів CELEX ускладнюється тим, що до кожної статті організований окремий доступ. Наприклад, для пошуку Паризького Договору 1951 року, яким засновується Європейське співтовариство вугілля та сталі, необхідно спочатку шукати у розділі «Законодавство» (Legislation), потім — у розділі «Установ­чі договори» (Founding Treaties), потім — за датою, яку потрібно знати. Результат пошуку видається у формі 199 документів-секцій, які охоплюють усі статті та додатки до даного договору. Цей спосіб пошуку використовується, коли не існує альтернативи.

Процедура значно спрощується, якщо відомий номер потрібної статті договору. Наприклад, стаття 86 Римського договору, ухваленого в 1957 році, має номер 11957Е086, де 1 вказує на первинне законодавство/договори, 1957-й — рік підписання, Е — Римський договір, 086 — номер статті. При цьому слід враховувати, що після набрання чинності Амстердамського договору відбулась перенумерація статей договорів.

Коли введено тільки перші шість знаків (у даному прикладі — 11957Е), СЕLЕХ виводить на екран усі статті договору та додатки до нього. На цій стадії можна обмежити пошук, обравши опцію «contents» (зміст) для того, щоб відкрити вікно, в якому надається загальний список вибраних документів, включаючи відповідні протоколи та декларації з їхніми кодами. Пошук статті за номером і виведення тексту в режимі «all» (все) дає можливість продивитись не тільки повний текст статті, а й рішення суду, які впливають на акт.

Ще однією відмінністю між системами є те, що EUR-Lex, коли це необхідно, надає консолідовану версію документа. Варто зазначити, що не всі документи доступні у консолідованих версіях, оскільки їх створення — тривалий складний процес. З цієї самої причини при роботі з консолідованою версією слід звертати увагу на дату консолідації — до документа можуть бути внесені зміни вже після неї. Консолідовані версії документів у базу даних CELEX внесено протягом 2002 року.

 

У деяких випадках юристам потрібно звернутися до оригінальної версії документа. Такі тексти в електронному вигляді доступні на сайті «Європейський Навігатор» (European Navigator, ENA, http://www.enafree.lu), який є проектом уряду Люксембурга, присвяченим історії Європейського Союзу.

Беручи до уваги швидкість консолідації текстів Співтовариства і поступове тлумачення законодавчих актів у Союзі та державах-членах, Законодавчий Департамент та Інститут Європейського Університету розробляють академічний сайт під назвою «Консолідація європейського публічного законодавства» (Consolidating European Public Law, http://www.iue.it/LAW/ conseulaw/), присвячений цій проблемі.

За допомогою опції «Display the national implementing measures» («Показати заходи щодо імплементації на національному рівні»), доступної при виборі опції перегляду документа у форматі HTML «all/HTML», у CELEX можна одержати посилання на матеріали щодо введення певного акта до національних законодавств. EUR-Lex у розділі «Documents of public interest» (документи публічного інтересу) містить річні звіти з моніторингу виконання законодавства Співтовариства («Annual report on monitoring the application of Community law»), які описують актуальний стан виконання законодавства Співтовариства державами-членами і перераховують усі справи про його порушення та судові розгляди щодо останніх.

Інша опція CELEX — «Select all documents mentioning this document» («Вибрати всі документи, які згадують цей документ») — дає можливість знайти акти прецедентного права, які стосуються одного або кількох документів вторинного законодавства.

Найефективнішим способом пошуку повних текстів угод між Європейськими Співтовариствами і третіми державами або міжнародними організаціями є експертний пошук CELEX, в якому назва третьої держави (дескриптор EUROVOC) може застосовуватися разом з іншими критеріями, які відносяться до зовнішніх відносин. EUR-Lex надає перелік таких угод за географічними зонами, тому рекомендується проводити пошук у два етапи:

· одержати посилання на угоди на сайті Бюро угод Ради Європи (Council’s Agreements Office, http://ue.eu.int/accords/). Пошук у цій базі може виконуватись за словом з назви, за датою підписання, за сторонами, які підписували документ. Для кожної угоди виводиться назва, посилання на публікацію в Офіційному журналі Європейських Співтовариств (якщо така є), дати підписання та набирання чинності, а також перелік сторін, які підписали договір;

· шукати угоду в Довіднику чинного законодавства EUR-Lex, використовуючи посилання на публікації в Офіційному журналі Європейських Співтовариств.

Огляди щодо поточного стану відносин між ЄС (стосовно кожної держави-члена), групами держав, міжнародними організаціями та щодо поточних міжнародних справ можна знайти на сайті Генерального Директорату Європейської комісії із зовнішніх відносин (European Commission’s Directorate General for External Relations, http://www.europa.eu.int/comm/external_relations/index. htm). Додаткову інформацію можна знайти на сайтах європейських делегацій у третіх державах та міжнародних організаціях (http://www.europa.eu.int/comm/external_relations/ delegations/intro/ web.htm), на офіційних сайтах держав, які є членами угоди.

Основним джерелом для одержання рішень і наказів Європейського Суду Справедливості і Суду Першої Інстанції та думок генерального адвоката в електронній формі є сайт названих установ Curia (від лат. «сuria» — приміщення для засідань, http://curia.eu.int/), який надає доступ до повних версій рішень усіма офіційними мовами здебільшого вже у день їх видання. Пошук можна організувати за номером справи, хронологічним періодом, назвами сторін, обставинами справи або за словом з тексту. Додатково на сайті розміщується щотижневий інформаційний бюлетень «Proceedings of the Court of Justice and the Court of First Instance of the European Communities» (Засідання Суду Справедливості та Суду Першої Інстанції Європейських Співтовариств, http://curia.eu.int/en/act/index.htm), який містить конспекти винесених рішень, цитати думок генеральних адвокатів і перелік тільки-но поданих справ.

Для фахівців з судових органів Європейських Співтовариств сайт Curia має розділи «Introduction to the institution» (Введення до установи) і «Texts relating to the institution» (Тексти стосовно установи), які містять Статути Судів, відомості про членів та правила процедури Суду Справедливості та Суду Першої Інстанції, інформацію щодо тактики поведінки у суді, а також іншу інформацію довідкового характеру.

· Документи з прецедентного права можна одержати і в EUR-Lex та CELEX. Портал EUR-Lex надає доступ до повних текстів рішень та думок генеральних адвокатів на основі номера справи, назви сторін, слова у тексті або посилання на публікацію у Відомостях Європейського Суду (European Court Reports). Меню пошуку CELEX містить більшу кількість пошукових критеріїв, наприклад, за предметом розгляду або типом розгляду, і додаткові опції — посилання на коментарі щодо рішень, перехресні посилання, перегляд тексту двома мовами. Опція експертного пошуку CELEX надає можливість комбінувати ще більшу кількість критеріїв у формі булевого запиту з використанням сполучників «and» (і), «or» (або), «except» (за винятком) та ін. і обмежувати пошук до певного аспекту рішення (підстави позову, предмет спору, сторони, захисник, суддя-доповідач, генеральний адвокат та ін.).

4-5

Вирішення великої кількості правових задач залежить від якості результатів інформаційного пошуку — вибору з усієї відомої сукупності документів, текстів, відомостей, фактів і даних тих елементів, які відповідають інформаційним потребам. За умов великих обсягів інформації, серед якої здійснюється пошук, стає доцільним і навіть необхідним використання інформаційно-пошукових систем.

Інформаційно-пошукова система (ІПС) — це сукупність методів і засобів, призначених для зберігання та пошуку документів, відомостей про них чи певних фактів.

За тематикою виділяють галузеві ІПС, полі- та вузькотематичні. Залежно від типу інформації, що зберігається, розрізняють документальні системи, в яких об’єктом зберігання і пошуку є документ, та фактографічні, в яких зберігаються і розшукуються окремі дані, що характеризують деякі факти — події, процеси, явища.

За режимом функціонування виокремлюють:

· системи з вибірковим пошуком — ІПС, в яких пошук виконується за постійним набором запитів для певного контингенту користувачів у масиві поточних надходжень документів чи даних, які надходять через певні інтервали часу. При цьому змінюється вміст системи, а запити залишаються без змін;

· системи з ретроспективним пошуком, які обслуговують разові запити, що змінюються залежно від інформаційних потреб користувачів, у нагромадженому інформаційному фонді зі значною хронологічною глибиною.

Найефективнішим способом пошуку інформації є перегляд кожного документа і визначення його відповідності інформаційному запиту — тексту певною мовою, що відбиває деяку інформаційну потребу. Проте такий пошук є дуже тривалим. Тому насправді пошук здійснюється не за текстами документів, а за їх стислими описами інформаційно-пошуковою мовою — пошуковими образами. Процедура визначення пошукового образу документа (ПОД) називається індексуванням. Найбільш популярною моделлю створення ПОД є векторна модель. За цією моделлю кожному документові приписується вектор розмірності, що дорівнює кількості термінів, якими можна скористатися при пошуку. Елементами вектора є деякі числа (ваги), які визначають адекватність даного терміна документа (у найпростішому випадку — 1, якщо термін присутній, 0 — якщо термін у документі не трапляється).

Взаємодія користувача з ІПС охоплює такі операції:

· ведення в систему пошукових образів документів і самих документів;

· зберігання інформації в системі;

· формування запитів, опис і введення у систему пошукових розпоряджень — інформаційних запитів, викладених інформаційно-пошуковою мовою і доповнених допоміжною інформацією;

· пошук — порівняння пошукових образів документів з пошуковими розпорядженнями;

· прийняття рішення про видачу знайденої інформації залежно від критерію пошуку, визначеного користувачем;

· видача інформації, що відповідає інформаційному запиту.

Функціонування ІПС можна оцінити за кількома критеріями:

· повнота — здатність відшукувати та видавати релевантні документи, тобто такі, що відповідають запитові користувача;

· точність — здатність відсіювати та затримувати нерелевантні документи;

· економічна ефективність — окупність витрат на функціонування системи вигодами від її використання, серед яких важливе значення мають підвищення оперативності та зменшення трудомісткості пошуку.

 

ІПС може видати документ навіть якщо його ПОД не повністю відповідає пошуковому розпорядженню. У цьому разі результатом пошуку може бути не один якийсь документ, а їх множина, з якої користувач має вибрати ті, які відповідають його потребам найбільше. Це залежить від критерію пошуку, який може змінюватись за бажанням користувача. А загалом ефективність взаємодії користувача з ІПС та робота самої ІПС прямо залежить від якості інформаційно-пошукової мови (ІПМ) — спеціалізованої штучної мови, призначеної для опису центральних тем і формальних характеристик документів, а також опису інформаційних

запитів і наступного виконання пошуку. З цією метою не може бути використана жодна з природних мов через їх неструктурованість, велику кількість граматичних винятків, неоднозначність та надмірність.

Основні елементи ІПМ такі:

· алфавіт — система графічних знаків, що використовуються для утворення слів і словосполучень;

· лексика — сукупність слів, що використовуються в мові;

· граматика — сукупність засобів та правил побудови висловлювань;

· парадигматичні (базові, аналітичні) відношення — відношення, які не залежать від контексту використання і спричинені не мовними, а логічними зв’язками. Наприклад, поняття «магнітний диск», «магнітна стрічка», «лазерний диск», «паперовий документ» утворюють тематичну групу «носії інформації», усередині якої можна виділити лексико-семантичні парадигми «паперові носії інформації» та «машинні носії»;

· правила побудови індексів та їх ідентифікації.

Розрізняють ІПМ таких видів:

· передкоординатні (класифікаційного типу), в основу яких покладено систематичну класифікацію понять, що відбивають певні парадигматичні відношення. Класифікація може бути ієрархічною, фасетною, алфавітно-предметною;

· посткоординатні, в основу яких покладено принцип координатного індексування — зміст документів і запитів виражається набором ключових слів, вибраних з індексованого тексту.

 

Ключові слова — це слова, найбільш характерні для даного тексту або тематики. Пошук і вибір ключових слів є окремою складною проблемою, яка вимагає творчого підходу. Для правової ІПС таку роботу може виконати тільки висококваліфікований юрист широкого профілю. Але навіть повне визначення ключових слів недостатньо для організації ефективного пошуку, оскільки:

· ключові слова можуть мати різні варіанти написання та синоніми. Тоді документ, індексований за допомогою певного терміна, не буде виданий у відповідь на запит, складений з використанням терміна-синоніму;

· ключове слово може мати різні значення (проблема омонімічності). Запит, в якому присутні омоніми, призведе до видачі документів, які не стосуються вибраної користувачем теми;

· набір ключових слів не визначає родово-видові відношення між поняттями, а це звужує пошук.

З метою вирішення названих проблем для різноманітних тематик розробляються тезауруси — структуровані списки ключових слів, призначених для однозначного подання концептуального змісту документів і запитів. Тезаурус упорядковується так, щоб встановити прозорі еквівалентні, гомографічні, ієрархічні та асоціативні зв’язки між термінами.

Тезаурус містить:

· дескриптори — слова та словосполучення, які однозначно позначають поняття з теми тезаурусу;

· недескриптори — слова та словосполучення, які у природній мові позначають ті самі поняття, що і дескриптори, або еквівалентні поняття;

· семантичні зв’язки (зв’язки на основі значень) між дескрипторами і не-дескрипторами, а також між самими дескрипторами.

Проблема омонімічності у тезаурусі вирішується тим, що кожне ключове слово ставиться у контекст, який робить це слово однозначним. Для вирішення проблеми синонімічності один із синонімів обирається, більш-менш довільно, як дескриптор, а синонімам надається статус не-дескрипторів. Тільки дескриптори можуть використовуватись при індексуванні та формулюванні запитів, при цьому не-дескритори допомагають користувачам вибрати дескриптор. Якщо встановлено відповідність між ідентичними поняттями в різних мовах, користувач багатомовного тезауруса може формулювати запити рідною мовою і шукати документи незалежно від мови, якою вони були індексовані.

Прикладом спеціалізованого тезауруса є багатомовний політематичний інформаційно-пошуковий тезаурус EUROVOC, визнаний як міжнародний термінологічний стандарт. Він реалізований відповідно до стандартів ISO 2788-1986 «Guidelines for the establishment and development of monolingual thesauri» («Керівництво з введення і розробки одномовних тезаурусів») та ISO 5964-1985 «Guidelines for the establishment and development of multilingual thesauri» («Керівництво з введення і розробки багатомовних тезаурусів»).

EUROVOC використовується для індексування та пошуку даних в ІПС офіційних документів органів, установ, інститутів і деяких держав — членів ЄС. Цей тезаурус охоплює всі теми, важливі для діяльності європейських інституцій: політика, міжнародні відносини, європейські співтовариства, законодавство, економіка, торгівля, фінанси, соціальні питання, освіта і комунікації, наука, бізнес і конкуренція, зайнятість та умови праці, транспорт, навколишнє середовище, сільське господарство, лісництво і рибна ловля, виробництво, технології та дослідження, енергія, промисловість, географія, міжнародні організації. Деякі теми у EUROVOC розроблені детальніше порівняно з іншими, оскільки вони важливіші для роботи ЄС. Наприклад, тезаурус містить назви областей кожної держави — члена ЄС, а назви регіонів інших країн відсутні.

Слід відзначити, що однією з характеристик політематичних тезаурусів взагалі і EUROVOC зокрема є досить довільне групування дескрипторів за темами. Фактично, деякі дескриптори можуть торкатися двох або більше тем, але для спрощення управління тезаурусом та обмеження його розміру прийнято уникати поліієрархії. Іншими словами, дескриптор включають не до всіх тем, до яких він може належати, а тільки до тієї теми, яка здається найбільш природною для користувачів.

EUROVOC реалізований офіційними мовами Європейського Союзу. Усі мови реалізації мають однаковий статус — кожен дескриптор в одній мові обов’язково має відповідний дескриптор в іншій мові. Однак, між не-дескрипторами у різних мовах не існує еквівалентності, оскільки багатство мов різниться для різних тем.

EUROVOC має дворівневу ієрархію. Верхній рівень складають теми, які мають двохсимвольні коди, наприклад, 12 — «LAW», «Право». Нижній рівень організовано як сукупність мікротезаурусів, позначених чотирма цифрами, перші дві з яких визначають тему, до якої належить цей мікротезаурус: 1216 — «сriminal law» («кримінальне право»). Нумерація тем і мікротезаурусів єдина для всіх мов.

На екрані EUROVOC одночасно представлені дві панелі, які ілюструють вибраний рівень ієрархії: логотип EUROVOC і список тем і мікротезаурусів, або список мікротезаурусів і зміст вибраного мікротезауруса (рис. 3.1), або мікротезаурус і його окремий дескриптор.

 

на лівій панелі — список мікротезаурусів за темами «Європейські співтовариства», «Право», «Економікс»,

на правій — вміст мікротезауруса «Джерела та галузі права»

 

На рівні окремих дескрипторів і не-дескрипторів структура EUROVOC залежить від семантичних відношень, встановлених між ними. Передбачено такі їх типи:

· «SN» (Scope Note, примітка щодо можливих значень) — визначення, що уточнює значення дескриптора, або вказівка, як використовувати дескриптор при індексуванні документа та формулюванні запитів;

· «MT» (Microthesaurus, мікротезаурус) — посилання на мікротезаурус, до якого належить дескриптор (недескриптор);

· «UF» (Used For, використаний для) та «USE» (використовує) — зв’язок еквівалентності між дескриптором і не-дескриптором (-ами), що він їх подає (UF), або між недескриптором і дескриптором, який замінює цей недескриптор (USE). Фактично зв’язок еквівалентності охоплює кілька типів зв’язків:

· повної синонімічності або ідентичного значення;

· близької синонімічності або схожого значення;

· антонімії або протилежного значення;

· включення, коли дескриптор охоплює одне або більше понять, яким надано статус недескрипторів, оскільки вони рідко використовуються;

· ієрархічні зв’язки між дескрипторами:

· «BT» (Broader Term, ширший термін) — між певним дескриптором і родовим (більш узагальненим) дескриптором — зазначається з числом, яке показує кількість кроків за ієрархією між ними. При цьому дескриптори, для яких не існує ширших термінів, називаються термінами верхнього рівня. Деякі дескриптори з тем 72 «Географія» та 76 «Міжнародні організації» є поліієрархічними, іншими словами, для них існує більше одного ширшого терміна на наступному вищому рівні;

· «NT» (Narrower Term, більш вузький термін) — між родовим і видовим (більш вузьким) дескриптором — зазначається з числом, яке показує кількість кроків за ієрархією між ними;

· «RT» (Related Term, взаємозв’язані терміни) — асоціативні зв’язки між дескрипторами. Асоціативний зв’язок показує особі, що проводить індексування, або користувачеві, що існує інший, настільки ж або навіть більш релевантний дескриптор. Передбачено асоціативні зв’язки таких типів: причини та наслідку; органу або інструменту; ієрархії (оскільки, як сказано вище, поліієрархія не припускається, втрачені ієрархічні зв’язки можна замінити асоціативними); супроводження; послідовності у часі або просторі; входження до складу; характерної риси; об’єкта дії або процесу; розташування; подібності (в разі, коли два майже синонімічні терміни включено як дескриптори); антонімії.

Асоціативні зв’язки мають такі істотні характеристики:

· вони симетричні;

· вони несумісні з ієрархічними зв’язками — якщо два дескриптори пов’язані ієрархією, між ними не можна встановити асоціативний зв’язок і навпаки;

· між дескрипторами, які мають спільний термін верхнього рівня, не може бути встановлено асоціативні зв’язки.

Навігація за тезаурусом здійснюється за допомогою посилань. Дескриптор можна вибрати, набравши на клавіатурі першу літеру його назви дескриптора. Також реалізовані повнотекстовий пошук і пошук за ключовими словами.

 





©2015 www.megapredmet.ru Все права принадлежат авторам размещенных материалов.