100
Matnning asosiy mazmun-mundarijasini aks ettiradigan kalit so’zlar,
terminlar, tayanch tushunchalar bazasi asosida kompyuterda lug’at tuziladi.
Bunday lug’at
informatsion qidiruv tezauruslari
deb ataladi. Tezauruslar
ensiklopedik va izohli lug’atlardan farqli ravishda til birliklarining matnda
qo’llanish chastotasi va matnning predmet mundarijasini
aks ettirish darajasiga
qarab tuzilda. Bunda terminning mazmuniy tavsifi orqali bazadagi ma’lumotlar
qidirilishiga mo’ljallangan bo’ladi. Terminlar tezaurusga qat’iy semantik prinsiplar
asosida kiritiladi, bunda ularning
gipo-geperonimik (tur-jins), holo-meronik
(butun-bo’lak), iyerarxik (pog’onali)
munosabatlari hamda assotsiativ mazmuniy
bog’lanishlari e’tiborga olinishi lozim. Masalan, Wikipedia sahifasidan “tezaurus”
terminining tavsifini olaylik:
Теза́урус
(
от
греч
.
Θησαυρός
—
сокровище
)
в
современной
лингвистике
—
особая
разновидность
словарей
общей
или
специальной
лексики
,
в
которых
указаны
семантические
отношения
(
синонимы
,
антонимы
,
паронимы
,
гипонимы
,
гиперонимы
и
т
.
П
.)
между
лексическими
единицами
.
Таким
образом
,
тезаурусы
,
особенно
в
электронном
формате
,
являются
одним
из
действенных
инструментов
для
описания
отдельных
предметных
областей
.
В
отличие
от
толкового
словаря
,
тезаурус
позволяет
выявить
смысл
не
только
с
помощью
определения
,
но
и
посредством
соотнесения
слова
с
другими
понятиями
и
их
группами
,
благодаря
чему
может
использоваться
в
системах
искусственного
интеллекта
.
В
прошлом
термином
тезаурус
обозначались
по
преимуществу
словари
,
с
максимальной
полнотой
представлявшие
лексику
языка
с
примерами
её
употребления
в
текстах
.
Также
термин
тезаурус
употребляется
в
теории
информации
для
обозначения
совокупности
всех
сведений
,
которыми
обладает
субъект
.
Категории
:
Морфология
(
лингвистика
)
|
Синтаксис
|
Разделы
лингвистики
|
Уровни
языка
Тезаурусы
•
Амара
-
коша
(
Словарь
Амары
) —
первый
и
наиболее
важный
санскритский
тезаурус
(III—IV
век
)
•
Первым
тезаурусом
в
современном
смысле
слова
стал
английский
Тезаурус
Роже
(XIX
век
,
около
15000
синсетов
).
•
Викисловарь
:
многоязычный
свободно
пополняемый
словарь
и
тезаурус
(2004-
наст
.
вр
.,
проект
фонда
Викимедиа
,
в
Русском
Викисловаре
(
дамп
—
январь
2009)
содержится
250
тыс
.
понятий
, 67
тыс
.
отношений
[1]
)
101
•
РуТез
—
тезаурус
русского
языка
(
был
создан
Центром
информационных
исследований
как
инструмент
для
автоматического
индексирования
;
разрабатывается
с
1997
года
по
настоящее
время
, 45
тыс
.
понятий
, 107
тыс
.
слов
и
выражений
, 177
тыс
.
отношений
)
См
.
Также
•
Викисловарь
•
Идеографический
словарь
•
Русский
семантический
словарь
•
Семантический
анализ
•
Семантическая
сеть
Ссылки
•
www.thesaurus.com —
Тезаурус
английского
языка
•
Захаров
Н
.
В
.,
Луков
А
.
В
.
Школа
тезаурусного
анализа
//
Знание
.
Понимание
.
Умение
. — 2006. —
№
1. —
С
. 231-233.
•
Лесников
С
.
В
.,
Лесникова
Д
.
С
.
Информационно
-
поисковый
тезаурус
•
Луков
А
.
В
.
Фрактальность
тезаурусов
(
в
статье
делается
заключение
о
фрактальности
тезауруса
лишь
на
основании
перевода
слова
«
фрактал
»)
•
Луков
Вал
.
А
.,
Луков
Вл
.
А
.
Тезаурусный
подход
в
гуманитарных
науках
Virtual ensiklopedia sanalgan Wikipediada keltirilgan “tezaurus” so’ziga
bag’ishlangan lug’at maqolasida
semantik munosabatlar, assotsiativ bog’lanishlar
hamda iyerarxiya munosabati yaqqol ko’zga tashlanadi. Shu o’rinda ta’kidlash
zarurki, keyingi paytlarda qidiruv tizimlari bazasidagi tezauruslar giperhavolalar
bilan ham ta’minlanmoqda, bu esa userga bir muncha qulayliklar yaratadi. Ya’ni
qidirilayotgan terminlarga aloqador bo’lgan boshqa yaqin tushunchalar bilan
bog’liq ma’lumotlarni ham oson topish imkonini beradi.
Ilm-fan, texnika taraqqiyoti intensiv ravishda
rivojlanyotgan bu davrda
terminlar dinamikasini e’tiborga olgan holda tezauruslar bazasini muttasil to’ldirib,
boyitib borish zarur. Chunki til ochiq dinamik tizim hamda jamiyat taraqqiyotining
“barometri” hisoblanadi, ya’ni ayrim tushunchalar eskiradi, ularning o’rniga yangi
tushuncha va terminlar yuzaga keladi. Informatsion qidiruv tezauruslar yaratishda
mana shuni doimo e’tiborga olish lozim. Xalqaro
INFOTERM
(Xalqaro
terminologik markaz, Avstriya)
tashkilotining ma’lumotiga ko’ra hozirgi kunda
tillardagi terminlar miqdori 50 million, mahsulot nomlari miqdori 100 millionni
tashkil etadi. Lekin ushbu statistik ma’lumot turg’un emas,
u jamiyat taraqqiyoti
bilan yonma-yon o’zgarib turadi.
102
Kompyuter lingvistikasida inqilobiy o’zgarish yasagan yangilik bu
gipertekst texnologiyasi hisoblanadi. Chunki bu tizim Guttenberg asos solgan kitob
bosish texnologiyasiga zid ravishda yangi turdagi matn strukturasini vujudga
keltirdi. Gipertekst g’oyasi AQSH prezidenti F.Ruzveltning fan va ta’lim bo’yicha
maslahatchisi Vannevar Bush nomi bilan bog’liq bo’lib,
u foydalanuvchiga matn
va uning fragmentlarini turli assotsiativ munosabatlar asosida bog’lashga imkon
beruvchi
“MEMEKS”
tizimini nazariy jihatdan asoslab berdi. U 1945 yilda “The
Atlantic Monthly” jurnalida “Memeks” deb atalgan kelajakdagi xayoliy qurilma
haqida
Dostları ilə paylaş: