İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
34 www.jpis.az
UOT 004.65:006.72
Əliquliyev R.M.
1
, Cəfərov Y.M.
2
1
AMEA İnformasiya Texnologiyaları İnstitutu, Bakı, Azərbaycan
2
AMEA Nəsimi adına Dilçilik İnstitutu, Bakı, Azərbaycan
1
secretary@iit.ab.az,
2
yedgar@yandex.ru
VİRTUAL MƏKANDA SİNONİMLƏR VƏ ONLARDAN
İSTİFADƏ MƏSƏLƏLƏRİ
Məqalədə dil sistemində xüsusi yer tutan sinonim sözlərin İnternet-axtarış sistemlərində yerinə
yetirdiyi funksiya, sinonim xarakterli açar sözlərlə bağlı ortaya çıxan çətinliklər araşdırılır. Bu
sahədə mövcud araşdırmalar nəzərdən keçirilir. Sinonimlik hadisəsinin dilin virtual mühitində
qazandığı yeni xüsusiyyətlərin təsviri verilir. Problemin həlli ilə bağlı müəyyən təkliflər irəli
sürülür.
Açar sözlər: leksika, sinonim, açar sözlər, axtarış sistemləri, siqnifikativ məna, denotat, kontent.
Giriş
İnternet-axtarış sistemlərində müvafiq məlumatların əldə edilməsi üçün açar sözlərin
düzgün seçilməsi, eyni zamanda, məlumatların əlyetərlilik baxımından daha uyğun açar sözlər
ətrafında mərkəzləşdirilməsi informasiya cəmiyyətində aktual problemlərdən biridir.
Axtarış sistemlərinin inkişafı davam edir və semantikliyə getdikcə daha çox yaxınlaşır.
Semantikləşmə virtual məkanda açar sözlərlə axtarışlar zamanı istifadəçilərin düşüncələrini
anlayaraq onlara daha dəqiq nəticələrin təqdim olunmasına imkan yaradır. Sinonimlərin dil
sistemində daşıdığı funksiya bu problemin tədqiqində xüsusi maraq doğurur.
Məlum olduğu kimi, hər bir söz üç ümumi əlaməti özündə birləşdirir: səs kompleksi, məna
və məna mənbəyi. Məhz bu üç cəhətin vəhdəti sözü əmələ gətirir [1]. Dildəki bir çox sözlər səs
kompleksinə, mənasına və məna mənbəyinə görə bir-birinə bənzəyir, yaxud bir-biri ilə tam
ziddiyyət təşkil edir. Bu cəhət də dil sistemində müxtəlif söz qruplarının əmələ gəlməsinə səbəb
olur. Yunan sözü olub, “eyni adlı” mənasını verən sinonimlər eyni məna və məna mənbəyinin
müxtəlif səs kompleksləri ilə əlaqəyə girdiyi sözlərdir. Məsələn: gözlük, çeşmək, eynək və s.
Onlar müxtəlif fonetik tərkibə malik olsalar da, məzmunca bir-birinə yaxın məna ifadə edir [2].
Sinonimlərin yeni semantik mühiti
Virtual mühitdə sinonimlərdən istifadə ilə bağlı tətbiq edilən sistemlərin mütəhərrikliyi,
real və virtual mühitdəki sinonimlərin bir-birindən fərqlənməsi, eyni zamanda, bu problemin
həlli ilə bağlı irəli sürülən müddəaların müxtəlifliyi bu söz qruplarının süni intellektin inkişaf
perspektivlərinə təsiri barədə dəqiq elmi qənaətlərin ortaya qoyulmasını bir qədər çətinləşdirir.
Əvvəlki tədqiqatlarda sinonimlərdən söhbət gedərkən, daha çox bir-biri ilə hər hansısa
şəkildə əlaqəsi olan qohum sözlər nəzərdə tutulurdu. Lakin məlumatların dəqiqliyini tələb edən
virtual mühitdə sinonimlər qohum sözlər arasındakı uyğunluqdan daha yaxın və üstün mənanı
nəzərdə tutur [3].
Real həyatda sözün səs kompleksi insan təfəkküründə onun mənasını – məzmun
siqnifikatını doğurur və insan lazımi əşyanın məna mənbəyini (denotat), yəni özünü tapır. Virtual
aləmdə isə sözün denotatı virtual xarakter daşıyır. Burada insan sözün denotatını deyil, daxil
edilmiş açar sözün bələdçiliyi ilə onun mənasını daha təfsilatlı şəkildə əks etdirən mətn, qrafik,
audio, video və s. məlumatları axtarır.
Sözün mənası barədə əhatəli təriflərdən biri belədir: “Sözün mənası (siqnifikativ məna,
siqnifikat) gerçəkliyin insan şüurundakı inikasının məfhum mərhələsi ilə bir olan ən yüksək
mərhələsidir. Sözün mənası predmetin insanların ictimai praktikasında dərk edilən ümumi və
eyni zamanda, mühüm əlamətlərini əks etdirir. Sözün mənası özünün son həddi kimi məfhuma
doğru can atır” [4].
İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
www.jpis.az 35
Sinonimlərdə məzmun siqnifikatı heç də həmişə eyni deyildir. Sinonimlər eyni məfhumları
ifadə etsə də, əlverişli şəraitdə siqnifikativ cəhətdən, yəni mənaca bir-birindən müəyyən dərəcədə
fərqlənir. Nümunə üçün ürək, qəlb, könül sözlərini nəzərdən keçirək. Bunlar eyni denotatın adı
kimi sözün geniş mənasında “ürək” məfhumunu əks etdirir. Lakin müəyyən semantik mühitdə
onların arasında müəyyən məna fərqləri də meydana çıxır. Məsələn, biz həkimə müraciət etdikdə
“ürəyim ağrıyır” deyə bildiyimiz halda, həmin mənada “qəlbim ağrıyır” deyə bilmərik. Bu cür
sentimental ifadə tərzi, daha çox bədii mətnlər üçün xarakterikdir. “Könlüm ağrıyır” ifadəsi isə
Azərbaycan dilində, ümumiyyətlə, mövcud deyildir.
Virtual məkan da sinonimlərin yeni semantik mühitidir. Burada sinonimlər söz mənasının
iki aspektinə malikdir: 1) dildəki əsas məna; 2) daxil edilmiş sorğudakı spesifik məna. Bu
aspektlər bir-biri ilə əlaqəlidir. Məsələn, əgər iki söz əsas məna etibarilə bir-birinə çox
yaxındırsa, deməli, onlar sorğuda da eyni mənanı daşıyacaqlar. Başqa tərəfdən, əgər iki sözün
spesifik sorğunun müxtəlif variantlarında tez-tez eyni məna daşıdığı ortaya çıxırsa, deməli,
həmin sözlərin əsas məna etibarilə də sinonim olması ehtimalı böyükdür.
Amma dildəki sinonimlər spesifik sorğuda bir-birinə əvəz etməyə də bilər. Məsələn, dəniz
və dərya sözləri əsas məna baxımından dildə bir-birinə nisbətən yaxın sözlərdir. Amma “Dərya”
sorğusunda dəniz və dərya sözləri bir-birinə sinonim sayıla bilməz. Çünki “Dərya” ktematonimi
Azərbaycan istehsalı olan yuyucu toza aiddir. Ona görə də iki sözün spesifik sorğu üçün sinonim
sayılıb-sayılmaması həm əsas mənaya, həm də spesifik kontekstə əsaslanan sintez məsələsidir.
Yeni sinonim növləri
Aparılan araşdırmalar virtual mühitdə yeni sinonim növlərinin ortaya çıxdığını göstərir:
1) Ənənəvi sinonimlər: Yağış-yağmur, ildırım-şimşək, dünya-cahan, qaçmaq-yüyürmək və
s. bu kimi sözlər ənənəvi sinonimlərə misal sayıla bilər. Bu qəbildən olan sinonimlər tezaurus
lüğətlərində də öz əksini tapır. Onların sinonim mənalarını həmin lüğətlərdən tapıb istifadə
etmək mümkündür.
2) Ənənəvi olmayan sinonimlər: Bu qəbildən olan sözlər sinonimlik mənasını, əsasən,
virtual mühitdə qazanır. Məsələn, “giləmeyvə” və “meyvə” sözləri real dildə sinonim mənalı
sözlər deyildir. Ona görə də bu sözlər tezaurus lüğətlərində öz əksini tapmır. Amma məlumat
axtarış sistemlərində axtarış apararkən bəzi məqamlarda bu sözlərdən sinonim açar sözlər kimi
istifadə edə bilərik.
3) Kontekst əsaslı sinonimlər. Belə sinonimləri standart lüğətlərdə və tezauruslarda tapmaq
mümkün deyildir. Sözlərin müxtəlif kontekstlərdə hansı məna verdiyini üzə çıxarmaqdan ötrü
petabaytlarla veb sənədlərini, axtarış məlumatlarının tarixlərini analiz etmək lazım gəlir.
Məsələn, “GM” terminini nümunə kimi nəzərdən keçirək. Bir çox istifadəçilər bu
abbreviaturanın mühüm mənası ilə tanışdırlar və onun açmasının məhz “General Motors”
olduğunu bilirlər. Axtarış zamanı “GM” yazarkən Google sistemi də bu abbreviaturanı “General
Motors” açması ilə verəcəkdir. Bu da sistemin GM abbreviaturasını General Motors kimi
tanımasına dəlalət edir.
Maraqlıdır ki, real dildə antonim məna daşıyan bir çox sözlər də virtual mühitdə kontekst
əsaslı sinonim ifadələrin tərkib hissəsi kimi sinonimlik yarada bilər. Məsələn, semantik
baxımdan bir-biri ilə ziddiyyət təşkil edən giriş və çıxış substantivləri buna misaldır. Virtual
axtarış kontekstində “İnternetə giriş” və “İnternetə çıxış” ifadələri tam sinonimlik təşkil edir.
4) Fərqli nitq hissələrinə aid sinonimlər: Virtual axtarış məqsədilə daxil edilən açar
sözlərdə qrammatik mükəmməllik tələb olunmur. Ona görə də real dildə fərqli nitq hissələrinə
aid olan sözlər də bu mühitdə konteks əsaslı sinonimə çevrilə bilər. Məsələn, ingilis dilindəki
“finder” və “search” sözlərinin birincisi ismə, ikincisi isə felə aiddir. Amma həm “Area code
finder”, həm də “area code search” açar sözlərini daxil edən istifadəçilər axtarışı eyni bir
kontent üzrə aparırlar. Azərbaycan dilində biri ismə, digəri felə aid olan “kitab” və “oxumaq”
sözləri ilə də eyni məlumat kontentinə çıxmaq mümkündür.
İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
36 www.jpis.az
5) Neologizm sinonimlər: Belə sinonimlər, daha çox, informasiya-kommunikasiya
texnologiyalarının inkişafı ilə bağlı yaranmışdır. Məsələn, webmail və email sözləri buna
nümunə sayıla bilər. Bu sözlərin izahı hələ bir çox lüğətlərə daxil edilməmişdir.
Bundan başqa, virtual mühitdə eyni məzmunlu açar sözün müxtəlif formada yazılması
nəticəsində sinonimliyin yaranması hallarına da təsadüf edilir. Söz sırasının pozulması hesabına
sinonimliyin yaranması bu hallardan biridir. Qeyd etriyimiz kimi, açar sözlərdə qrammatik
mükəmməllik o qədər vacib sayılmadığından bəzən daxil edilmiş sorğularda söz sırasının
pozulması hallarına təsadüf edilir. Məsələn: kitab almaq, almaq kitab, məktəbə getmək, getmək
məktəbə və s. Lakin bu, axtarılan müvafiq kontentin əldə edilməsinə mane olmur.
Virtual axtarışlar zamanı sinonimliyə əsas yaradan başqa hallar da vardır:
- sözün həm bütöv, həm də ixtisar-abbreviatura variantından istifadə: Sankt Peterburqda
hava - hava Spb;
- müxtəlif əlifbalara aid transliterasiyadan istifadə - “Toyota camry”-nin xarakteristikası –
“Tоyота kamri”nin xarakteristikası;
- Söz və onun müxtəlif dillərə tərcümə variantlarından istifadə - yükləmək, cкачать,
download və s.
- Müxtəlif kəmiyyət formalarından istifadə - Yeni il görüşlərinin ssenarisi - Yeni il
görüşünün ssenarisi;
- Jarqonizmlərdən istifadə - cizgi filmi, multfilm, multik və s.
- Məna yükünə malik olmayan sözlərdən istifadə - sürətli İnternet, super sürətli İnternet
və s.
- Sinonim sözlərdən istifadə - qəmli şeirlər, kədərli şeirlər və s.
Virtual mühitdə təsadüf edilən sinonim açar sözlər uzunluq baxımından da heç bir
məhdudiyyətə malik deyildir. Məsələn: crossword puzzles - crossword, satış üçün evlər -
daşınmaz əmlak - renta və s. Ona görə də axtarış sistemləri üçün kontekst qavrayışını əsas
götürməklə ifadənin həcminə, onu təşkil edən sözlərin sayına baxmayaraq, sinonimləri üzə
çıxarmağa imkan verən tətbiqlərin işlənib hazırlanmasına ehtiyac yaranır.
Açar sözlərin sinonimliyi problemi
Bütün bu sahələrdə görülən işlərə baxmayaraq, hazırda virtual mühitdə sinonimlər,
məlumat axtarış sistemlərində məlumatların əldə olunması zamanı yaranan bir sıra çətinliklərlə
xarakterizə olunur. Həmin çətinlikləri aşağıdakı kimi ümumiləşdirmək olar:
1. Hazırda virtual məkanda sinonimlərin imkanlarından istifadə etmək üçün təklif edilən
optimal yol dildəki sinonimlərin toplandığı tezaurus lüğətlərinin hazırlanmasıdır. Tezauruslar,
həqiqətən, sinonimlərin axtarılması üçün ən uyğun alət kimi dəyərləndirilə bilər. Bu cür
lüğətlərdə hər bir söz üçün tezauruslar müəyyənləşir. Tezaurus əsaslı sinonimlərlə axtarış zamanı
söz tezaurus lüğətindən götürülmüş sinonimi ilə əvəz edilir. Amma nəzərə almaq lazımdır ki,
tezauruslar axtarış sistemlərinin qavramı əsasında deyil, insan intellekti əsasında formalaşdırılıb.
Axtarış sistemləri süni intellektə əsaslandığından tezaurusdan götürülmüş sözlər bir-birinə uyğun
gəlməyə də bilər. Ona görə də tezaurus lüğəti bir çox hallarda lazımi informasiyanın əldə
olunmasını təmin etsə də, tezaurusa əsaslanan sinonim əvəzetmə üsulu sorğu kontekstini nəzərə
ala bilmədiyindən bu, həddən çox səhvlərə, qarışıqlıqlara da gətirib çıxarır.
Bundan başqa, tezaurus lüğətlərindəki sözlərin böyük əksəriyyəti bir sözdən ibarətdir.
Virtual məkanda isə sinonimlər, daha çox, kontekst mənasında üzə çıxdığından onlar bir söz, söz
birləşməsi, cümlə, cümlənin konkret məna qrupu, cümlə, hətta bütöv mətn ola bilər. Ona görə də
axtarış sistemində hər hansı məlumatı onunla bağlı mümkün bütün sinonim kontekstləri daxil
edərək axtarmaq lazım gəlir. Məsələn, ingilis dilində uşaq mənasını verən “baby” və “infant”
sözləri bir çox lüğətlərdə sinonim kimi təqdim olunur. Amma mahnı adı bildirən Santa Baby
birləşməsində baby sözü infantdan tamam fərqli məna verir.
İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
www.jpis.az 37
Ümumiyyətlə, aparılan təcrübələr göstərir ki, tezauruslardan istifadə etməklə daxil edilən
sinonim sözlərin yalnız 46 faizi sorğuda da sinonim kimi özünü doğrulda bilir [5].
2. Dildə mənaca bir-birindən tamamilə uzaq olan sözlərin virtual dil mühitində sinonim
mənası qazanması da tez-tez rast gəlinən haldır. Məsələn, ingilis dilindəki “free” və
“download” sözlərinə heç bir lüğətdə sinonim sözlər kimi təsadüf etmək olmaz. Amma “free cd
rewriter” ifadəsini eyni məqsədlə “download cd rewriter” kimi də axtarış sisteminə daxil edə
bilərik.
3. İnternetin inkişafı xeyli sayda sinonimin meydana gəlməsinə səbəb olmuşdur ki, bu da
virtual mühitdə sinonimlərlə bağlı müşahidə edilən çətinliklərə öz təsirini göstərir. Məsələn,
“Mp3” və “mpeg3” ifadələri təxminən iyirmi il əvvəl sinonim deyildi. Amma bu gün onlar
sinonim sözlər kimi böyük funksionallığa malikdir. Eyni zamanda, “snp newspaper” və “snp
online” axtarış sistemlərində sinonimlik mənasını snponline.com portalı məşhurlaşdıqdan sonra
qazanmışdır.
Tətbiq metodları
Sinonimlərin üzə çıxarılmasından ötrü hazırda müxtəlif texnologiyalardan istifadə olunur.
Bu sahədə tətbiq edilən ən sadə və məqsədyönlü texnologiyalardan biri axtarış zamanı sinonim
sözlərin bərabərləşdirilməsidir. Kommersiya məqsədini əsas götürən əksər axtarış sistemləri
məhz bu metoddan istifadə edir.
Sözlərin bərabərləşdirilməsi zamanı da dilin real və virtual mühiti arasında müəyyən
fərqlər özünü göstərir. Belə ki, dilin real mühitində biz bir sözün bir sözlə, bir terminin bir
terminlə üzləşdirilməsi modelindən istifadə edə bilərik. Amma virtual məkanda sinonimlərin
bərabərləşdirilməsində vəziyyət bir qədər fərqlidir. Burada çoxlu sayda ifadə-ifadə, termin-ifadə,
ifadə-termin və s. modelləri vardır. Ona görə də bəzi tədqiqatlarda optimal yol kimi sorğu
seqmentləşdirmə modeli təklif edilir. Burada sorğular anlama vahidləri ilə identifikasiya
olunur [3].
Başqa bir metod istifadə edilən sinonimlərin tam ranqlaşdırma sisteminin yaradılmasından
ibarət ola bilər. Amma belə bir sistemin yaradılması çox xərc və kifayət qədər böyük əmək tələb
edir. Çünki söhbət virtual məkanda təsadüf edilən bütün mümkün sinonimlərin müəyyən
edilməsindən, onların siyahısının mexaniki tərtibindən gedir. Ona görə də indiki dövrdə belə
lüğətlərin tərtibindənsə, sinonim mənaların eyniləşdirilməsi, bənzər mənaların aşkara çıxarılması
üçün avtomatik sistemlərin yaradılması daha aktual sayılır.
Dilçilik ədəbiyyatından da məlum olduğu kimi, bir çox sözlər məntiqi ümumiləşmənin
nəticəsidir. Bu halda məfhumların adlandırılması zamanı onlara aid ən ümumi əlamətlər
götürülür və məfhumlar ümumi bir söz altında adlandırılır.
Məsələn, ağac deyərkən ifadə etmək istədiyimiz məfhumun digər mühüm cəhətləri, növü,
əlaməti (söyüd, çinar, palıd və s.) bizim üçün önəmli deyil.
Bundan başqa, bütövlükdə predmeti, yaxud onun konkret bir hissəsini bildirən sözlər
vardır. Məsələn, bədən deyərkən, biz predmeti bütöv halda nəzərdə tuturuq. Qol, qıç, çiyin, baş
və s. isə predmetin ayrı-ayrı hissələrini bildirir. Bütün bunlar isə dilçilik ədəbiyyatında
hiperonim, hiponim, meronim və xolonim kimi terminləri aktuallaşdırır.
Hiperonim məfhumların ümumi anlayışıdır. Məsələn, heyvan sözü it sözünə münasibətdə
hiperonimdir. Hiponim isə ümumiliyin içində konkret məfhumu ayıran sözlərdir. Gətirdiyimiz
nümunədə it sözü heyvan sözünə münasibətdə hiponim kimi çıxış edir. Amma it sözünün özü də
konkret it növünü bildirən buldoq sözünə münasibətdə hiperonimlik keyfiyyəti qazanır.
Meronim isə bütöv predmetin konkret hissəsini bildirən sözlərə aid ümumi termindir. Bir
çox hallarda bu terminin sinonimi kimi partonim terminindən də istifadə olunur.
Xolonimlərə gəlincə, onlar bütöv predmetləri bildirir. Meronim və xolonimlər bir-biri ilə
qarşılıqlı semantik münasibətdədir. Məsələn, təkər, kuzov, mühərrik avtomobil termininə
İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
38 www.jpis.az
münasibətdə meronim sayılır. Öz növbəsində avtomobil termini də qeyd edilən terminlərlə
münasibətdə xolonim hesab edilir.
İnternet axtarış sistemlərində açar sözlərlə axtarışlar zamanı hiperonim, hiponim, meronim,
xolonim səciyyəli sözlər bir-birinə sinonim ola bilər. Ona görə də bütün bunlar nəzərə alınmalı
və axtarışlar zamanı hər bir sözün bütün mümkün assosiasiyalarından istifadə edilməlidir.
Məsələn, əgər biz kompüter haqqında məlumat axtarırıqsa, onun detalları və aksessuarları ilə
bağlı sözlərin də (planşet, disk, kompakt disk, videodisk, monitor, klaviatura, planşet üçün örtük,
notebook üçün çanta, netbooke üçün üzlük) və s. sistemə daxil edilməsi faydalıdır.
Eyni məqamın İnternet səhifələrinin yaradılması və məlumatlarla zənginləşdirilməsi
prosesində nəzərə alınması da son dərəcə vacibdir. Bəzən veb-proqramçılar yalnız bir açar sözün
lazımi məlumatın əldə olunması üçün kifayət etdiyini düşünür və bu düşüncədə yanılırlar. Sayt
yaradıcıları öz ziyarətçilərinin açar söz kimi istifadə edə biləcəkləri bütün mümkün ifadə və
terminləri nəzərə almalıdırlar. Yoxlama zamanı ziyarətçilərin lazımi informasiyanı əldə etmək
üçün seçdikləri açar sözlərin uzun sırası, bu sırada hətta ən ağlagəlməz sözlərin belə istifadə
olunması, ilk baxışdan, adamı təəccübləndirə bilər. Amma bu, axtarış sistemlərində söz
assosiasiyalarının əsas prinsiplərindən biridir: əgər kimsə müəyyən bir informasiyanı konkret
sözlə axtarmağa başlayıbsa, deməli, o növbəti sözü də daxil edəcəkdir.
Birgə daxil edilmiş sorğu qrupları virtual mühitdə sinonimlərlə bağlı irəli sürülən və kifayət
qədər tətbiqlərdə geniş öyrənilən metodlardan biridir. Bu metod daxil edilmiş konkret açar sözün
aid olduğu məlumatla birgə onun sinonimlərinin aid olduğu məlumatların da tapılması metoduna
əsaslanır. Beləliklə, hər bir sorğu, bir sənədlə deyil, sənədlər şəbəkəsi ilə assosiasiya olunur. Bu,
çoxlu sayda linkləməni və nəzərdən keçirməni tələb edən bir assosiasiyadır.
Axtarış sistemləri üçün hazırlanmış tətbiqlər xüsusi sorğu kontekstində sinonimlərin
keyfiyyətini qiymətləndirir. Həmin sinonimlərdən sorğunun genişləndirilməsi və axtarış zamanı
başqa uyğun səhifələrə dönüş üçün istifadə olunur. Bu proses bir-birinə bənzəyən sorğuların
tapılmasından başlanır. Daxil edilən açar sözlərin bağlı olduğu məlumatlar üzərində testləşdirmə
aparılır. Daxil edilən hər bir sorğu üçün psevdo-sorğular çoxluğu müəyyənləşir. Yaradılmış
psevdo-sorğunun istifadəçinin sorğusuna nə qədər səhih cavab verdiyi, məlumatların nə qədər
dolğun şəkildə tapıldığı yoxlanır. Hər açar söz üçün onun yerində işlənə biləcək, eyni zamanda
psevdo sorğu kontekstində istifadəsi mümkün sinonim müəyyənləşir. Yaradılmış sinonimlər
istifadəçiyə təklif oluna, yaxud avtomatik şəkildə onun sorğu blokuna daxil edilə bilər. Bu
sistemin üstünlükləri aşağıdakılardır:
1) sənəddə açar sözlər üçün sinonimlər yaradır;
2) sənəddə söz cütlərinin işlənmə tezliyini müəyyən edir;
3) sənəddə söz cütlərinin bir-birinə bağlılığını müəyyənləşdirir;
4) bu sistem sözlərin sinonim olub-olmadığını müəyyənləşdirməyə kömək edir.
Yaradılan kontentdə müvafiq açar sözlərin sinonimlərinin də nəzərə alınması kontentin
veb mühitində daha asan tapılması və oxunmasını təmin edir. Sinonim eyniləşdirmə metodu ilə
veb sənədlərində sözlərin hansı tezliklə birlikdə işləndiyini müəyyən etmək olur. Bu metod
sənədlərdə birlikdə işlənən sözlərin bir-birinə hansı dərəcədə bağlı olduğunu da müəyyən etməyə
imkan verir. Məsələn, ola bilər ki, hər hansı sənəddə sözlər bir-birinə yaxın mənada işlənsin,
amma onlar bir-birinə sinonim səviyyəsində bağlı olmasın. Əgər avtomobil və avtomaşın sözləri
eyni səhifədə tez-tez ortaya çıxırsa və insanlar eyni axtarış aktında bunları bir-biri ilə çox tez-tez
əvəz edirlərsə, bu, onların sinonim olmasına dəlalət edir.
SEO çalışmalarında sinonimlik probleminə yanaşma
Veb mühitində sinonimlər SEO (Search Engine Optimization – Axtarışın
Optimallaşdırılması) çalışmalarında da mühüm əhəmiyyət kəsb edir. Axtarış sistemlərinin bənzər
açar kəlmələri təsbit edərək onları sinonim kimi dəyərləndirməsi veb-sayt sahibləri üçün böyük
üstünlüklə yanaşı, risk də doğurur. Axtarış sistemlərinin müvafiq tətbiqlərindən xəbərsiz olan
İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
www.jpis.az 39
veb-sayt sahiblərinin uyğunsuz SEO çalışmaları ilk mərhələdən süzgəc məhdudiyyəti ilə
nəticələnə bilər. Ancaq sinonimlər sistemindən faydalanmaqla daha asan və səmərəli SEO
çalışmaları həyata keçirmək mümkündür.
Veb-sayt sahibləri müəyyənləşdirdikləri açar kəlmələri axtarılma həcmlərinə görə təsbit
edərək, çalışmaları, adətən, buna əsasən aparırlar. Məsələn, hər hansı nəqliyyat firması həm
“evdən evə nəqliyyat”, həm də “evdən evə daşımaçılıq” kəlmələrində üst sıralara gəlmək niyyəti
ilə bu kəlmələrin saytdakı istifadə tezliyini artırmağa başlaya bilər. Ancaq sayt sahibi bu hər 2
kəlmənin axtarış sistemləri üçün eyni söz kimi dəyərləndirildiyinin fərqində deyildir. Həmin
kəlmələrin ard-arda təkrarlanmasının isə spamla nəticələnməsi ehtimalı böyükdür.
Bənzər açar sözlərin təsbit olunması üçün xüsusi sistemlərdən istifadə olunur. Google-nin
tətbiq etdiyi “Google Adwords Keyword Tool” sistemi bu baxımdan xüsusilə məşhurdur. Həmin
sistem açar söz kimi daxil edilmiş hər hansı söz və ifadənin Google-nin məlumat bazasında eyni
sözlər olub-olmadığını müəyyənləşdirmək imkanına malikdir.
Bundan başqa, bir sözün müxtəlif formalarda, ayrı-ayrı qrammatik mənalarda istifadəsi də
müəyyən problem yarada bilər. Məsələn Google kitab, kitablar, kitabları və book kəlmələrini
eyni kəlmələr kimi qəbul edir. Bu cür sözlərin sıx istifadəsinin də spama əsas yaratması
mümkündür. Ona görə də SEO çalışmalarında sözlərin sinonimləri ilə son dərəcə diqqətli olmaq,
yeri gəldikdə, dilçi-mütəxəssislərlə məsləhətləşmək lazım gəlir.
Nəticə
Azərbaycan dili mühitində sinonimlərin virtual məkanda istifadəsi ilə bağlı nəzərə çarpan
mümkün problemlərin müəyyənləşdirilərək aradan qaldırılması üçün bu sahədə tədqiqatların
intensivləşməsinə, dilçi-alimlərin və informasiya texnologiyaları mütəxəssislərinin iştirakı ilə
layihələrin həyata keçirilməsinə, o cümlədən elektron lüğətlərin hazırlanmasına, lazımi texniki
sistemlərin formalaşdırılmasına böyük ehtiyac vardır.
Virtual mühit İnternetə çıxış imkanı olan hər bir istifadəçinin fərdi iştirakına əsaslanır.
Müvafiq alqoritmləri hər bir istifadəçinin fərqli leksikasına, qrammatik savadına uyğunlaşdırmaq
mümkün deyildir. Müxtəlif variantlarla istifadə, normalardan kənarlaşma, istisnalar dilin
xarakterik xüsusiyyətidir. Ona görə də virtual məkanda dil vahidlərindən istifadə ilə bağlı
alqoritmlərin hazırlanmasında müəyyən səhvlərə yol verilə bilər. Amma bir ümumi niyyəti
nəzərə almaq bütün hallarda vacibdir: İnternet-axtarış sistemlərində axtarışlar aparan hər bir
istifadəçi mümkün qədər yaxşı nəticələr əldə etmək istəyir. Belə bir imkanın təmin olunması isə
qeyd edilən məsələlərə aidiyyatı olan bütün tədqiqatçıların müştərək missiyasıdır.
Ədəbiyyat:
1.
Axundov A.A. Ümumi dilçilik, Bakı, “Şərq-Qərb”, 2006, 280 s.
2.
Cəfərov S.Ə. Müasir Azərbaycan dili (Leksika). Bakı, “Şərq-Qərb”, 2007, 192 s.
3.
Wei X., Peng F., Tseng H., Lu Y., Wang X., Dumoulin B. Search with Synonyms: Problems
and Solutions,
http://www.aclweb.org
4.
Степанов Ю.С.. Основы общего языкознания. М.: Изд. Просвещение, 1975, 271 c.
5.
Finding Synonyms using Automatic Word Alignment and Measures of Distributional
Similarity
//
In
Proceedings
of
the
COLING/ACL
2006,
pages
866–873.
http://citeseerx.ist.psu.edu
6.
Blondel V., Senellart P. Automatic extraction of synonyms in a dictionary // Proc. SIAM
Workshop on Text Mining. Arlington, Texas, USA, 2002,
http://www.inma.ucl.ac.be
7.
Bollegala, D., Matsuo Y., Ishizuka M. Measuring Semantic Similarity between Words using
Web Search Engines // In Proceedings of the 16th international conference on World Wide
Web (WWW), 2007, http://
www.ymatsuo.com
İnformasiya cəmiyyəti problemləri, 2015, №1, 34-40
40 www.jpis.az
8.
Sanchez, D., Moreno A.. Automatic Discovery of Synonyms and Lexicalizations from the
Web // In Proceedings of the 8th Catalan Conferenceon Artificial Intelligence, 2005,
http://www.bibsonomy.org
9.
Senellart P., Blondel V.D. Automatic Discovery of Similar Words. In Berry, M., editor, A
Comprehensive Survey of Text Mining. Springer-Verlag, New York, 2003, pp. 25-44.
10.
Raghuvar N.J. Ramanand1 Pushpak Bhattacharyya. Automatic Evaluation of Wordnet
Synonyms and Hypernyms / Proceedings of ICON-2008: 6th International Conference on
Natural Language Processing, Macmillan Publishers, India, 2008, http://www.cse.iitb.ac.in
УДК 004.65:006.72
Алигулиев Расим M.
1
, Джафаров Едгар М.
2
1
Институт Информационных Технологий НАНА, Баку, Азербайджан
2
Институт Языкознания им. Насими НАНА, Баку, Азербайджан
1
secretary@iit.ab.az,
2
yedgar@yandex.ru
Вопросы использования синонимов в поисковых системах Интернета
В статье рассказывается о функции синонимических слов, которым принадлежит особое
место в системе языка, поисковых системах Интернета, трудностях, возникающих в связи
с ключевыми словами синонимического характера, и путях их решения. Рассматриваются
существующие исследования в этой области. Дается описание новых особенностей
синонимии, приобретенных языком в виртуальном пространстве. Выдвигаются
определенные предложения по поводу решения данной проблемы.
Ключевые
слова:
лексика,
синоним,
ключевые
слова,
поисковая
система,
сигнификативное значение, денотат, контент.
Rasim M.Aliguliev
1
, Edqar M.Jafarov
2
1
Institute of Information Technology of ANAS, Baku, Azerbaijan
2
Institute of Linguistics named after Nasimi, ANAS, Baku, Azerbaijan
1
secretary@iit.ab.az,
2
yedgar@yandex.ru
Synonyms and their usage issues in Internet search engines
The paper discusses the function of synonymous words, which hold a special place in the
language in the internet search engines systems, emerging challenges related to the key words
with synonymous nature, and their solutions. Existing research in this area is reviewed.
Description of the new features of the synonymous event in a virtual scope of language is given.
Some proposals are put forward to solve the problem.
Keywords: lexica, synonyms, keyword, search engine, significative, denotat, content.
Dostları ilə paylaş: |