Тезаурус статья. Значение слова тезаурус в лингвистическом энциклопедическом словаре


, антонимы , паронимы , гипонимы , гиперонимы и т. п.) между лексическими единицами. Тезаурусы являются одним из действенных инструментов для описания отдельных предметных областей.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.

В психологии тезаурус индивидуума характеризуют восприятие и понимание информации. Теория коммуникации также рассматривает общий тезаурус сложной системы, благодаря которому взаимодействуют её элементы .

История

Одним из первых тезаурусов называют «Словарь синонимов» Филона Библского . Более точное соответствие термину имеет Амара-коша , написанный на санскрите в стихотворной форме в VI веке. Первый современный английский тезаурус был создан Питером Марком Роже (англ.) в 1805 году. Он был опубликован в 1852 году и с тех пор используется без переизданий .

В 1970-е годы тезаурусы стали активно использоваться для информационно-поисковых задач. В таких тезаурусах слова сопоставляются с дескрипторами, через которые устанавливаются семантические связи .

Тезаурусы

См. также

Напишите отзыв о статье "Тезаурус"

Примечания

Отрывок, характеризующий Тезаурус

– Каким ты щеголем нынче! – оглядывая его новый ментик и вальтрап, сказал Несвицкий.
Денисов улыбнулся, достал из ташки платок, распространявший запах духов, и сунул в нос Несвицкому.
– Нельзя, в дело иду! выбг"ился, зубы вычистил и надушился.
Осанистая фигура Несвицкого, сопровождаемая казаком, и решительность Денисова, махавшего саблей и отчаянно кричавшего, подействовали так, что они протискались на ту сторону моста и остановили пехоту. Несвицкий нашел у выезда полковника, которому ему надо было передать приказание, и, исполнив свое поручение, поехал назад.
Расчистив дорогу, Денисов остановился у входа на мост. Небрежно сдерживая рвавшегося к своим и бившего ногой жеребца, он смотрел на двигавшийся ему навстречу эскадрон.
По доскам моста раздались прозрачные звуки копыт, как будто скакало несколько лошадей, и эскадрон, с офицерами впереди по четыре человека в ряд, растянулся по мосту и стал выходить на ту сторону.
Остановленные пехотные солдаты, толпясь в растоптанной у моста грязи, с тем особенным недоброжелательным чувством отчужденности и насмешки, с каким встречаются обыкновенно различные роды войск, смотрели на чистых, щеголеватых гусар, стройно проходивших мимо их.
– Нарядные ребята! Только бы на Подновинское!
– Что от них проку! Только напоказ и водят! – говорил другой.
– Пехота, не пыли! – шутил гусар, под которым лошадь, заиграв, брызнула грязью в пехотинца.
– Прогонял бы тебя с ранцем перехода два, шнурки то бы повытерлись, – обтирая рукавом грязь с лица, говорил пехотинец; – а то не человек, а птица сидит!
– То то бы тебя, Зикин, на коня посадить, ловок бы ты был, – шутил ефрейтор над худым, скрюченным от тяжести ранца солдатиком.
– Дубинку промеж ног возьми, вот тебе и конь буде, – отозвался гусар.

Остальная пехота поспешно проходила по мосту, спираясь воронкой у входа. Наконец повозки все прошли, давка стала меньше, и последний батальон вступил на мост. Одни гусары эскадрона Денисова оставались по ту сторону моста против неприятеля. Неприятель, вдалеке видный с противоположной горы, снизу, от моста, не был еще виден, так как из лощины, по которой текла река, горизонт оканчивался противоположным возвышением не дальше полуверсты. Впереди была пустыня, по которой кое где шевелились кучки наших разъездных казаков. Вдруг на противоположном возвышении дороги показались войска в синих капотах и артиллерия. Это были французы. Разъезд казаков рысью отошел под гору. Все офицеры и люди эскадрона Денисова, хотя и старались говорить о постороннем и смотреть по сторонам, не переставали думать только о том, что было там, на горе, и беспрестанно всё вглядывались в выходившие на горизонт пятна, которые они признавали за неприятельские войска. Погода после полудня опять прояснилась, солнце ярко спускалось над Дунаем и окружающими его темными горами. Было тихо, и с той горы изредка долетали звуки рожков и криков неприятеля. Между эскадроном и неприятелями уже никого не было, кроме мелких разъездов. Пустое пространство, саженей в триста, отделяло их от него. Неприятель перестал стрелять, и тем яснее чувствовалась та строгая, грозная, неприступная и неуловимая черта, которая разделяет два неприятельские войска.
«Один шаг за эту черту, напоминающую черту, отделяющую живых от мертвых, и – неизвестность страдания и смерть. И что там? кто там? там, за этим полем, и деревом, и крышей, освещенной солнцем? Никто не знает, и хочется знать; и страшно перейти эту черту, и хочется перейти ее; и знаешь, что рано или поздно придется перейти ее и узнать, что там, по той стороне черты, как и неизбежно узнать, что там, по ту сторону смерти. А сам силен, здоров, весел и раздражен и окружен такими здоровыми и раздраженно оживленными людьми». Так ежели и не думает, то чувствует всякий человек, находящийся в виду неприятеля, и чувство это придает особенный блеск и радостную резкость впечатлений всему происходящему в эти минуты.
На бугре у неприятеля показался дымок выстрела, и ядро, свистя, пролетело над головами гусарского эскадрона. Офицеры, стоявшие вместе, разъехались по местам. Гусары старательно стали выравнивать лошадей. В эскадроне всё замолкло. Все поглядывали вперед на неприятеля и на эскадронного командира, ожидая команды. Пролетело другое, третье ядро. Очевидно, что стреляли по гусарам; но ядро, равномерно быстро свистя, пролетало над головами гусар и ударялось где то сзади. Гусары не оглядывались, но при каждом звуке пролетающего ядра, будто по команде, весь эскадрон с своими однообразно разнообразными лицами, сдерживая дыханье, пока летело ядро, приподнимался на стременах и снова опускался. Солдаты, не поворачивая головы, косились друг на друга, с любопытством высматривая впечатление товарища. На каждом лице, от Денисова до горниста, показалась около губ и подбородка одна общая черта борьбы, раздраженности и волнения. Вахмистр хмурился, оглядывая солдат, как будто угрожая наказанием. Юнкер Миронов нагибался при каждом пролете ядра. Ростов, стоя на левом фланге на своем тронутом ногами, но видном Грачике, имел счастливый вид ученика, вызванного перед большою публикой к экзамену, в котором он уверен, что отличится. Он ясно и светло оглядывался на всех, как бы прося обратить внимание на то, как он спокойно стоит под ядрами. Но и в его лице та же черта чего то нового и строгого, против его воли, показывалась около рта.
– Кто там кланяется? Юнкег" Миг"онов! Hexoг"oшo, на меня смотг"ите! – закричал Денисов, которому не стоялось на месте и который вертелся на лошади перед эскадроном.
Курносое и черноволосатое лицо Васьки Денисова и вся его маленькая сбитая фигурка с его жилистою (с короткими пальцами, покрытыми волосами) кистью руки, в которой он держал ефес вынутой наголо сабли, было точно такое же, как и всегда, особенно к вечеру, после выпитых двух бутылок. Он был только более обыкновенного красен и, задрав свою мохнатую голову кверху, как птицы, когда они пьют, безжалостно вдавив своими маленькими ногами шпоры в бока доброго Бедуина, он, будто падая назад, поскакал к другому флангу эскадрона и хриплым голосом закричал, чтоб осмотрели пистолеты. Он подъехал к Кирстену. Штаб ротмистр, на широкой и степенной кобыле, шагом ехал навстречу Денисову. Штаб ротмистр, с своими длинными усами, был серьезен, как и всегда, только глаза его блестели больше обыкновенного.
– Да что? – сказал он Денисову, – не дойдет дело до драки. Вот увидишь, назад уйдем.
– Чог"т их знает, что делают – проворчал Денисов. – А! Г"остов! – крикнул он юнкеру, заметив его веселое лицо. – Ну, дождался.
И он улыбнулся одобрительно, видимо радуясь на юнкера.
Ростов почувствовал себя совершенно счастливым. В это время начальник показался на мосту. Денисов поскакал к нему.
– Ваше пг"евосходительство! позвольте атаковать! я их опг"окину.
– Какие тут атаки, – сказал начальник скучливым голосом, морщась, как от докучливой мухи. – И зачем вы тут стоите? Видите, фланкеры отступают. Ведите назад эскадрон.
Эскадрон перешел мост и вышел из под выстрелов, не потеряв ни одного человека. Вслед за ним перешел и второй эскадрон, бывший в цепи, и последние казаки очистили ту сторону.
Два эскадрона павлоградцев, перейдя мост, один за другим, пошли назад на гору. Полковой командир Карл Богданович Шуберт подъехал к эскадрону Денисова и ехал шагом недалеко от Ростова, не обращая на него никакого внимания, несмотря на то, что после бывшего столкновения за Телянина, они виделись теперь в первый раз. Ростов, чувствуя себя во фронте во власти человека, перед которым он теперь считал себя виноватым, не спускал глаз с атлетической спины, белокурого затылка и красной шеи полкового командира. Ростову то казалось, что Богданыч только притворяется невнимательным, и что вся цель его теперь состоит в том, чтоб испытать храбрость юнкера, и он выпрямлялся и весело оглядывался; то ему казалось, что Богданыч нарочно едет близко, чтобы показать Ростову свою храбрость. То ему думалось, что враг его теперь нарочно пошлет эскадрон в отчаянную атаку, чтобы наказать его, Ростова. То думалось, что после атаки он подойдет к нему и великодушно протянет ему, раненому, руку примирения.

Все чаще в многочисленных проектах, книгах, брошюрах, интернет-ресурсах можно встретить понятие "тезаурус". Словно таинственное явление, оно пугает своей неизведанностью, ведь куда проще сказать "словарь", нежели использовать странное определение.

Тезаурус: что это? Чем он отличается от обычного словаря? Попытаемся изучить данные вопросы более подробно и доступно.

Трактовка термина

Первоначально понятие тезауруса рассматривалось с точки зрения словаря, представлявшего лексику языка с примерами употребления в тексте.

Ожегов трактует тезаурус как словарь конкретного языка, отражающий лексику в полной мере, в то время как Ефремова рассматривает данный феномен с точки зрения систематизированного набора данных в определенной области знания.

Наиболее конкретное определение используется в филологии, там под тезаурусом понимается компонент словарного типа, где все значения слов связаны семантическими отношениями между собой и отражают ключевые соотношения понятий в определенной предметной области.

Как мы видим, довольно сложно ответить на вопрос: "Тезаурус: что это?" однозначно. Для более узкого изучения термина рассмотрим историю возникновения, виды и отношения лексических единиц в словаре подобного типа.

История возникновения

Отцом-основателем тезаурусов считается английский физик Роже, именно он в 1852 г. систематизировал распределив ее по группам. При этом каждая группа была представлена названием понятия, а далее шли его синонимы по определенным частям речи, списки родственных наименований, а также отсылки к именам других категорий. Идея такой классификации была очень ценной, поскольку словарь считался самым естественным, описывал лексику языка в самой полной мере. При этом он мог быть применен в качестве быстрого поиска важных понятий. Со времен первого тезауруса и до сих пор происходит регулярная трансформация данного типа словаря, который применяется во многих областях знаний и пользуется широкой популярностью во всем мире. При этом изучение темы: «Тезаурус: что это?» актуально во многих учебных заведениях.

До настоящего времени тезаурусы остаются наиболее популярным способом описания знаний в любой области, необходимой для эффективного восприятия человеком.

Отношения слов в тезаурусе

Самыми распространенными отношениями в классическом тезаурусе считаются:

  1. Синонимия - явление, при котором связываются слова одной части речи, сходные по лексическому значению. Например: держава-отчизна, бригада-отряд, алый - красный и т.д.
  2. Антонимия - связь слов одной части речи, имеющих противоположное лексическое значение. Например: тишина - грохот, ласковый - грубый .
  3. Гиперонимия (гипонимия) - ключевые отношения с целью описания существительных. Гипероним имеет широкое лексическое значение, выражает родовое, общее наименование класса (множества) объектов, предметов, а именно его свойств и признаков. Гипоним обладает узким значением, он называет предмет (признак, свойство) как элемент конкретного множества или класса. Для того чтобы эти отношения стали понятными, приведем простейший пример. Слова зверь и тигр связаны между собой, при этом общее наименование - зверь - является гиперонимом по отношению к гипониму тигр.
  4. Меронимия (партонимия) - отношения для существительных, складываются по принципу «часть - целое». В качестве примера рассмотрим слова самолет, шасси , иллюминатор . В данном случае общее наименование транспорта - холоним (целое, имя), а его составные части - меронимы.
  5. Следствие (отношения между глаголами). Например, слова идти и прийти связаны процессом и его следствием (результатом).
  6. Причина (также допустимо только для глаголов). Рассмотрим пример таких отношений, возьмем слова: болеть - пропустить . В этом случае прослеживается причина - пропустить, потому что были проблемы со здоровьем.

Что тезаурус представляет собой, увидим из следующего примера.

Кровать - приспособление для сна.

[гипероним]: мебель
[мероним]: дом
[синоним]: лежанка, полати.

Это лишь классический пример тезауруса русского языка, однако все словари данного типа строятся именно по такому принципу.

Функции тезауруса

Словарь-тезаурус несет важные социальные, коммуникационные, научные и другие функции.

Он является:

  • источником специальных знаний в широкой либо узкой предметной области, способом упорядочения, описания терминов ;
  • инструментом поиска в информационном потоке;
  • инструментом ручного анализа документации в поисковых системах;
  • инструментом автоматического индексирования сложных текстов.

Виды тезаурусов

Многообразие словарей требует рассматривать не только вопрос: "Тезаурус: что это?", но и обращать внимание на виды. Это поможет нам лучше усвоить особенности данного типа словарей.


Заключение

Мы надеемся, что смогли доступным языком объяснить, что такое тезаурус. Благодаря примерам легко понять, чем он отличается от остальных словарей. Также мы осветили вопрос об информационно-поисковых тезаурусах, которые широко используются информационной системой для быстрого поиска и систематизации миллионов наименований.

Под тезаурусом понимается сложный компонент словарного типа, в котором все значения словаря связаны между собой семантическими отношениями, отражающими основные соотношения понятий в описываемой предметной области знаний. В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

В состав тезауруса входят лексемы , относящиеся к четырем частям речи: прилагательному, существительному, глаголу и наречию. Описания, соответствующие каждой части речи, имеют различную структуру.

Основными отношениями в тезаурусе являются:

  • синонимия – связь между словами одной части речи, различных по звучанию и написанию, но имеющих одинаковое или очень близкое лексическое значение, например: кавалерия – конница, смелый – храбрый;
  • антонимия – связь между словами одной части речи, различных по звучанию, имеющих прямо противоположные значения: правда – ложь, добрый – злой;
  • гипонимия/гиперонимия. Гипероним – слово с более широким значением, выражающее общее, родовое понятие, название класса (множества) предметов (свойств, признаков). Гипоним – слово с более узким значением, называющее предмет (свойство, признак) как элемент класса (множества). Эти отношения транзитивны и несимметричны. Гипоним наследует все свойства гиперонима. Являются центральными отношениями для описания существительных;
  • меронимия/партонимия – отношение «ЧАСТЬ-ЦЕЛОЕ». Внутри этого отношения выделяются отношения «быть элементом» и «быть сделанным из». Отношение определено только для существительных;
  • следствие (это отношение связывает между собой глаголы);
  • причина (также определено для глаголов).

Пример тезауруса:

Изба – деревянный крестьянский дом [гипероним]: жилое здание [мероним]: сельский населенный пункт [синоним]: дом

Все отношения создают сложную иерархическую сеть понятий, и знание о том, где находится понятие в этой сети, является важной частью знания об этом понятии. Свойства отношений различны при описании различных частей речи.

В разных системах тезаурус может выполнять разные функции:

  • источник специальных знаний в узкой или широкой предметной области, способ описания и упорядочения терминологии предметной области;
  • инструмент поиска в информационно-поисковых системах;
  • инструмент ручного индексирования документов в информационно-поисковых системах (так называемый контролирующий словарь);
  • инструмент автоматического индексирования текстов.

Начало тезаурусам как понятийным словарям положил Роже (или Роджет, английский физик), систематизировавший лексику английского языка по группам. Каждая группа представлена именем понятия («категории», которых насчитывалось сначала одна тысяча; это обычные слова, расположенные в алфавитном порядке, например AFFIRMATION ... AGENCY...), далее идут его синонимы по частям речи (существительные, глаголы, прилагательные, наречия), антонимы и затем списки родственных слов (их много, и некоторые представляют собой отсылки к именам других категорий, в словарной статье которых список «дальних родственников» может продолжаться, например, от AGENCY... see BUSINESS). Со времени издания тезауруса Роже в 1852г. и до сих пор продолжаются его переиздания в разных видах и для разных пользователей, тезаурус постоянно пополняется новой лексикой и связями, но за всеми вариантами остается имя создателя первой версии. Ценность этого тезауруса в его естественности, в том, что это описание всей лексики языка, а не только терминологии, а также в том, что его можно привлекать к использованию в системах информационного поиска как средство увеличения семантической силы системы.

Тезаурусы остаются до настоящего времени наиболее принятой формой описания знаний предметной области, пригодной для восприятия человеком. Примерами современных иностранных тезаурусов являются WordNet и EuroWordNet.

Тезаурус английского языка WordNet появился в 1990г. и начал активно привлекаться в различные сферы автоматической обработки текстов. WordNet охватывает около 100 тыс. различных единиц (из них почти половина – словосочетания), организованных в 70 000 понятий.

В настоящее время начинает разрабатываться многоязычный тезаурус EuroWordNet. Первоначально для четырех языков (датского, итальянского, испанского и американского английского) разрабатывается сеть значений слов, связанная семантическими отношениями и позволяющая находить близкие по смыслу слова различных языков. В отличие от тезауруса Роже и сети WordNet, которые создавались для описания лексической и понятийной системы английского языка, EuroWordNet создается в первую очередь для решения практических задач автоматической обработки больших массивов текстов. Важнейшими задачами, которые предполагается решать с помощью этого тезауруса, являются следующие:

  • обеспечение многоязычного информационного поиска;
  • увеличение полноты информационного поиска;
  • формулирование запроса на естественном языке;
  • семантическое индексирование документов и др.

Кроме этих отношений вводятся также тематические отношения, которые связывают понятия одной предметной области. Предполагается также ввести специальные пометки на отношения между понятиями, обозначающие дизъюнкцию или конъюнкцию отношений. Если некоторое понятие в сети имеет несколько одноименных отношений, то они могут быть дизъюнктивными, т. е. реально реализуется одно из этих отношений, или конъюнктивными, т. е. для понятия действительны все эти отношения.

В отечественных институтах создано более сотни отраслевых тезаурусов, удовлетворяющих определенному государственному стандарту на словари подобного типа. Они так и именуются – ИПТ – информационно-поисковые тезаурусы. Из всех возможных смысловых отношений между понятиями в них зафиксированы три: синонимические, родовидовые (к которым относят обычно и отношение «ЧАСТЬ-ЦЕЛОЕ») и «все прочие», называемые также ассоциативными.

Стандартные ИПТ предназначены в основном для ручного индексирования документов, а также для формулировки и варьирования запросов при поиске. Есть нестандартные тезаурусы, которые ставят задачу скорее выборочной систематизации терминологии в конкретной области знаний – это особенно актуально для новых предметных областей. Растет тенденция к обогащению тезаурусов определениями терминов, что важно для различения неоднозначности терминов, особенно в случае смежных дисциплин и при выходе из границ узких предметных областей.

ТЕЗАУРУСЫ. ЛИНГВИСТИЧЕСКИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ ТЕЗАУРУСА

3.1. Понятие тезауруса

Тезаурус (от греч. θήσαϋροξ - сокровище, запас) или идеогра­фический словарь (от греч. idea - понятие, представление, идея и grapho - пишу, описываю) - в современной лингвистике: 1) особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения между лексическими единица­ми; 2) словарь для поиска какого-либо слова по его смысловой связи с другими словами; 3) определенный способ организации (располо­жения) слов в словаре; 4) способ организации лексического состава, который позволяет экономно «моделировать мир».

В первом, исконном, значении - хранилище, сокровище термин тезаурус использовал Л.В. Щерба в статье «Опыт общей лексико­графии» (противоположение третье: thesaurus - обычный (толковый или переводной) словарь). Ученый пишет: «Когда гово­рят thesaurus, то нынче у нас чаще всего имеют при этом в виду «Thesaurus linguae latinae», предприятие пяти немецких академий, начатое еще в 1900 г. и до сих пор доведенное с пропусками лишь до буквы М. Характерная особенность этого типа словарей состоит в том, что в них приводятся все решительно слова, встретившиеся в данном языке хотя бы один раз, и что под каждым словом приво­дятся решительно все цитаты из имеющихся на данном языке тек­стов. В основе вышеуказанного противоположения - thesaurus -обычный (толковый или переводной) словарь - лежит противопо­ложение «языкового материала» и «языковой системы» - понятия, которые я пытался обосновать в своей статье «О трояком аспек­те языковых явлений и об эксперименте в языкознании» .

Второе значение этого термина связано с имеющим широкую известность словарем-тезаурусом «Тезаурус английских слов и вы­ражений» П.М. Роже (Roget"s Thesaurus of English Words and Phrases, 1852) и его продолжением, словарем О.В. Баранова.

В этой трактовке термин тезаурус обозначает определенный способ организации, расположения лексического состава в словаре (см. третье значение термина).

Четвертое значение термина тезаурус связано с всеобщим при­знанием такого способа организации лексического состава, который позволяет экономно «моделировать мир». С этой точки зрения тезау­рус-словарь представляет собой «систематическое упорядочение лексики какой-либо научной или технической области, а в наиболее общем виде - общелитературной лексики, и более того, всей лексики данного языка».

Согласно Ю.Н. Караулову, общеязыковой тезаурус, фиксируя в структуре и взаимоотношениях своих рубрик, разделов, зон, облас­тей широкие возможности невербального соединения идей, обеспе­чивает учет человеческих ценностей .

А.Н. Баранов и Д.О. Добровольский в предисловии «От редак­торов» к своему «Словарю-тезаурусу современной русской идиома­тики» дают тезаурусу следующее определение - особый вид словаря, отличающийся от других (в частности, толкового, двуязычного и др.) способом организации языкового материала. В тезаурусе языко­вые единицы представлены не в алфавитном порядке, как в обычном словаре, а сгруппированы на основании их значения .

Л.П. Крысин называет тезаурус (идеографический словарь) толковым словарем особого рода, словарем «наоборот». «Если в тол­ковом словаре, пишет ученый, «входом» в словарную статью являет­ся слово, а содержанием словарной статьи - толкование смысла это­го слова, то в идеографическом словаре «входом» служит смысл, идея (отсюда и название этого вида словарей - идеографические), а содержанием словарной статьи - перечень слов, выражающий дан­ный смысл. И если толковый словарь - незаменимый инструмент при понимании текста, то идеографический может быть использо­ван при порождении текста: очень часто человек хочет выразить определенную мысль, но не может найти подходящих для этого слов; идеографический словарь облегчает эти поиски. Различают два основных вида тезаурусов:

лингвистический тезаурус - словарь, содержащий перечень слов естественного языка, отобранных в результате содержательного анализа текстов и систематизированных в соответствии с принятой классификационной системой;

статистический тезаурус - информационно-поисковый словарь, содержащий перечень слов, отобранных в результате стати­стического анализа текстов по какой-либо определенной тематике и сгруппированных в словарные статьи на основе частоты совместной встречаемости этих слов в одних и тех же текстах.

Информационно-поисковые тезаурусы (ИПТ) облегчают поиск информации при ее автоматической обработке. ИПТ максимально раскрывают семантические отношения между лексическими едини­цами. Как сказано в ГОСТе по ИПТ, «тезаурус информационно-поисковый одноязычный - контролируемый и изменяющийся сло­варь лексических единиц, основанный на лексике одного естествен­ного языка, отображающий семантические отношения между лекси­ческими единицами и предназначенный для обработки и поиска ин­формации».

Основной единицей ИПТ являются термины-дескрипторы. Алфавитная, лексико-семантическая часть ИПТ представляет собой свод дескрипторных статей.

Дескриптивные словари предназначены для полного описания лекси­ки определенной сферы и фиксации всех имеющихся там употреблений; в них фиксируются все имеющиеся релевантные случаи. Типичным примером дескриптивного словаря является «Толковый словарь живого великорусско­го языка» В.И. Даля (первое издание в четырех томах выходило в 1863- 1866 гг.). Цель его создателя заключалась не в нормировании языка, а в пол­ном описании всего многообразия великорусской речи - в том числе ее диа­лектных форм просторечия.

Каждая дескрипторная словарная статья начинается дескрип­тором, при котором ниже в пределах статьи по ГОСТу приводятся синонимы этого дескриптора, а также другие лексические едини­цы, связанные с основным дескриптором родо-видовыми или ассо­циативными отношениями.

Таким образом, тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания от­дельных предметных областей.

В чистом виде тезаурус встречается редко. В реальных тезау­русах происходит упрощение исходной идеи или добавление по­сторонней, но потенциально необходимой пользователю информа­ции. Наиболее известными сегодня являются «Русский семантиче­ский словарь» Ю.Н. Караулова, «Словарь идентичного названия» Н.Ю. Шведовой, «Тематический словарь русского языка» Л.Г. Смеховой и др.

Резюме. Термин тезаурус Л.В. Щерба употребил примени­тельно к словарю, который фиксировал по возможности все кон­тексты, в которых встречается данное слово. Харак­терная особенность тезаурусов состоит в том, что в них приводятся все слова, встретившиеся в данном языке хотя бы один раз, и под каждым словом приводятся все цитаты из имеющихся на данном языке текстов. Содержание словаря-тезауруса составляет языковой материал, а обычного словаря - языковой материал и языковая система (термины Л.В. Щербы).



Данная характеристика дополняется перекрестными связями самого разного рода - чаще парадигматическими (синонимически­ми или антонимическими), которые указывают на общность или противопоставление значений. Кроме того, различного рода ассо­ц. связями (т.е. синтагм. связями).

Таким образом, задача тезауруса (идеографического словаря) - дать представление о смысловой организации некоторого среза языкового материала, показав основные семантические поля, их внутреннюю структуру и внешние связи. Тезаурус является на­глядной демонстрацией системного характера языка, позволяя увидеть множество типов отношений, связывающих отдельные языковые единицы и группы единиц .

3.2. История представления концептуального знания о мире в виде тезауруса

Необходимость в расположении слов по сходству, смежности, аналогии их значений ощущалась на всем протяжении обозримой истории человеческой мысли.

Проследить путь зарождения идеи представления концепту­ального знания о мире в виде тезауруса нам поможет обращение к истории составления тезаурусов (идеографических словарей).

Так, на заре цивилизации, когда люди могли выразить свои мысли на письме лишь при помощи идеограмм и символов, един­ственно возможным словарем был, вероятно, такой, в котором сло­ва располагались по тематическим группам. Лексикографу в то время просто трудно было найти иной критерий для классифика­ции слов, кроме отношений, существующих в самой действитель­ности.

К сожалению, у нас нет свидетельств того, действительно ли народы, пользовавшиеся идеографическим письмом, располагали подобными словарями. Среди наиболее древних из известных нам попыток идеографической классификации называют Attikai Lexeis греческого грамматика, директора Александрийской библиотеки Аристофана Византийского (умер в 180 году до н. э.).

Во II в. н. э. появляется капитальный труд «Ономастикон», составленный на материале греческого языка лексикографом и со­фистом Юлием Поллуксом (настоящее имя Полидевк), уроженцем египетского города Навкратис. Ю. Поллукс написал несколько со­чинений, но до нас дошел лишь «Ономастикон» (Поллукс Ю. Ономастикон. М., 1956).


Ономастикон состоит из 10 книг. Книги по существу являют­ся отдельными трактатами и содержат в себе наиболее важные слова, относящиеся к той или иной теме. Так, в первой книге гово­рится о богах и царях; во второй - о людях, их жизни и физиологи­ческом строении; в третьей - о родстве и гражданских отношениях и т. д. Слова, помещенные в словаре, сопровождаются краткими толкованиями. В новое время словарь был впервые опубликован в 1502 г. в Венеции.

Между II и III вв. н. э. в свет выходит замечательный санск­ритский словарь «Амаракоша» (Амаракоша. Париж, 1839). Его ав­тором является древнеиндийский поэт, грамматик и лексикограф Амара Сина, которого называли «одной из девяти жемчужин, ук­рашающих трон Викрамадитье» . Амаракоша в переводе на русский язык означает сокровищница Амара. Словарь содержит 10 тыс. слов. Для лучшего запоминания толкования значений слов словарные статьи построены в форме стихов. Весь материал слова­ря разбит на 3 книги. Каждая книга включает в себя несколько глав, а глава в свою очередь при необходимости разбивается на ряд секций. Первая книга посвящена небу, богам и всему тому, что имеет к ним непосредственное отношение. Во второй книге приво­дятся слова, относящиеся к земле, поселениям, растениям, живот­ным и человеку (сначала человек рассматривается как живое суще­ство, а затем как существо общественное; перед нашими глазами предстает вся кастовая структура современного автору общества; жрецы как поверенные бога находятся на самом верху, а ниже идут военные и цари, еще ниже - землевладельцы, а в самом низу ре­месленники, жонглеры, слуги и т.п.). Третья книга является собст­венно языковой, что явствует из названий шести ее глав.

Словарь стал известен европейским ученым лишь в конце XVIII в., когда в 1798 г. в Риме была опубликована его первая часть. Полностью он был издан с переводом на английский язык в 1808 г. английским санскритологом Г.Т. Коулбруком (Н.Т. Colebrooke). В 1839 г. появился и его французский перевод, выполненный А.Л. Делоншаном (A.L. Deslongchamps). Дальнейшее развитие идеи смысловой классификации лекси­ки связано с проблемой так называемого всемирного языка.

Резюме. Таков в самых общих чертах первый этап развития традиции идеографической классификации лексики. Этот этап можно назвать предысторией идеографических словарей. Теперь целесообразно обратиться к современной классификации словарей-тезаурусов.

Нетрудно заметить, насколько непохожи описанные труды на алфавитные словари. Если в алфавитных словарях подача слов ре­гулируется таким условным и в высокой степени нейтральным ин­струментом, как алфавит, то при построении идеографического словаря решающее значение приобретает мировоззрение самого лексикографа .

3.3. Принципы классификации словарей-тезаурусов

Как уже было показано выше, проблема составления класси­фикации тезаурусов не нова и в течение нескольких десятков лет привлекала внимание ряда отечественных и зарубежных лингвис­тов (К. Марелло, В.В. Морковкин, Л.П. Ступин, В.В. Дубичинский и др.). Результатом исследований в этой области стало создание альтернативных классификаций указанных лексикографических произведений. В основу одной из последних классификаций поло­жены следующие критерии: а) тип смысловых связей между еди­ницами словника; 2) объем словника; 3) генерализованность слов­ника; 4) разработка значения лексем; 5) грамматико-стилистическая квалификация лексем; 6) демонстрация функцио­нирования лексем; 7) количество представленных языков; 8) тип семиотических средств, используемых для семантизации лексем. Названная классификация основывается на созданных ранее клас­сификациях О.М. Карповой и И. Бурханова (Burchanov I. On the Ideographic Description of Stylistically and Pragmatically Relevant As­pects of Lexical Meanings. London, 1996); терминология, используе­мая в классификации, введена в лексикографический аппарат


В.В. Морковкиным , Ю.Н. Карауловым , К. Марелло . Критерии классификации сформулированы О.М. Карповой . В то же время К. Марелло выделяет три типа тезаурусов:

кумулятивные, представляющие собой группировки слов без определения их значений;

дефинитивные, толкующие каждую лексическую единицу группировки слов;

дву- и многоязычные тезаурусы для путешественников (Marello C. TheThesaurus//W.D.D. 1990. V. 2. P. 1083).

Кумулятивные тезаурусы не только представляют возмож­ность найти более понятное, точное, стилистически верное слово в ситуации нахождения в определенном семантическом поле, но и становятся основой для формирования тематических компьютер­ных банков данных.

Дефинитивные тезаурусы могут включать, наряду с опреде­лением значения, этимологическую информацию и цитаты из ли­тературных произведений, что показывает непосредственную эн­циклопедическую направленность этого вида тезаурусов. Кроме того, словари данного вида вводят пользователя в необходимую систему концептов, разъясняют сущность, сходства и различия по­нятий, их парадигматические и синтагматические связи, иногда дают информацию о произносительных, грамматических, словооб­разовательных и других возможностях лексических единиц, обо­значающих эти понятия.

Дву- и многоязычные тезаурусы для путешественников соз­даются обычно по тематическим разделам: числа, еда, транспорт, гостиница и т.д. с приведением переводных эквивалентов двух и более языков.

Для максимально полного отображения типов существующих словарей-тезаурусов создается многоуровневая классификация. Во-первых, по типу смысловых связей между единицами словника тезаурусы подразделяются на три крупных класса:

1. Ассоциативный тезаурус (терминология Ю.Н. Караулова

2. Аналогический тезаурус (терминология В.В. Морковкина

3. Идеографический (идеологический) тезаурус (терминоло­гия Л.В. Щербы, В.В. Морковкина. Названные три типа те­заурусов отражают следующие виды смысловых связей лексем со­ответственно:

1. Семантико-синтаксические связи, на основании которых
слова объединяются в группы или пары, предопределенные в своем возникновении и существовании двойными связями: смысловыми и синтаксическими. Смысловые связи слов устанавливаются, главным образом, между глаголами и прилагательными, выполняющими предикативную функцию в предложении, и существительными, например:

а) между действием и органом (инструментом), при помощи которого оно совершается: хватать - рука, видеть - глаз, плыть - лодка и т.д.;

б) между глаголами действия, требующими одного субъекта, и субъектом: лаять - собака, ржать - лошадь и т.д.; в) между глаголами и определенным грамматическим дополнением, которого первые требуют: рубить - дерево, есть - еда и т.д.

Отсюда ассоциативный тезаурус - это словарь-тезаурус, ор­ганизующий лексические единицы на основании существующих между ними смысловых и синтаксических связей и располагающий группы в соответствии с графической формой слов-центров.

2. Лексико-семантические связи. Объединение в группы с таким типом связи происходит по основному для слов признаку - лексическому значению. При этом также учитываются лексико- грамматические связи, в форме которых реализуются отдельные значения слов.

Таким образом, аналогический тезаурус - это лексикографи­ческий справочник, основной единицей макроструктуры которого является лексико-семантическая группа; группы систематизирова­ны в порядке алфавитного следования смысловых доминант.

3. Предметные или тематические связи, где объединение слов в одну группу происходит в силу сходства или общности функций обозначаемых словами предметов и процессов: предметы
домашнего обихода, части тела, виды одежды, постройки и т.д.

Таким образом, идеографический тезаурус - это лексикогра­фическое произведение, представляющее лексические единицы в составе предметных (тематических) групп и организующее их в иерархическую структуру, предназначенную для репрезентации концептуализированного знания о мире.

В рамках того же критерия проводим дальнейшее подразде­ление типов. Так, идеографический тезаурус представлен 4-мя сле­дующими типами:


Собственно идеографический тезаурус.

Тематический словарь.

Систематический словарь.

Тематико-систематический словарь


Собственно идеографический тезаурус - это особый тип идеографического словаря, макроструктура которого организуется в соответствии с синоптической картой a priori, наложенной на лексический состав языка. В отличие от других типов идеографи­ческого словаря, собственно идеографический тезаурус характери­зуется логичной и строго упорядоченной классификационной структурой, созданной на основе научной таксономии, даже если лексикографическому описанию подвергается общая лексика (New Webster" Thesaurus. Landoll, 1991).

Тематический словарь - это особый тип идеографического те­зауруса, основной единицей макроструктуры которого является тематическая группа, включающая лексемы, объединенные на ос­нове классификации их денотатов (референтов) и рассматриваемые с точки зрения соответствия определенной теме.

Систематический словарь - это особый тип идеографическо­го тезауруса, классификационная структура которого предназначе­на для представления действительных семантических отношений, существующих между лексическими единицами языка. По своей сути классификационная структура представляет лексико-грамматическую классификацию вокабуляра, иными словами, его парадигматическую структуру, описанную с точки зрения подчи­нения и сочинения .

Тематико-систематический словарь - это особый тип идео­графического словаря, представляющий собой сочетание темати­ческого и систематического словаря .

Резюме. Рассмотренная классификация лингвистических те­заурусов включает в себя следующие виды словарей: аналогиче­ский тезаурус (терминология В.В. Морковкина); идеографиче­ский (идеологический) тезаурус (терминология Л.В. Щербы и В.В. Морковкина); ассоц. тезаурус (терминология Ю.Н. Караулова). Далее будут представлены поп. тезаурусы и раскры­ты их особенности.

3.4. Популярные тезаурусы и их особенности

Наиболее известный из имеющихся словарей-тезаурусов, ко­торому обязан своим существованием и сам этот термин, создан на материале английского языка; это постоянно переиздаваемый те­заурус П.М. Роже Roget"s Thesaurus of English Words and Phrases (1852).

Важно отметить, что автор «Тезауруса английских слов и вы­ражений» в полной мере использовал имеющийся к этому времени опыт. «Принцип, которым я руководствовался, классифицируя слова, - пишет П.М. Роже, - является тем же самым, который ис­пользуется при классификации особей в различных областях есте­ственной истории. Поэтому разделы, выделенные мной, соответст­вуют естественным семьям ботаники и зоологии, а ряды слов сце­ментированы теми же отношениями, которые объединяют естест­венные ряды растений и животных»

П.М. Роже считал, что убедительная классификация слов по их смыслам невозможна до тех пор, пока должным образом не изу­чены и не организованы объекты действительности, называемые этими словами. Поэтому он начинает свою работу с расчленения понятийного поля английского языка на четыре больших класса: абстрактные отношения, пространство, материю и дух (разум, во­ля, чувства). Эти классы разбиваются в дальнейшем на ряд родов, которые в свою очередь распадаются на определенное число видов.

К числу недостатков идеографического словаря П.М. Роже ученые относят следующие: 1) не совсем убедительная номенкла­тура основных понятийных классов; 2) абстрактная логичность превалирует над естественными связями слов; 3) относительное неудобство пользования (в значительной мере данный недостаток исправлен в последующих изданиях).

В современной русской лексикографии имеется несколько словарей, которые должны быть отнесены к разряду словарей-тезаурусов (идеографических словарей). Это, например, созданный под руководством Ю.Н. Караулова «Русский семантический сло­варь» , «Русский семантический словарь» под редакцией Н.Ю. Шведовой , «Тематический словарь русского языка» Л.Г. Саяховой, Д.М. Хасановой и В.В. Морковкина , «Словарь лексико-семантических групп русских глаголов» под ред. Э.В. Кузнецовой , «Идеографический словарь русского языка» О.С. Баранова , «Концептосфера внутреннего мира человека в русском языке» В.И. Убийко , комплексный учебный словарь «Лексическая основа русского языка» под руководством В.В. Мор­ковкина .

Познакомимся с некоторыми из них.

Словарь-тезаурус современной русской идиоматики» под ре­дакцией А.Н. Баранова и Д.О. Добровольского включает четыре ос­новные части: 1) синопсис; 2) легенду; 3) основной корпус Слова­ря-тезауруса; 4) указатели. Цель Синопсиса - дать общее представ­ление о структуре Основного корпуса Тезауруса. В нем указаны все таксоны с подтаксонами и соответствующими парадигматиче­скими отсылками. Основной корпус Словаря-тезауруса представ­ляет собой совокупность словарных статей, объединенных в груп­пы (таксоны) и подгруппы (подтаксоны) в соответствии со значе­нием описываемых в них идиом. Каждая статья содержит идиому и примеры ее употребления в современном русском языке. Синоп­сис, Легенда, Указатели - служебные части вышеназванного Сло­варя-тезауруса, обеспечивающие пользователю возможность быст­ро и эффективно работать. Легенда используется в тех случаях, ко­гда не нужны примеры употребления идиом, т.к. она воспроизво­дит всю информацию, кроме примеров. Фактически, это словник Словаря. Единицами словника являются леммы. Лемма в данном случае представляет собой идиому в исходной (словарной) форме и включает по возможности все ее существенные варианты. Напри­мер, идиома стоять на месте входит в состав леммы топтаться на месте, стоять на месте, буксовать на месте.

Словарь содержит два указателя. В конце книги помещена статья «Теоретическая концепция Словаря-тезауруса современной русской идеоматики», в которой подробно анализируются научные особенности данного проекта.

«Русский семантический словарь», созданный под руково­дством Ю.Н. Караулова включает 10 тыс. русских слов, которые разнесены по 1600 понятийным группам. В основе выделения групп - повторяющиеся элементы толкований слов в толковых словарях: например, «действие», «свойство», «инструмент» и т.п.

«Русский семантический словарь», созданный под руково­дством академика Н.Ю. Шведовой, основывается на несколько иных принципах, характерных для составления как идеографиче­ских, так и толковых словарей. Во-первых, все слова языка разде­лены здесь на четыре класса: 1) единицы указующие (местоиме­ния), 2) именующие (знаменательные слова), 3) собственно свя­зующие (союзы, предлоги, глаголы-связки), 4) классифицирующие (модальные слова, частицы, междометия). Во-вторых, внутри каж­дого класса все слова распределены по частям речи. В-третьих, внутри каждой части речи выделены множества и подмножества на основании тематической близости или, наоборот, противопостав­ленности значений слов.

DUDEN - это книга с картинками (чертежами) на левой сто­роне (по разным ПО) с пронумерованными деталями (до мельчай­ших). На правой стороне этот нумерованный список сопровождает­ся названиями (даже на двух языках). Например, на целой странице нарисованы железнодорожная техника, станции, пути. Справа - на­звания стрелок, семафоров, костылей и т.п.

«Тематический словарь русского языка» Л.Г. Саяховой, Д.М. Хасановой и В.В. Морковкина содержит 25 тыс. лексических единиц, сгруппированных по трем крупным классам: «Человек», «Общество», «Природа», которые ступенчато ветвятся на более мелкие подклассы. Например, в классе «Человек» выделяются под­классы «Тело и организм человека», «Жизнь человека», «Внешний вид, наружность человека», «Эмоциональный вид человека» и др. Каждый из подклассов в свою очередь разбивается на еще более частные: «Эмоциональный мир человека» - «Психические свой­ства человека» - «Темперамент», «Характер» - «Общие черты характера» и т.д. Значение и употребление слов, относящихся к каждому классу, иллюстрируются наиболее употребительными словосочетаниями. Например, слово «смех», находящееся в под­группе «выражение чувств, эмоций» класса «Человек», сопровож­дается указанием таких сочетаний с этим словом, как веселый смех, радостный смех, смех ребенка, заливаться смехом и др.

Резюме. Одним из действенных инструментов описания от­дельных предметных областей, особенно в электронном формате, являются тезаурусы.

Термин тезаурус уже давно широко используется в лингвис­тике для обозначения специального типа словарей, в той или иной степени отражающих «картину мира», «языковую модель мира» (по Ю.Н. Караулову). Тезаурус как «сокровищница» вырос в своем смысловом объеме, получил новое значение. Им стали называть словарь, не просто вбирающий в себя все лексические богатства языка, а упорядочивающий их определенным логико-системным образом. В словаре-тезаурусе слова сводятся в группы, а объеди­нение это происходит на основе способности того или иного слова передавать определенное понятие.

Тезаурус-словарь всегда рассматривался в лингвистике как некоторая универсальная система, обеспечивающая хранение кол­лективного (для того или иного социума) знания о мире в вербаль­ной форме. В отличие от других словарей в тезаурусе-словаре это знание хранится в структурированной форме, отражающей наши представления о «структуре мира».

Наиболее известными и популярными тезаурусами в настоя­щее время являются английский Тезаурус Роже, Идеографический словарь русского языка О.В. Баранова, Русский семантический словарь Ю.Н. Караулова, Русский семантический словарь академи­ка Н.Ю. Шведовой, DUDEN, Тематический словарь русского языка Л.Г. Саяховой, Д.М. Хасановой и В.В. Морковкина.

Теза́урус (от греч.thesauros- сокровище) в современной лингвистике - особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т.п.) между лексическими единицами. Таким образом, тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей.

В отличие от толкового словаря, тезаурус позволяет выявлять смысл не с только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться в системах искусственного интеллекта.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами ее употребления в текстах.

Пароними́я - частичное звуковое сходство слов при их семантическом различии (полном или частичном). Паронимы часто являются источником речевых ошибок.

Примеры однокоренных паронимов: одеть - надеть, человеческий - человечный, оплатить - уплатить - заплатить.

Примеры совершенно неродственных паронимов: биология - бриология, бульон - брульон, компот - комплот, фактура - фрактура.

Однако тезаурус - это больше, чем инструмент информационного поиска. Тезаурус можно рассматривать как универсальную модель терминологической системы, а потому - как формальную систему знаний, содержащихся в языке конкретной научной области.

Тезаурус общего назначения

Тезаурус в наиболее общем определении - это словарь с семантическими связями между словарными единицами. С конца 50-х годов тезаурусы использовались в системах машинного перевода и информационно - поисковых системах (ИПС).

В отличие от семантических словарей, которые предназначены для подробного описания общей лексики, тезаурусы созданы для хранения и классификации предельно конкретных слов и словосочетаний. Например, слово вещество находится в словаре РОСС (Русский общесемантический словарь), а все названия химических соединений уже в тезаурусе.

Какие связи описываются в тезаурусе? Как правило:

    род-вид (AKO)

    часть-целое (POF)

    синонимия/антонимия

    ассоциативные.

Пример связи «род-вид»

Пример семантического разбора

Это парадигматические (устойчивые связи, существующие между словами в языке). И то не все.

Синтагматические (текстовые) связи в тезаурусе не представлены.

Пример: WORDNET - интеллектуальный компьютерный тезаурус

http://wordnet.princeton.edu/perl/webwn

Создан в Принстонском университете и свободно распространяется.

Основные особенности.

Слова в нем сгруппированы в синонимические группы (синсеты - synsets ). Они разбиты на 4 словаря - существительные, прилагательные, глаголы и наречия.

Синсеты объединены как в иерархические связи (гипонимы и гиперонимы), так и в отношение антонимии и также меронимии (быть частью чего-л или состоять из частей).

Решена также проблема морфологии - слово после обращения к WN возвращается в исходной форме.

Информационно-поисковый тезаурус

В области информационного поиска выигрыш от использования тезаурусов происходит за счет перехода от текста к дескрипторам, описывающим объект реального мира. Переход к дескрипторам позволяет осуществлять расширенное (избыточное) индексирование.

В информационно поисковом тезаурусе эксплицитно выражаются ПАРАДИГМАТИЧЕСКИЕ отношения между дескрипторами (не все, а те, которые чаще всего важны для повышения полноты информационного поиска). Экспериментально определено, что наиболее важными парадигматическими отношениями являются

    соподчинение

    сходство

    вид-род (род-вид)

    причина-следствие

    часть-целое.

Пример словарной статьи:

Сельскохозяйственные машины

Син. сельскохозяйственная техника, сельхозтехника,

Вид: картофелеуборочный комбайн, сеялка, etc.

Пример избыточного индексирования

Запрос "сельскохозяйственные машины"

Пример: Общественно-политический тезаурус русского языка Университетская информационная система РОССИЯ

http://www.cir.ru/index.jsp

Разработан Автономной некоммерческой организацией «Центр информационных исследований» (АНО ЦИИ)

Тезаурус - это терминологический ресурс, реализованный в виде словаря понятий и терминов со связями между ними. Основное назначение тезауруса - помощь при информационном поиске: на основе связей тезауруса происходит расширение запроса, навигация по связям тезауруса помогает четче сформулировать сам запрос.

Особенностью иерархии Тезауруса УИС «Россия» является множественность классификации, то есть для большинства понятий ищется не единственное классифицирующее понятие (связь ВЫШЕ - НИЖЕ), а описываются различные точки зрения на конкретное понятие, например, понятие МАГАЗИН может рассматриваться и как ЗДАНИЕ, и как ТОРГОВАЯ ОРГАНИЗАЦИЯ.

Тезаурус по общественно-политической тематике, включает более 26.000 понятий, 62.000 терминов, 100.000 прямых и 700.000 наследуемых отношений между понятиями. Существующая версия Тезауруса описывает терминологию, используемую в общественно-политической области, включая экономическую, политическую, военную, законодательную, социальную, международные отношения и другие сферы.

Полное название Тезауруса - Информационно-поисковый тезаурус по общественно-политической тематике для автоматического индексирования. Здесь все определения важны:

    ”информационно-поисковый” – так как разработан специально для использования в информационном поиске для помощи пользователю при формировании (уточнении) запроса и для автоматического расширения условий запроса при поиске;

    ”по общественно-политической тематике” – так как покрывает 95-99% лексики и терминологии русскоязычного текста общественно-политической тематики;

    ”для автоматического индексирования” – так как является основой для процесса автоматического определения тематики документов - группирования близких по иерархии тезауруса терминов в тематические узлы, автоматического рубрицирования и автоматического аннотирования.

Тезаурусы - заключение

Для многих известных тезаурусов (WordNet, Roget, EuroWordNet) большой проблемой остается автоматический вывод по связям тезауруса - когда расширение на ближайшую окрестность верно, но не полно, а попытки расширить окрестность ведут к ошибкам.