НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА Даркулова К.Н., Ергешова Г. Южно-Казахстанский государственный университет им. Мухтара Ауэзова Шымкент, Казахстан В последние десятилетия в лингвистике заметно активизировался интерес к проблемам грамматики и семантики текста, к исследованию закономерностей речевого построения и языковой организации текстов различных типов. Это обусловлено, в первую очередь, сложностью и многоаспектностью определения самого понятия «текст», нерешенностью вопроса о составе текстовых признаков и категорий. Одной из наиболее сложных исследовательских задач является решение в теоретическом аспекте вопроса, об интерпретации содержательной стороны текста, о понимании его целостного смысла и описании семантической структуры. Решение этой задачи неразрывно связано в филологии с проблемой ключевых слов текста. Сочетания «ключевые слова», «ключевое слово» общеизвестны и широко используются в школьной и вузовской практике преподавания филологических дисциплин. Умение выделять ключевые слова очень важно как студенту, выполняющему научную работу (реферат, аннотацию и т.д.), так и специалисту, ученому. Популярность методики выделения ключевых слов связана в первую очередь с развитием информационно-поисковых систем, где правильно подобранные ключевые слова и фразы облегчают нахождение текста в сети Интернет. На сегодняшний момент совершенствуются методы поиска в Интернете с помощью ключевых слов, на каждом сайте существует своя система поиска. Актуальность темы определяется тремя факторами: теоретическим (лингвистическим), прикладным и практическим (учебным). 1. К настоящему времени назрела необходимость обобщения и систематизации всех существующих точек зрения на феномен ключевых слов для уточнения терминологического статуса этого понятия, выявления его теоретической сущности, определения функциональной природы и роли ключевых слов как особых лексико-семантических единиц текста. 2. Эта проблема непосредственно связана с индексированием текста, с реферированием и, конечно, с разработкой методики релевантного «поискового образа» документа, а также с усовершенствованием компьютерных поисковых систем. Компьютеры научились "понимать" смысл текста и самостоятельно выделять ключевые слова. Сегодня все поисковые системы используют в своей работе присущие текстам закономерности. 3. Нам, как будущим специалистам, учёным, необходимо приобретение навыков работы с научным текстом, извлекать нужную информацию из текстов, выступать на профессиональные темы, уметь свёртывать, сжимать информацию, решать типовые стандартные и профессионально-ориентированные задачи с целью овладения профессионально-коммуникативными умениями работы. Первая попытка теоретического решения проблемы ключевых слов была предпринята в 40-е годы XX века в работах А. Н. Соколова, А. А. Смирнова, посвященных вопросам психологии памяти и проблеме понимания речевого высказывания. А. Н. Соколов называл ключевые слова текста «опорными» или «обобщающими» словами. Следует отметить, что психологическое понимание сущности ключевых слов получило дальнейшее развитие в работах А. Р. Лурии, Л. В. Сахарного, Л. Н. Мурзина, А. С. Штерн, А. А. СироткоСибирского и других авторов. Под ключевыми словами мы понимаем такие языковые единицы, которые представляют текст в свёрнутом виде, являясь носителями его смысла. Цель работы - рассмотреть проблему ключевых слов и выделить их на материале текста по специальности. Как известно, не все слова в тексте равнозначны. Есть слова, которые позволяют представить текст в свёрнутом виде, при этом такое представление достаточно точно отражает содержание исходного текста. Мы постоянно используем такой метод, например, при конспектировании лекций, книги или статьи. Ключевые слова – это те слова, которые могут представить основное содержание текста. Основное содержание всякого документа (текста) может быть выражено с помощью определенных слов, взятых непосредственно из этого текста. Как правило, к каждому развернутому тексту можно составить целый набор ключевых слов различного объема (от 5 до 15 слов). Но вообще количество ключевых слов может варьироваться в широких пределах. Согласно мнению Л.В. Сахарного и А.С. Штерн [2], самым оптимальным является небольшой набор ключевых слов и словосочетаний – 7-10 слов. В отдельных случаях компрессия может привести к выделению одного основного ключевого слова, которое является самым частотным знаменательным словом. Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами представлять текст. Набор ключевых слов близок к аннотации, плану и конспекту, которые тоже представляют документ с меньшей детализацией, но лишён синтаксической структуры. Заметим, что термин «ключевые слова» в значительной степени условен: как ключевые знаки в тексте могут выступать не только слова, но и словосочетания и даже предложения В качестве основных смысловых единиц, выделяемых из исходного текста на 2-м этапе, могут выступать: 1) целые ключевые предложения; 2) ключевые словосочетания и слова. Ключевое (опорное) слово — это термин, относящийся к основному содержанию текста и повторяющийся в нем несколько раз учетом (с всех возможных синонимов). Ключевое словосочетание — это сочетание слов, среди которых есть одно или несколько ключевых. Ключевым предложением считается предложение, содержащее два и более ключевых слова или ключевых словосочетания. Т.о., 1) ключевыми словами считаются такие знаменательные слова текста, которые с учетом всех синонимов встречаются в тексте наибольшее число раз; 2) ключевым предложением считается предложение текста, которое: а) имеет несколько ключевых слов; б) содержит ключевые слова на небольшом расстоянии друг от друга. Ключевые слова обладают рядом существенных признаков: 1) высокая степень повторяемости данных слов в тексте, частотность их употребления 2) способность знака конденсировать, свертывать информацию, выраженную целым текстом, объединять «его основное содержание»; этот признак особенно ярко проявляется у ключевых слов в позиции заглавия. Однако выбор ключевых слов является очень непростой операцией и требует серьезного подхода. Следует выбирать те ключевые слова, которые наиболее точно отражают специфику именно вашей темы. При этом необходимо избегать случайных и общих фраз и не рекомендуется повторять несколько раз одни и те же ключевые слова. То есть процесс выделения ключевых слов является еще и аналитическим. Методика выделения ключевых слов. Благодаря многим лингвистическим исследованиям был выявлен алгоритм «формального определения зон наиболее вероятного расположения ключевых слов в тексте». Именно так обозначал их Л.В. Сахарный [3]. Вопервых, мы выявляем наиболее часто повторяющееся слово в тексте. Во-вторых, выделяются местоимения и синонимы к нему. Третий шаг – необходимо установить интервал между основным словом и словами слева и справа от него. Оптимальным интервалом обычно является интервал в три слова, это так называемая тематическая зона. Затем из этих слов выбираются знаменательные слова, или же только имена существительные. Это зависит от задач исследования. В-пятых, выбор падает на последние слова предложения, которые чаще всего и оказываются ключевыми. Это рематическая зона расположения ключевых слов. Место и количество ключевых слов в тексте. Ключевые слова, повторяясь, могут встречаться в любой части текста и не имеют фиксированной, жестко закрепленной в нем позиции. Исследователи заметили, что они нередко концентрируются в начале произведения, а также относительно часто функционируют как заглавия. Однако это лишь тенденция, которая проявляется далеко не всегда. Ключевые слова по-разному распределяются в конкретных текстах, часто не совпадают с заглавием. По-разному (в зависимости от характера текста) решается и вопрос об их количестве. Принадлежность слова, словосочетания или предложения к числу ключевых определяется специальными статистическими коэффициентами. Ключевое слово в анализе текста— набор слов, представляющих содержание текста и получаемых лингвистическими и математическими методами (например, анализируя частоту появления слова в тексте). Воспользовавшись «Анализатором текста» [4], по подсчету ключевых слов, мы установили, что наиболее употребительными в тексте «Трансгенные животные» являются слово животное —15 употреблений, трансгенные — 14, клетка — 7, днк — 6, создание – 4, гены, первый, орган, стволовые, эмбриональный, организм – 3. Остальные слова, в том числе человек, биотехнология и др. встретились по 1-2 раза. Особое место в семантической структуре текста занимают ключевые слова животные и трансгенные ,вынесенные в позицию заглавия. Это подтверждает достоверность выявленных ключевых слов. Выполнив статистико-математическую часть анализа, следует приступать к собственно лингвистической. Ведь ключевые слова выражают в тексте не только содержательную, сторону, но и образуют ряд связанных отношениями обусловленности «опорных» знаков. Ключевые слова в тексте «Трансгенные животные» выделены повторами разных типов: лексическими, синонимическими, морфемными, синтаксическими. Они последовательно занимают сильные позиции текста (заглавие, начало или конец абзаца). Ключевое слово, как мы видим, — это лексическая единица, разные значения которой одновременно реализуются в тексте, при этом в нем обязательно актуализируются и ее деривационные и ассоциативные связи. Ключевые слова образуют в тексте семантические комплексы: вокруг них группируются синонимичные им единицы, слова, ассоциативно с ними связанные, наконец, однокоренные слова, повтор которых в том или ином контексте, как правило, не случаен. Дальнейшая наша работа состоит в выявлении таких семантических и ассоциативных комплексов (с т.з. образования словообразовательных гнёзд - выбор однокоренных слов, группировки тематических групп, а также морфологических, синтаксических средств). В результате будут получены ключевые слова анализируемого текста, и возможно, количество и перечень ключевых слов, указанных выше, изменится. Использованная литература Даркулова К.Н., Мусантаева М.А. Русский язык: Научный стиль. Текст. Лексические и грамматические особенности научного стиля./Учебное пособие. Шымкент: ЮжноКазахстанский государственный университет им. М. Ауезова 2010.- 192 с. с приложениями. 2. Сахарный Л. В., Штерн А. С. Набор ключевых слов как тип текста // Лексические аспекты в системе профессионально-ориентированного обучения иноязычной речевой деятельности. Пермь: Пермский политехнический ун-т, 1988. С. 34—51. 3. Сахарный Л. В. Расположение ключевых слов в структуре развернутого текста (к изучению деривационных механизмов компрессии текста) // Деривация в речевой деятельности (Общие вопросы. Текст. Семантика). Пермь, 1988. С.27—29. 4. www.shipbottle.ru. Инструмент для формирования запросов к поисковым системам. 1.