У системах автоматичного реферування



Дата конвертації09.09.2018
Розмір34.5 Kb.
СЕМАНТИЧНІ ЗВ’ЯЗКИ «ТЕКСТ-РЕФЕРАТ»

У СИСТЕМАХ АВТОМАТИЧНОГО РЕФЕРУВАННЯ



Панченко Дмитро Ігорович

Харківський гуманітарний університет «Народна українська академія»

panchenko_di@yahoo.fr
В доповіді висвітлюється проблема моделювання семантичних зв’язків «Текст-Реферат» у системах автоматичного реферування. Розглядається побудова семантико-контекстної моделі реферування та моделі подання знань у системі автоматичного реферування із використанням моделі реферату, моделі заголовка, текстової бази та онтологій двох рівнів з метою оптимізації процедури автоматичного аналізу та компресії текстів у процесі реферування.

Актуальність роботи визначається необхідністю моделювання семантичних зв’язків у природно мовних текстах з метою побудови ефективних систем автоматичного реферування з опертям на знання, що передбачає змістове опрацювання тексту в автоматичному режимі. Базовою моделлю опису знань обрано онтології як засіб класифікації терміносфери предметної галузі. Актуальність їх розробки уможливлює розвинене машинне опрацювання інформації за рахунок здійснення змістового аналізу текстів.

Вихідним пунктом нашого дослідження є положення про те, що моделювання процесу реферування як сукупності найскладніших процесів розуміння й компресії змісту слід починати з вивчення не самих процесів, а з їх результату – реферату. Причому не розгорнутого, інформативного, а стиснутого, індикативного, перш за все, тому що розглядаємо його як відправну точку в дослідженні цього питання, як об’єкт найбільш простий за формою, але такий, що відбиває всі особливості реферативного тексту.

На першому етапі дослідження передбачається, що змістова і синтаксична структура реферату дозволить з’ясувати природу компресії в реферуванні та її можливі наслідки щодо структури реферативних речень, і на підставі виявлених особливостей семантико-синтаксичної структури цих речень побудувати модель індикативного реферату. Наступний крок – перехід до розробки процедури здобування знань із тексту й заповнення моделі реферату відібраними з тексту іменниковими групами. При цьому передбачається, що відправною точкою для змістового аналізу тексту є заголовок (назва статті, що містить головну думку автора), використання котрого у якості «камертона» при аналізі змісту тексту, дозволить знайти найважливіші змістові елементи для пошуку іменникових груп у тексті й побудови на їх основі текстової бази.

У нашому дослідженні для формального опису змісту тексту й змістових перетворень у процесі реферування використовуються:



  1. заголовок, який презентує зміст вихідного тексту в концентрованому вигляді;

  2. текстова база, яка містить речення, що є «інформаційним ядром» тексту, котре утримує інформацію, залежну від ситуації (тематики тексту);

  3. онтології, що містять не залежну від тематики тексту інформацію: онтології верхнього рівня (набір змістових категорій, котрі входять до реферату), онтології загальнонаукової лексики (необхідної для синтезу реферативних речень) й онтологій предметних галузей (необхідних для аналізу змісту тексту).

Моделювання семантичних зв’язків «Текст-Реферат» у процесі інтелектуального реферування, на наш погляд, є вагомим внеском у розв’язання проблеми автоматичного опрацювання текстової інформації, що дозволило з’ясувати, як відбувається змістове згортання в процесі реферування і які специфічні ознаки у структурі реферативних речень та заголовку воно унаочнює. Результати роботи можуть бути використані в системах автоматичного опрацювання інформації для покращення якості процесів реферування.
Каталог: attachments -> article -> 305
article -> План роботи методичного об’єднання вчителів-предметників суспільно-гуманітарних наук на 2015/2016 навчальний рік
article -> План роботи методичного осередку вчителів-предметників природничо-математичних наук на 2015/2016 навчальний рік
article -> Рішення щодо оцінювання навчальних досягнень учнів курсів за вибором приймається навчальним закладом
article -> Получение патента на полезную модель
305 -> Караульна О. М. Тематична сторінка «Світ культури» Розділ І. Образ матері в українському сакральному мистецтві
305 -> Учнівська наукова конференція «Видатні жінки математики»
305 -> Поп-музика


Поділіться з Вашими друзьями:




База даних захищена авторським правом ©uchika.in.ua 2020
звернутися до адміністрації

    Головна сторінка