Дослідна експлуатація

ОЦІНКА ЕФЕКТИВНОСТІ ВИКОРИСТАННЯ ЗГОРТКОВИХ ТА РЕКУРЕНТНИХ НЕЙРОННИХ МЕРЕЖ У ЗАВДАННІ ОБРОБКИ ТЕКСТОВИХ ДАНИХ

Загальна інформація

Науковець

Afanasiev Anatolii (ORCID: 0009-0005-0707-981X)

Вид наукової роботи

Стаття в журналі

Дата публікації

12.09.2023

Видання

Information Technology: Computer Science, Software Engineering and Cyber Security

Анотація

<jats:p>Дана робота присвячена оцінці ефективності використання згорткових та рекурентних нейромереж у завданні обробки текстових даних на прикладі виявлення фейкових новин. Нині зусилля світової спільноти спрямовані на боротьбу з подiбною iнформацiєю в цiлому, що зумовлює актуальність порушеного питання. Проблематика виявлення фейкових новин полягає у достовірності визначення тої чи іншої інформації як фейкової чи правдивої. Метою роботи є порiвняння точностi визначення фейкових новин для архiтектур згорткових та рекурентних нейромереж, в яких закладена модель синтаксичного аналiзу текстiв статтi шляхом формування мiток новин з використанням TF-IDF та Word Embedding. Для досягнення поставленої мети було проведено аналіз області застосування та визначено ключові особливості цього типу інформації. Було розглянуто теоретичну основу обраних архітектур та встановлено їх конфігурації відповідно до поставленої задачі. Для практичної реалізації вибраних типів нейромереж було створено експериментальне середовище. Була виявлена відносна ефективність використання рекурентних нейромереж у порівнянні зі згортковими, а також визначено можливі сценарії, в яких отримані результати можуть змінюватися. У результаті аналізу було встановлено, що на доступних даних згорткова нейромережа має більшу швидкодію порівняно з рекурентною нейромережею, але при цьому надає менш точні результати класифікації. З урахуванням запропонованого правила порівняння ефективності, ймовірності помилок різних видів та можливості подолання розбіжностей між алгоритмами, отриманий приріст у продуктивності можна вважати незначним. Цей висновок відповідає світовій науковій практиці, яка рекомендує використовувати одну з запропонованих моделей або їх комбінацію під час аналізу текстової інформації, зокрема, у випадку наявності двох класів (фейкові та нефейкові дані), або при перевірці достовірності зображень.</jats:p>

Ідентифікатори

Джерело даних

OUCI (користувач системи)

Ідентифікатор

DOI

10.32782/it/2023-2-5