ПРОЕКТУВАННЯ ТА РЕАЛІЗАЦІЯ ІНТЕГРОВАНОЇ СИСТЕМИ УПРАВЛІННЯ ТА АГРЕГАЦІЇ ВЕБ-КОНТЕНТУ

##plugins.themes.bootstrap3.article.main##

Максим ПЕДЧЕНКО
Олександр СЕРДЮК

Анотація

У роботі розглянуто проблему структурованого збереження веб-контенту та
запропоновано архітектурне рішення у вигляді браузерного розширення Digital Hub. Описано
багатоетапний конвеєр вилучення контенту, що виконує семантичний аналіз веб-сторінок,
видалення незначущих елементів та конвертацію у формат Markdown. Запропоновано
систему шаблонів із типізованими змінними, ланцюжками фільтрів та тригерами
автоматичного вибору шаблону. Охарактеризовано архітектуру браузерного розширення з
ізольованими контекстами виконання та типізованим обміном повідомленнями між ними.
Наведено порівняльний аналіз обраних технологій та відомих рішень у сфері вилучення
контенту. Практичне значення роботи полягає у створенні функціонального інструменту для
персонального управління знаннями, що забезпечує структуроване збереження, пошук та
організацію веб-контенту.

##plugins.themes.bootstrap3.article.details##

Як цитувати
ПЕДЧЕНКО , М., & СЕРДЮК , О. (2025). ПРОЕКТУВАННЯ ТА РЕАЛІЗАЦІЯ ІНТЕГРОВАНОЇ СИСТЕМИ УПРАВЛІННЯ ТА АГРЕГАЦІЇ ВЕБ-КОНТЕНТУ. Вісник Черкаського університету: Прикладна математика. Інформатика, (1). https://doi.org/10.31651/2076-5886-2025-1-95-106
Розділ
Інформатика
Біографії авторів

Максим ПЕДЧЕНКО , Черкаський національний університет імені Богдана Хмельницького

студент спеціальності «Прикладна
математика» Черкаського національного
університету імені Богдана
Хмельницького
e-mail: pedchenko.maksym@vu.cdu.edu.ua

Олександр СЕРДЮК

кандидат економічних наук, доцент,
доцент кафедри прикладної математики та
інформатики Черкаського національного університету імені БогданаХмельницького
e-mail: serdyuk@ukr.net
ORCID 0000-0002-3919-4661

Посилання

React Documentation [Electronic resource] // React. – Access mode: https://react.dev. – Title from screen.

TypeScript Documentation [Electronic resource] // TypeScript. – Access mode:

https://www.typescriptlang.org/docs. – Title from screen.

Banks A. Learning React / A. Banks, E. Porcello. – 2nd ed. – Sebastopol : O'Reilly Media, 2020. – 310 p.

WXT Documentation [Electronic resource] // WXT. – Access mode: https://wxt.dev. – Title from screen.

Mantine Documentation [Electronic resource] // Mantine. – Access mode: https://mantine.dev. – Title from

screen.

Mitchell R. Web Scraping with Python: Collecting More Data from the Modern Web / R. Mitchell. – 2nd

ed. – Sebastopol : O'Reilly Media, 2018. – 306 p.

Readability [Electronic resource] // GitHub. – Access mode: https://github.com/mozilla/readability. – Title

from screen.

The Open Graph protocol [Electronic resource]. – Access mode: https://ogp.me. – Title from screen.

Schema.org [Electronic resource]. – Access mode: https://schema.org. – Title from screen.

Gruber J. Markdown: Syntax [Electronic resource] // Markdown Syntax. – Access mode:

https://daringfireball.net/projects/markdown/syntax. – Title from screen.

Turndown [Electronic resource] // GitHub. – Access mode: https://github.com/mixmark-io/turndown. – Title

from screen.

Mustache: Logic-less templates [Electronic resource] // Mustache. – Access mode:

https://mustache.github.io/mustache.5.html. – Title from screen.

Anatomy of an extension [Electronic resource] // MDN Web Docs. – Access mode:

https://developer.mozilla.org/en-US/docs/Mozilla/Add-ons/WebExtensions/Anatomy_of_a_WebExtension.

– Title from screen.

Norman D. A. The Design of Everyday Things / D. A. Norman. – MIT Press Ltd, 2014. – 368 p.

Статті цього автора (авторів), які найбільше читають