Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом

dc.contributor.authorСушинський, Орест
dc.contributor.authorКоцун, Володимир
dc.contributor.authorСкляренко, Олена
dc.contributor.authorЛитвиненко, Леонід
dc.date.accessioned2024-09-19T10:32:43Z
dc.date.available2024-09-19T10:32:43Z
dc.date.issued2023-10-31
dc.description.abstractПроблема веб-скрапінгу виникає у зв’язку зі зростанням складності веб-сторінок, які використовують динамічний вміст, згенерований за допомогою JavaScript. Це ускладнює процес збору даних, оскільки стандартні методи HTTP-запитів не можуть отримати повний вміст сторінки. Мікросервісна архітектура може бути використана для вирішення цієї проблеми, оскільки дозволяє розподілити завдання між невеликими, незалежними сервісами. Аналіз досліджень та публікацій показує, що методи сканування веб-сторінок, які зазвичай використовуються, можуть займати багато часу при скануванні великих обсягів даних. Для вирішення цієї проблеми використовуються різні підходи, такі як швидкий двигун XPath селектора. Метою статті є дослідження особливостей використання мікросервісного підходу в процесі веб-скрапінгу та розгляд основних переваг мікросервісної архітектури. У статті будуть досліджені особливості використання різних підходів у доступі до елементів веб-сайту, зокрема увага буде приділена методам CSS селектори, Regex та XPath. Дослідження показало, що мікросервісна архітектура може покращити продуктивність системи, але може призвести до збільшення часу виконання завдань. Вимірювання показників ефективності показали, що метод Regex має найменше використання CPU і пам’яті порівняно з іншими методами, а метод XPath забезпечує вищу надійність та стійкість.
dc.identifier.citationСушинський О., Коцур В., Скляренко О., Литвиненко О. Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом // Вісник Хмельницького національного університету. Серія: Технічні науки. 2023. №5. Т. 2. С. 243-248.
dc.identifier.otherhttps://www.doi.org/10.31891/2307-5732-2023-327-5-243-248
dc.identifier.urihttp://dspace.e-u.edu.ua/handle/123456789/281
dc.publisherВісник Хмельницького національного університету: Технічні науки
dc.relation.ispartofseries№5, т.2 2023 (325)
dc.titleВикористання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом
dc.title.alternativeUsing a microservice approach in the process of web scraping of large volumes of data for websites with dynamic content
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 2 з 2
Вантажиться...
Ескіз
Назва:
Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом.pdf
Розмір:
572.37 KB
Формат:
Adobe Portable Document Format
Вантажиться...
Ескіз
Назва:
cover_issue_325.pdf
Розмір:
226.31 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed to upon submission
Опис: