Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом
dc.contributor.author | Сушинський, Орест | |
dc.contributor.author | Коцун, Володимир | |
dc.contributor.author | Скляренко, Олена | |
dc.contributor.author | Литвиненко, Леонід | |
dc.date.accessioned | 2024-09-19T10:32:43Z | |
dc.date.available | 2024-09-19T10:32:43Z | |
dc.date.issued | 2023-10-31 | |
dc.description.abstract | Проблема веб-скрапінгу виникає у зв’язку зі зростанням складності веб-сторінок, які використовують динамічний вміст, згенерований за допомогою JavaScript. Це ускладнює процес збору даних, оскільки стандартні методи HTTP-запитів не можуть отримати повний вміст сторінки. Мікросервісна архітектура може бути використана для вирішення цієї проблеми, оскільки дозволяє розподілити завдання між невеликими, незалежними сервісами. Аналіз досліджень та публікацій показує, що методи сканування веб-сторінок, які зазвичай використовуються, можуть займати багато часу при скануванні великих обсягів даних. Для вирішення цієї проблеми використовуються різні підходи, такі як швидкий двигун XPath селектора. Метою статті є дослідження особливостей використання мікросервісного підходу в процесі веб-скрапінгу та розгляд основних переваг мікросервісної архітектури. У статті будуть досліджені особливості використання різних підходів у доступі до елементів веб-сайту, зокрема увага буде приділена методам CSS селектори, Regex та XPath. Дослідження показало, що мікросервісна архітектура може покращити продуктивність системи, але може призвести до збільшення часу виконання завдань. Вимірювання показників ефективності показали, що метод Regex має найменше використання CPU і пам’яті порівняно з іншими методами, а метод XPath забезпечує вищу надійність та стійкість. | |
dc.identifier.citation | Сушинський О., Коцур В., Скляренко О., Литвиненко О. Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом // Вісник Хмельницького національного університету. Серія: Технічні науки. 2023. №5. Т. 2. С. 243-248. | |
dc.identifier.other | https://www.doi.org/10.31891/2307-5732-2023-327-5-243-248 | |
dc.identifier.uri | http://dspace.e-u.edu.ua/handle/123456789/281 | |
dc.publisher | Вісник Хмельницького національного університету: Технічні науки | |
dc.relation.ispartofseries | №5, т.2 2023 (325) | |
dc.title | Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом | |
dc.title.alternative | Using a microservice approach in the process of web scraping of large volumes of data for websites with dynamic content | |
dc.type | Article |
Файли
Контейнер файлів
1 - 2 з 2
Вантажиться...
- Назва:
- Використання мікросервісного підходу в процесі веб-скрапінгу великих обсягів даних для веб-сайтів із динамічним вмістом.pdf
- Розмір:
- 572.37 KB
- Формат:
- Adobe Portable Document Format
Вантажиться...
- Назва:
- cover_issue_325.pdf
- Розмір:
- 226.31 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed to upon submission
- Опис: