PERBANDINGAN TEKNIK WEB SCRAPING: CSS SELECTOR, HTML DOM, REGULAR EXPRESSION DAN XPATH DENGAN IMPLEMENTASI MULTIPROCESSING

Maulana, Muhamad (2020) PERBANDINGAN TEKNIK WEB SCRAPING: CSS SELECTOR, HTML DOM, REGULAR EXPRESSION DAN XPATH DENGAN IMPLEMENTASI MULTIPROCESSING. Sarjana thesis, Universitas Siliwangi.

[img] Text
01 Cover.pdf

Download (49kB)
[img] Text
02 Lembar Pengesahan.pdf

Download (94kB)
[img] Text
03 Lembar Pernyataan.pdf

Download (164kB)
[img] Text
04 Abstrak.pdf

Download (79kB)
[img] Text
05 Kata Pengantar.pdf

Download (258kB)
[img] Text
06 Daftar Isi.pdf

Download (154kB)
[img] Text
07 Daftar Tabel.pdf

Download (103kB)
[img] Text
08 Daftar Gambar.pdf

Download (105kB)
[img] Text
09 BAB I.pdf

Download (210kB)
[img] Text
10 BAB II.pdf

Download (251kB)
[img] Text
11 BAB III.pdf

Download (271kB)
[img] Text
12 BAB IV.pdf
Restricted to Repository staff only

Download (863kB)
[img] Text
13 BAB V.pdf
Restricted to Repository staff only

Download (83kB)
[img] Text
14 Daftar Pustaka.pdf

Download (205kB)

Abstract

Pengumpulan data sudah menjadi berbagai kebutuhan pada saat ini, terlebih banyaknya sumber data di internet yang beragam. Data extraction atau proses pengambilan data dari internet dikenal juga dengan sebutan web scraping. Beberapa teknik web scraping diantaranya: CSS Selector, HTML DOM, Regular Expression (Regex) dan XPath. Banyaknya jumlah data yang bersebaran di internet akan cukup memakan waktu bila dilakukan web scraping dalam skala besar. Hadirnya berbagai inovasi baru menjadi sebuah solusi yang dapat digunakan, dengan adanya sistem paralel sebuah pekerjaan dapat diselesaikan dengan lebih cepat dan sistem paralel tersebut dapat dilakukan oleh multiprocessing. Penelitian ini bertujuan untuk mengetahui kinerja metode web scraping dengan implementasi multiprocessing didalamnya. Pengujian dilakukan terhadap masing-masing metode dengan cara melakukan sebuah proses scraping, kemudian diukur kinerja dari proses tersebut dan dibandingkan. Jumlah objek data yang didapat, penggunaan CPU, penggunaan memori, waktu proses dan penggunaan bandwith network dijadikan parameter pengukuran dalam percobaan. Hasil percobaan menunjukkanXPath 10,31% lebih cepat dalam melakukan proses dan memiliki perbandingan hasil yang tidak terlalu jauh pada parameter penggunaan memori dengan score 351.642 bytes untuk XPath dan 334.438 untuk CSS Selector. Kata Kunci: CSS Selector, HTML DOM,, Multiprocessing, Regex, Web Scraping , XPath

Item Type: Thesis (Sarjana)
Subjects: T Technology > T Technology (General)
Divisions: Fakultas Teknik > Informatika
Depositing User: Lelis Masridah
Date Deposited: 29 Aug 2023 02:05
Last Modified: 29 Aug 2023 02:05
URI: http://repositori.unsil.ac.id/id/eprint/10774

Actions (login required)

View Item View Item