Maulana, Muhamad (2020) PERBANDINGAN TEKNIK WEB SCRAPING: CSS SELECTOR, HTML DOM, REGULAR EXPRESSION DAN XPATH DENGAN IMPLEMENTASI MULTIPROCESSING. Sarjana thesis, Universitas Siliwangi.
Text
01 Cover.pdf Download (49kB) |
|
Text
02 Lembar Pengesahan.pdf Download (94kB) |
|
Text
03 Lembar Pernyataan.pdf Download (164kB) |
|
Text
04 Abstrak.pdf Download (79kB) |
|
Text
05 Kata Pengantar.pdf Download (258kB) |
|
Text
06 Daftar Isi.pdf Download (154kB) |
|
Text
07 Daftar Tabel.pdf Download (103kB) |
|
Text
08 Daftar Gambar.pdf Download (105kB) |
|
Text
09 BAB I.pdf Download (210kB) |
|
Text
10 BAB II.pdf Download (251kB) |
|
Text
11 BAB III.pdf Download (271kB) |
|
Text
12 BAB IV.pdf Restricted to Repository staff only Download (863kB) |
|
Text
13 BAB V.pdf Restricted to Repository staff only Download (83kB) |
|
Text
14 Daftar Pustaka.pdf Download (205kB) |
Abstract
Pengumpulan data sudah menjadi berbagai kebutuhan pada saat ini, terlebih banyaknya sumber data di internet yang beragam. Data extraction atau proses pengambilan data dari internet dikenal juga dengan sebutan web scraping. Beberapa teknik web scraping diantaranya: CSS Selector, HTML DOM, Regular Expression (Regex) dan XPath. Banyaknya jumlah data yang bersebaran di internet akan cukup memakan waktu bila dilakukan web scraping dalam skala besar. Hadirnya berbagai inovasi baru menjadi sebuah solusi yang dapat digunakan, dengan adanya sistem paralel sebuah pekerjaan dapat diselesaikan dengan lebih cepat dan sistem paralel tersebut dapat dilakukan oleh multiprocessing. Penelitian ini bertujuan untuk mengetahui kinerja metode web scraping dengan implementasi multiprocessing didalamnya. Pengujian dilakukan terhadap masing-masing metode dengan cara melakukan sebuah proses scraping, kemudian diukur kinerja dari proses tersebut dan dibandingkan. Jumlah objek data yang didapat, penggunaan CPU, penggunaan memori, waktu proses dan penggunaan bandwith network dijadikan parameter pengukuran dalam percobaan. Hasil percobaan menunjukkanXPath 10,31% lebih cepat dalam melakukan proses dan memiliki perbandingan hasil yang tidak terlalu jauh pada parameter penggunaan memori dengan score 351.642 bytes untuk XPath dan 334.438 untuk CSS Selector. Kata Kunci: CSS Selector, HTML DOM,, Multiprocessing, Regex, Web Scraping , XPath
Item Type: | Thesis (Sarjana) |
---|---|
Subjects: | T Technology > T Technology (General) |
Divisions: | Fakultas Teknik > Informatika |
Depositing User: | Lelis Masridah |
Date Deposited: | 29 Aug 2023 02:05 |
Last Modified: | 29 Aug 2023 02:05 |
URI: | http://repositori.unsil.ac.id/id/eprint/10774 |
Actions (login required)
View Item |