Ekstraksi Tabel HTML ke Database Management System dengan Pendekatan Service Oriented Architecture

Autor: Memen Akbar, Ardianto Wibowo
Jazyk: indonéština
Rok vydání: 2017
Předmět:
Zdroj: Jurnal Komputer Terapan, Vol 3, Iss 2 (2017)
Druh dokumentu: article
ISSN: 2443-4159
2460-5255
Popis: Seiring dengan perkembangan berbagai bisnis proses, keberadaan data yang ada semakin berkembang dalam berbagai bentuk. Salah satu bentuk data adalah tabel di dalam sebuah halaman HTML. Berbeda dengan tabel pada database, tabel HTML memiliki struktur yang beragam. Nama atribut, pada tabel database selalu berada pada baris pertama. Sedangkan, pada tabel HTML, nama atribut dapat berada pada kolom pertama (row wise table) atau pada baris dan kolom pertama (column-row wise table). Sehingga, dalam proses ekstraksi, terlebih dahulu harus dikenali bagian pada tabel yang berperan sebagai nama kolom dan bagian tabel yang berperan sebagai data. Setelah diekstraksi, agar dapat digunakan untuk kebutuhan yang lebih lanjut, tabel HTML tersebut disimpan dalam sebuah database. Proses ini dilakukan dengan pendekatan Service Oriented Architecture sehingga ekstraksi dapat dilakukan secara otomatis. Penelitian ini mengembangkan sebuah model ekstraksi tabel HTML dengan pendekatan semantic tree dan memanfaatkan SOA dalam proses loading data ke database. Model yang dihasilkan berhasil mengekstrak tabel dari halaman web dengan 3 jenis bentuk layout, yaitu column wise, row wise, dan column-row wise dan menyimpannya dalam DBMS.
Databáze: Directory of Open Access Journals