4.1 Dasar Pengaturan dan Akses Data
4.1.1 Hirarki Data
Sistem komputer mengorganisasikan
data ke dalam suatu hirarki yang dimulai dengan bits dan kemudia bytes, fields,
record, files, dan database. Bits merupakan unit terkecil dari data yang dapat
diproses oleh komputer dan satu kumpulan bit yang terdiri dari 8 bits adalah
bytes yang merepresentasikan karakter tunggal bisa berupa huruf, angka, atau
simbol.
Fields
merupakan penggabungan beberapa karakter secara logic menjadi sebuah kata,
gabungan kata, atau rangkaian kata. Contohnya nama_siswa, tgl_daftar, alamat.
Record adalah gabungan dari beberapa field secara logic, contohnya adalah:
nama_siswa, mata kuliah yang diambil, dll. File merupakan gabungan dari beberapa
record sejenis yang saling berhubungan. Database ialah gabungan dari beberapa
file yang saling berhubungan. Sebuah record menggambarkan sebuah entity/entitas
(orang, tempat, barang, atau pelanggan, pegawai, produk, dll). Setiap karakteristik
atau kualitas menggambarkan keterangan dari entitas disebut atribut, contohnya
nama_pelanggan, kode_karyawan, warna_produk.
Setiap record dalam sebuah file
harus mempunyai paling tidak satu field yang unik yang dapat mengidentifikasi
record tersebut, sehinga record tersebut mudah diambil (access), diperbaharui
(update), dan diurutkan. Field ini yang biasa disebut Primary Key, contohnya
nomor induk mahasiswa (NIM) sebagai Primary Key,karena tidak mungkin sama
antara siswa satu dengan siswa lain (unik).
SecondaryKey
adalah field lain yang mempunyai beberapa informasi identifikasi, tetapi tidak
mengidentifikasi secara khusus. Contohnya last_name merupakan secondary key
karena kemungkinan ada beberapa orang yang mempunyai last name yang sama.
4.1.2 Penyimpanan dan Pengaksesan Record
Record – record disimpan dengan
berbagai cara di dalam media penyimpanan (secondary storage) dan penyusunannya
menentukan cara bagaimana record tersebut bisa diakses. Dalam Sequential
Access, data/record harus diambila/diakses sesuai dengan urutan fisik
penyimpanan data tersebut. Untuk pengaksesan secara langsung (direct) atau
random, user dapat mengambil/mengakses data/record diberbagai urutan tanpa
perlu mengetahui urutan fisik data pada media penyimpanan.
Index sequential acces method (ISAM)
Metode
pencarian ini dengan menggunakan sebuah index dari key field untuk mencari
sebuah record. Indeks terhadap suatu file merupakan daftar key field dari
setiap record dan posisi di mana record tersebut di simpan pada media penyimpanan.
Record di simpan pada disk berdasarkan urutan key. Track index menunjukkan
nilai tertinggi dari key field yang dapat ditemukan pada track tertentu. Untuk
menemukan record tertentu, track index dicari utnuk menemukan cylinder dan
track yang mengandung data, selanjutnya secara berurutan track dibaca untuk
mendapatkan record.
Direct File Access Method
Metode
ini menggunakan key field untuk menemukan alamat fisik dari sebuah record.
Proses menggunakan rumus matematik (transform algorithm) untuk merubah key field
menjadi lokasi penyimpanan dari record.
4.2 File
Dari jaman aplikasi komputer pertama
dalam bisnis (pertengahan tahun 50) sampai tahun 1970, organisasi mengatur
datanya dengan pendekatan tradisional yaitu dalam bentuk file. Cara ini telah
berjalan sebab organisasi secara khusus telah memulai sebuah aplikasi otomatis
pada suatu waktu. Sistem ini berkembang sendiri tanpa perencanaan secara
menyeluruh. Setiap aplikasi mempunyai data sendiri, yang mana dikelola dalam
sebuah file data. Sebuah file data adalah koleksi dari record yang berhubungan
secara logic.
4.2.1 Permasalah dengan Pendekatan file
Permasalahan yang timbul antara lain
:
- Data redundancy (Duplikasi)
Karena
aplikasi dan file datanya telah dibuat oleh programmer yang berbeda dalam
jangka waktu yang lama, maka sejumlah informasi yang sama terduplikasi di
beberapa tempat.
- Data inconsistency (Data tidak Konsisten)
Data
inconsistency berarti suatu jenis data memiliki berbagai macam salinan
yang
berbeda – beda (untuk data yang sama, salinannya tidak sama,
sehingga
data tidak konsisten).
- Data Isolasion (Pemisahan)
Dengan
aplikasi yang dirancang dan diimplementasikan secara unik, data file dikelola
secara terpisah mengakibatkan penyimpanan data dengan format yang berbeda,
seperti ukuran tinggi dalam centimeter atau Inchi, dan biasanya tidak dapat
diakses oleh aplikasi lain.
- Data Integrity (Integritas Data)
Nilai
data harus dipertahankan kesesuaiannya. Misalnya nilai siswa tidak boleh
negative.
- Data Independence (Aplikasi/data berdiri sendiri)
Dalam pendekatan tradisional yaitu
pendekatan file, aplikasi dan file data
yang
berhubungan independence satu sama lain.
4.3 Pendekatan Modern : Basis Data
(Database)
Database merupakan gabungan dari
beberapa file yang saling berhubungan dan dapat mengeliminasi permasalahan yang
timbul dari pendekatan tradisional yaitu file. Dengan pendekatan modern semua
data diletakkan di tempat penyimpanan yang sama. Tidak seperti pendekatan
tradisional di mana program yang berbeda – beda mengakses file data yang
berbeda – beda. Basis data diatur sedemikian rupa sehingga satu atau sekelompok
program menyediakan akses terhadap semua data.
Sehingga
permasalahan duplikasi data (redundancy), data yang terisolasi (isolation), dan
data yang tidak konsisten (inconsistency) dapat dikurangi, dan data dapat
dibagi – bagikan di antara semua pengguna (users). Di samping itu, keamanan dan
integritas data meningkat, dan aplikasi serta data tidak bergantung satu dengan
yang lainnya.
4.3.1 Penempatan Data dalam Basis Data
Basis Data adalah gabungan/kumpulan
dari beberapa file yang berhubungan dan di mana file – file yang berhubungan
tersebut ditempatkan dapat mempengaruhi user dalam mengakses data, waktu
dibutuhkan untuk query, entry data, keamanan, dan biaya.
Database Terpusat (Centralized Database)
Database
terpusat (Centralized Database) memiliki semua file yang saling berhubungan
dalam suatu lokasi penyimpanan. File – file database ditempatkan di komputer
mainframe (komputer pusat). Dengan ini tidak hanya memperkecil biaya dalam
hubungannya dengan beberapa computer tapi juga memberikan database admin (DBA)
dengan kemampuannya untuk bekerja pada database dalam satu lokasi saja.
Semua file tidak
bisa diakses kecuali dari komputer pusat, di mana file tersebut lebih mudah
diproteksi dari akses – akses atau modifikasi yang tidak berhak, juga
penyelamatan dari bencana (disasters recovery) akan lebih mudah dilakukan
karena data hanya berada pada satu lokasi pusat penyimpanan.
Bagaimanapun
juga data terpusat mempunyai satu titik kelemahan, yakni ketika komputer pusat
tidak berfungsi maka yang lain tidak bisa beroperasi. Dan kadangkala kecepatan
akses bermasalah, jika user tersebar di berbagai tempat yang jauh dan harus
mengerjakan manipulasi semua data, maka akan terjadi kelambatan atau akses
menjadi sangat lambat.
Data Terdistribusi (Distributed Database)
Penggandaan
semua database atau sebagian database ke lebih dari satu tempat/lokasi, yang
biasanya lebih dekat dengan user. Ada
2 tipe data terdistribusi :
- Replicated Database
Penggandaan
(copy) semua database ke beberapa lokasi, dengan
tujuan utama
untuk mengatasi permasalahan apabila terjadi
kegagalan pada
database pusat, selain itu juga meningkatkan respon
terhadap akses
oleh user.
- Partitioned Database
Penggandaan
(copy) sebagian database ke suatu tempat/lokasi lain, biasanya bagian yang
digandakan adalah bagian database yang sangat dibutuhkan oleh user pada lokasi tersebut.
Pengaksesan akan lebih cepat karena database berada dekat dengan user.
4.3.2 Pembuatan Basis Data (Creating
Database)
Untuk membuat sebuah database,
perancang database harus membuat rancangan konsep (conceptual design) dan
rancangan fisik (physical design). Rancangan konsep adalah model abstrak
database dari user atau dari segi pandang bisnis. Rancangan fisik menunjukkan bagaimana
sebuah database sebenarnya diatur/disusun pada tempat penyimpanan.
Rancangan
konsep menggambarkan bagaimana elemen data dalam database dikelompokkan. Proses
perancangan mengidentifikasi hubungan antara elemen data dan cara paling
efisien untuk mengelompokkan elemen data dalam memenuhi kebutuhan informasi.
Proses perancangan juga mengidentifikasi duplikasi dan pengelompokan pada
elemen data membutuhkan aplikasi tertentu. Untuk mendapatkan rancangan database
yang optimal perancang database harus menggunakan ER-Diagram dan Normalisasi.
Entity Relationship (ER) Modeling
ER Diagram
sebagai dokumen dari konsep model data yang berisi entity/entitas, atribut, dan
relasi, yang semuanya digambarkan dalam diagram.
o Entitas adalah
sesuatu yang dapat diidentifikasi pada lingkunga kerja pengguna (user). Contoh
: pendaftaran mata kuliah oleh mahasiswa. Pada contoh ini entitasnya adalah
mahasiswa, mata kuliah. Entity Classes merupakan gabungan/kelompok dari
beberapa entity/entitas.
o Instance
menggambarkan keterangan dari entity. Sebagai contoh mahasiswa tertentu (Johns
Mill, 0800759633) adalah instance dari mahasiswa.
o Identifier
merupakan atribut yang mengidentifikasi instance dari
entity.
Contohnya untuk instance mahasiswa dapat diidentifikasi dengan nomor id mahasiswa.
o Relationship
adalah yang menggambarkan hubungan satu entity dengan entity lain. Hubungan
tersebut bisa hubungan one to one, one to many, dan many to many.
�� 1 : 1 (one to
one)
Satu instance
dari suatu entity berhubungan dengan satu instance dari satu entity lain.
�� 1 : M (one to
many)
Satu instance
dari satu entity berhubungan dengan banyak instance dari suatu entity lain. Contohnya
adalah hubungan antara entitas dosen dan mata kuliah. Hubungan ini menggambarkan
bahwa satu dosen dapat mengajar lebih dari satu mata kuliah.
�� M : M (many to
many)
Banyak instance
dari suatu entity berhubungan dengan banyak instance dari suatu entity lain.
Contohnya adalah hubungan antara entitas mahasiswa dan mata kuliah. Hubungan
ini menggambarkan bahwa satu mahasiswa dapat mengambil lebih dari satu mata
kuliah dan satu mata kuliah dapat diambil oleh lebih dari satu mahasiswa.
Normalization
Pada
relational database perlu dilakukan analisa agar tidak terjadi pengulangan atau
redundancy. Normalisasi adalah cara untuk menganalisa dan mengurangi suatu
relasi database menjadi lebih singkat dengan tujuan meminimalkan duplikasi
data, memaksimalkan integritas data, dan kinerja proses yang baik.
4.4. Sistem Manajemen Database (Database
Mangement System / DBMS)
Merupakan suatu software (program)
atau sekelompok program yang dapat memberikan akses ke database. DBMS
memperbolehkan organisasi untuk menyimpan data di dalam satu tempat
penyimpanan, dari itu data dapat diupdate dan diambil, dan juga memberikan
akses ke data yang disimpan oleh berbagai macam program aplikasi.
DBMS juga
memberikan mekanisme untuk pengelolaan integritas informasi yang disimpan,
mengatur keamanan dan akses dari user, perbaikan informasi ketika sistem rusak,
dan pengaksesan berbagai macam fungsi databsae di dalam aplikasi yang ditulis
dengan bahasa generasi ke 3, 4, atau berorientasi objek.
4.4.1 Logikal vs Fiskal
Phisycal view berhubungan dengan
pengaturan aktual atau sebenarnya, pengaturan fisik, dan lokasi data di tempat
penyimpanan (direct acces storage). Spesialis database menggunakan phisycal
view untuk membuat efisiensi penggunaan tempat penyimpanan dan pemrosesan
sumberdaya. Logical view menyajikan data dalam bentuk yang sangat
berarti/berguna kepada pengguna dan program software yang memproses data
tersebut.
4.4.2 Komponen DBMS
Ada empat komponen utama di dalam sistem
manajemen database yakni Data Model, DDL, DML, dan Data Dictionary.
Model Data (Data
Model)
Menerangkan
bagaimana cara data disusun secara konsep.
Data Definition
Language (DDL)
Menerangkan tipe
informasi yang ada di dalam database dan bagaimana informasi – informasi
tersebut disusun. DDL menerangkan tiap elemen data sebagaimana adanya dalam
database sebelum elemen data tersebut diubah menjadi bentuk yang dibutuhkan oleh
aplikasi. DDL merupakan jalur di antara logical dan physical view. DDL
digunakan untuk mendefinisikan karakter fisik setiap record, field di dalam
suatu record, dan setiap nama logical dari field, tipe data dan panjang karakter,
dan juga digunakan untuk rmenspesifikasikan relasi/hubungan di antara semua
record.
Fungsi lain dari DDL antara lain :
o Menyediakan
cara untuk menghubungkan data.
o Menentukan
identifier yang unik dari record.
o Membuat
keamanan terhadap akses data dan mengubah batasan (restrictions).
Data Manipulation Language (DML)
Digunakan
dengan bahasa generasi ke 3,4 atau berorientasi objek untuk melakukan query
terhadap isi dari database, penyimpan atau update informasi di dalam database
dan membangun aplikasi database.
DML memungkinkan
user untuk mengambil, mengurutkan, menampilkan dan menghapus isi dari database.
SQL merupakan bahasa database relasi yang paling populer, yang mengkombinasikan
kemampuan DDL dan DML.
Contoh:
SELECT
(student_name) from (student_database)
where student_id
= ‘0800759633’
Menampilkan nama
mahasiswa dari tabel database mahasiswa yang memilik student_id = 0800759633.
Data Dictionary (Kamus Data)
Kamus
data menyimpan definisi dari elemen data (field) dan karakteristik data seperti
individuals, fungsi bisnis, program, dan laporan. Kamus data memiliki
keuntungan yaitu dapat mengurangi ketidakkonsistenan dalam data karena kamus
data menyediakan definisi standar untuk semua elemen data. Sistem manajemen
database memiliki keuntungan terhadap organisasi sebagai
berikut :
- Meningkatkan kegunaan strategis dari data perusahaan.
- Mengurangi kompleksitas dari lingkungan sistem informasi perusahaan.
- Mengurangi duplikasi data dan data yang tidak konsisten.
- Meningkatkan integritas data.
- Meningkatkan keamanan.
- Mengurangi biaya pembangunan dan pengelolaan aplikasi.
- Meningkatkan fleksibilitas dari sistem informasi.
- Meningkatkan akses dan ketersediaan data dan informasi.
4.5 Logical Data Model
Kemampuan seorang manager untuk
menggunakan data adalah sangat bergantung
pada bagaimana
database terstruktur secara logical maupun fisik. DBMS memisahkan tampilan
logic dan fisik dari data, ini berarti bahwa programmer dan user tidak tahu di
mana dan bagaimana data sebenarnya disimpan.
Dalam penyusunan
database secara logic, kebutuhan bisnis menentukan karakteristik dari data dan
bagaimana data akan diakses. Ada
tiga bentuk data model yang biasa digunakan, yakni hierarchical, network, dan relational.
Dan tipe lain dari model data termasuk multidimensional, object oriented, object-relation,
dan hypermedia.
Menggunakan
model ini, perancang database dapat membangun tampilan logic atau konseptual
dari data yang selanjutnya dapat diimplementasikan secara fisik ke dalam
database virtual dengan DBMS apa saja.
4.5.1 Model Basis Data Hirarki
(Hierarchical Database Model)
Membuat struktur data ke dalam
bentuk pohon terbalik (inverse trees) yang setiap record mempunyai 2 elemen. Yang
pertama merupakan root atau field master atau sering disebut juga key, yang mengidentifikasikan
tipe lokasi atau susunan record. Kedua adalah berupa variable dari subordinate
field, yang menerangkan akhir dari data dalam record. Aturannya adalah semua
field hanya mempunya satu “parent”, setiap parent mempunyai banyak “Children”. Keuntungan
dari Hierarchical Database Model adalah kecepatan dan efisiensi dalam pengaksesan
data. Sementara kerugian dari Hierarchical Database Model adalah dalam hal
pengaksesan data. Ketika mengakses data, data harus didefinisikan dahulu oleh
database admin sebelum program ditulis, dan setiap relasi harus benar – benar
didefinisikan ketika database dibuat.
4.5.2 Model Basis Data Jaringan (Network
Database Model)
Membuat relasi/hubungan antar data
melalui suatu struktur linked-list di mana subordinate record dapat dihubungkan
ke lebih dari satu elemen data. Mirip dengan Hierarchical Model, tetapi pada
model ini menggunakan link yang eksplisit untuk menghubungkan member dan owner
yang disebut pointer. Model database ini sangat komplek/rumit, yakni setiap ada
perubahan hubungan antar elemen data, sepasang pointer harus diperbaiki.
4.5.3 Model Basis Data Relasi (Relational
Database Model)
Relational database model berdasar
pada konsep sederhana dari tabel untuk melakukan perubahan pada karakteristik
baris dan kolom data. Di dalam model ini, tabel - tabel disebut relations,
baris disebut tuple, dan kolom disebut attribute.
Ada beberapa prinsip dasar dalam membuat
database model ini, pertama urutan tuple atau attribute di dalam table adalah
tidak berhubungan (irrelevant), kedua setiap tuple harus dapat diidentifikasi
secara unik oleh data di dalam tuple (disebut primary key), ketiga setiap table
harus memiliki identifier yang unik-nama dari relasi, keempat tidak ada
duplikasi atribut atau tuple, dan yang terakhir hanya ada satu nilai dalam
setiap baris-kolom ”cell” pada tabel.
Di
dalam relasional database, ada tiga operasi dasar yang digunakan untuk membangun
sejumlah data yang berguna, select, join, dan project. Operasi select membuat
subset berisi semua record dalam file data yang sesuai dengan kriteria yang
ditentukan. Operasi join menggabungkan tabel relasi relasi untuk menyediakan
informasi yang lebih dari pada yang tersedia pada tabel individu kepada user. Operasi
Project membuat subset berisi kolom dalam table, memperbolehkan user untuk
membuat tabel baru yang berisi informasi yang dibutuhkan.
4.5.4 Kemunculan Data Model
Ada tiga model data, yaitu multidimensional,
object oriented dan hypermedia.
4.5.4.1 Database Object Oriented Model
Model yang sekarang sedang banyak
dikembangkan adalah model yang berdasarkan objek, yakni sejumlah data
diletakkan secara bersama – sama dengan semua data yang dibutuhkan dengan
tujuan untuk melakukan pengoperasian dengan data tersebut. Pengertian database
object oriented model mirip dengan bahasa pemograman object oriented yang
terdiri dari object, attribute, classes, method, dan messages. Object, mirip
dengan entitas yang menggambarkan orang, tempat, atau benda, tetapi objek juga
berisi semua data yang dibutuhkan oleh objek dengan tujuan untuk melakukan
pengoperasian. Contohnya : karyawan, barang. Attribut, adalah karakteristik
yang menerangkan keadaan objek tersebut. Contohnya: umur karyawan. Method,
sebuah operasi, aksi, atau tindakan yang dialami objek. Contohnhya : barang
yang terjual. Messages, dari objek lain mengaktifkan operasi yang terkandung
dalam objek tersebut. Ketika operasi diaktifkan, pesan akan dikirim kepada
objek ketiga yang mungkin mengaktifkan method dalam objek tersebut dan lain –
lain. Class, menerangkan semua messages untuk objek yang mana yang akan merespon,
sebagaimana di mana objek – objek dari kelas ini diimplementasikan. Class
biasanya diatur seperti struktur pohon. Contohnya sebuah objek truk” adalah
sebuah subclass dari ”Kendaraan bermotor”, sebuah ”truk” adalah ”Kendaraan
bermotor”.
4.5.4.2 Object Relation Database Model
Menambah
kapasitas penyimpan objek yang baru ke sistem manajemen database relation. Sistem
yang berdasar pada model ini adalah penggabungan data field tradisional
manajemen, objek
yang kompleks/rumit seperti rangkaian waktu, data geospital (map, photo,
satellite) dan macam – macam media biner seperti audio, video, images, applet,
dan text terformat atau tidak.
4.5.4.3 Hypermedia Database Model
Menyimpan sejumlah informasi dalam
bentuk nodes yang terhubung oleh link yang dibuat oleh user. Nodes bisa berisi
text, graphic, motion video, atau exe.file. Relasi di antara nodes tidak begitu
terstruktur dibanding sistem manajemen database yang tradisional. Pada
kebanyakan sistem, setiap nodes dapat ditampilkan pada layar. Layar juga berperan
sebagai penghubung antara node dengan node yang lain dalam database.
4.5.5 Model Lain Basis Data (Other Database
Model)
Geographical Information Database
berisi data lokasi untuk digambarkan sebagai peta atau images. Dengan
mengunakan tipe data ini, user dapat melihat lokasi pelanggan dan vendor tanpa
harus membaca alamat yang sebenarnya. Knowledge Database dapat menyimpan aturan
keputusan digunakan untuk mengevaluasi situasi dan menolong user membuat
keputusan seperti layaknya seorang ahli. Multimedia Database dapat menyimpan
dalam bentuk media atau apa saja, seperti suara, video, images, grafik,
animasi, dan teks.
4.5.6 Small-Footprint Database
Small-Footprint Database
memungkinkan organisasi untuk menempatkan data tipe tertentu pada lokasi di mana
pekerja berada. Database ini menawarkan informasi yang lebih banyak dalam
bentuk yang dapat diakses.
4.6 Gudang Data (Data Warehouse)
Pada saat ini organisasi fokus untuk
meningkatkan atau mengganti system pemrosesan tranaksi online dan memberikan perhatiankhusus
untuk membuat informasi tersedia terhadap user melalui manajemen akses dan
pengaturan efisien. Fokus teknologi telah berubah dari pengambilan input data
melalui system operasional perusahaan menjadi pengaksesan informasi yang
disediakan oleh gudang data perusahaan.
Data Warehouse
adalah sistem manajemen database relational atau multidimensional yang
dirancang untuk mendukung manajemen pengambilan keputusan. Data Warehouse
mengandung data terbaru dengan rinci, data yang lama (Historical Data) dengan
rinci, rangkuman data, dan metadata. Metadata adalah data mengenai data.
Metadata penting untuk perancangan, pembuatan, pengambilan, dan pengontrolan
data dari gudang data. Pengguna data warehouse perlu mengetahui data apa saja
yang tersedia, apa sumber data, di mana data berada, dan bagaimana mengakses
data. Metadata secara teknis termasuk dari mana data berasal, bagaimana gudang
data diubah, bagaimana data diatur, bagaimana data disimpan, siapa memiliki
data, siapa bertanggungjawab terhadap data, siapa yang dapat mengakses data,
dan tanggal update terbaru. Bisnis metadata termasuk data apa yang tersedia, di
mana data berada, apa maksud data, pengertian data, bagaimana mengakses data,
dan lain – lain.
Datawarehouse
memberikan keuntungan bisnis diantaranya sebagai berikut :
- Meyediakan pengguna bisnis dengan pandangan “customer centric” dari data perusahaan yang beraneka ragam dengan membantu mengintegrasikan data dari penjualan, layanan (servcie), manufacturing, distribusi, dan sistem bisnis lain yang berhubungan dengan customer.
- Memberikan nilai tambah kepada pelanggan (customer perusahaan) dengan memungkinkan mereka mengakses informasi ketika gudang data digabungkan dengan teknologi internet.
- Menggabungkan data mengenai masing – masing pelanggan dan menyediakan tempat penyimpanan terhadap semua pelanggan untuk segmentation modeling, perencanaan pemeliharaan pelanggan, dan analisa penjualan.
- Menghilangkan batasan antara area fungsional dengan menawarkan suatu cara untuk penyesuaian tampilan dari beberapa sumber, dengan demikian memberikan pandangan pada aktivitas.
- Memberikan laporan pada unit operasi multidivisi, multinasional, termasuk trend atau hubungan di dalam semua area seperti merchandising, perencanaan produksi, dan seterusnya.
4.6.1 Multidimensional Database Model
Database multidimensi sering disebut
pusat dari data warehouse, data yang hubungannya sangat kuat dan dapat dilihat
dan dianalisa dari sudut pandang yang berbeda yang disebut dimensi dan juga
menyediakan tempat penyimpanan yang efisien, efektif, dan nyaman serta
pengambilan data yang besar. Data seperti dalam database dianalisa oleh Online
Analytical Processing (OLAP). Dalam model data ini, data disimpan dalam bentuk
array.
Berikut ini beberapa keuntungan yang
diberikan oleh multidimensional database :
- Data dalam basis data multidimensi dapat disajikan dengan mudah.
- Basis data multidimensi lebih mudah dipelihara.
- Basis data multidimensi lebih cepat dari pada relational database dengan adanya tambahan dimensi dan antisipasi terhadap bagaimana data akan diakses oleh pengguna.
4.6.2 Data Mart
Data Mart merupakan versi
scaled-down dari data warehouse yang memfokuskan pada area subjek tertentu.
Data Mart biasa dirancang untuk mendukung kebutuhan bisnis yang unik dari
departemen atau proses bisnis tertentu. Suatu perusahaan dapat memiliki banyak
data mart di mana setiap data mart fokus pada sebagian dari keseluruhan bagian
perusahaan. Butuh sedikit waktu untuk membangun data mart, biaya ringan, dan
tidak begitu rumit. Permulaan yang tidak teliti dari beberapa data mart dengan
yang tidak ada hubungannya satu sama lain untuk data warehouse perusahaan akan
menyebabkan permasalahan.
4.6.3 Data Mining
Data
Mining memberikan pengertian atau arti yang sebelumnya tidak diketahui, prediksi
informasi dari data – data yang dapat diakses dari dalam data warehouse. Tools
Data Mining menggunakan algoritma yang otomatis dan canggih untuk menemukan
pola (pattern) yang tersembunyi, korelasi, dan hubungan antara data. Tools ini
digunakan untuk memprediksi pola atau trend di masa yang akan datang, yang
mengarahkan perusahaan dalam mengambil keputusan.
Data mining mempunyai 5 fungsi utama
:
- Klasifikasi (Classification), menyimpulkan penjelasan karakteristik dari sebuah kelompok tertentu.
- Clusterin, mengidentifikasikan sekelompok item yang berbagi karakteristik tertentu.
- Association, mengidentifikasikan hubungan antara kejadian yang terjadi pada waktu yang sama.
- Sequencing, mirip dengan asosiasi, kecuali hubungan terjadi melampaui batas waktu yang telah ditentukan.
- Forecasting, memperkirakan nilai yang akan datang berdasarkan pola (pattern) yang terdapat di dalam sekelompok besar data.
4.6.4 Text Mining
Merupakan aplikasi dari data mining
untuk file teks yang tidak terstruktur atau kurang terstruktur, lebih berfokus
pada format dokumen daripada isi dokumen. Text Mining membantu organisasi untuk
melakukan hal – hal berikut :
- Menemukan isi yang tersembunyi dari suatu dokumen, termasuk hubungan yang berguna.
- Menghubungkan dokumen – dokumen di antara divisi – divisi yang sebelumnya tidak terperhatikan.
- Mengelompokkan dokumen dengan themes yang sama.
Tidak ada komentar:
Posting Komentar