Mengidentifikasi Format Data (Terstruktur, Semi terstruktur, Tidak terstruktur)

Data adalah kumpulan fakta seperti angka, deskripsi, dan observasi yang digunakan untuk mencatat informasi. Struktur data tempat data ini diatur sering mewakili entitas yang penting bagi organisasi (seperti pelanggan, produk, pesanan penjualan, dan sebagainya). Setiap entitas biasanya memiliki satu atau beberapa atribut, atau karakteristik (misalnya, pelanggan mungkin memiliki nama, alamat, nomor telepon, dan sebagainya).

Anda dapat mengklasifikasikan data sebagai terstruktursemi terstruktur, atau tidak terstruktur.

Data terstruktur

Data terstruktur adalah data yang mematuhi skema tetap, sehingga semua data memiliki bidang atau properti yang sama. Umumnya, skema untuk entitas data terstruktur adalah tabular – dengan kata lain, data dihadirkan dalam satu tabel atau lebih yang terdiri dari beberapa baris yang mewakili setiap instans entitas data, dan kolom yang mewakili atribut entitas. Misalnya, gambar berikut menunjukkan representasi data tabular untuk entitas Pelanggan dan Produk.

Entitas Pelanggan:

ID PelangganNama PelangganAlamatKotaNegaraNomor Telepon
001AhmadJalan Suka Jaya No. 10JakartaIndonesia08123456789
002BudiJalan Mawar No. 12BandungIndonesia08234567890
003CharlieJalan Merdeka No. 23SurabayaIndonesia08567890123
004DianaJalan Kenanga No. 5BaliIndonesia08123456781
005ErikJalan Cemara No. 7SemarangIndonesia08567891234
006FitriJalan Anggrek No. 3JakartaIndonesia08123456792
007GunawanJalan Jambu No. 11YogyakartaIndonesia08567892345
008HadiJalan Raya No. 4MalangIndonesia08123456783
009IndahJalan Melati No. 6BandungIndonesia08234567895
010JokoJalan Cendana No. 8SurabayaIndonesia08123456794

Entitas Produk:

ID ProdukNama ProdukKategoriHargaStok
001Laptop HPElektronik10.000.00020
002Meja KantorFurniture2.500.00015
003Sepatu OlahragaFashion500.00050
004Kamera CanonElektronik8.000.00010
005Buku FiksiBuku100.000100
006Mouse WirelessAksesoris Komputer200.00030
007Kemeja PriaFashion300.00025
008Printer EpsonElektronik3.000.0008
009Sepeda GunungOlahraga5.000.0005
010Gitar AkustikAlat Musik2.000.00012

Data semi terstruktur

Data semi-terstruktur adalah informasi yang memiliki beberapa struktur, tetapi yang memungkinkan beberapa variasi di antara instans entitas. Misalnya, meski sebagian besar pelanggan mungkin memiliki satu alamat email, beberapa di antaranya mungkin memiliki beberapa alamat email, dan beberapa di antaranya mungkin tidak memilikinya sama sekali.

Salah satu format data semi-terstruktur yang umum adalah JavaScript Object Notation (JSON). Contoh berikut ini menunjukkan sepasang dokumen JSON yang mewakili informasi pelanggan. Setiap dokumen pelanggan berisi alamat dan informasi kontak, tetapi bidang tertentu bervariasi di antara pelanggan.

Berikut ini adalah contoh sepasang dokumen JSON yang mewakili informasi pelanggan. Setiap dokumen pelanggan berisi alamat dan informasi kontak, tetapi bidang tertentu bervariasi di antara pelanggan:

Dokumen 1:

jsonCopy code{
    "nama": "Ahmad",
    "alamat": {
        "jalan": "Jalan Suka Jaya No. 10",
        "kota": "Jakarta",
        "negara": "Indonesia"
    },
    "kontak": {
        "telepon": "08123456789",
        "email": "ahmad@email.com"
    }
}

Dokumen 2:

jsonCopy code{
    "nama": "Budi",
    "alamat": {
        "jalan": "Jalan Mawar No. 12",
        "kota": "Bandung",
        "negara": "Indonesia",
        "kode_pos": "40123"
    },
    "kontak": {
        "telepon": "08234567890",
        "email": "budi@email.com",
        "whatsapp": "08123456780"
    }
}

Keterangan:

  • Dokumen 1 dan Dokumen 2 mewakili informasi dari dua pelanggan yang berbeda.
  • Pada Dokumen 1, hanya terdapat informasi telepon dan email pada bagian kontak, sedangkan pada Dokumen 2 terdapat informasi tambahan berupa nomor WhatsApp.
  • Pada Dokumen 2, terdapat informasi tambahan berupa kode pos pada bagian alamat, sedangkan pada Dokumen 1 tidak terdapat informasi tersebut.

Data yang tidak terstruktur

Tidak semua data terstruktur atau bahkan semi terstruktur. Misalnya, dokumen, gambar, audio, data audio dan video, serta file biner mungkin tidak memiliki struktur khusus. Data semacam ini disebut sebagai data tak terstruktur.

Image showing unstructured data in documents

Penyimpanan Data

Organisasi biasanya menyimpan data dalam format terstruktur, semi-terstruktur, atau tak terstruktur untuk merekam detail entitas (misalnya, pelanggan dan produk), peristiwa tertentu (seperti transaksi penjualan), atau informasi lain dalam dokumen, gambar, dan format lainnya. Data yang disimpan kemudian dapat diambil untuk dianalisis dan dilaporkan di lain waktu.

Secara umum, ada dua kategori penyimpanan data yang biasa digunakan:

  • Penyimpanan file
  • Database

Sumber: https://learn.microsoft.com/id-id/training/modules/explore-core-data-concepts/2-data-formats

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *