Data adalah kumpulan fakta seperti angka, deskripsi, dan observasi yang digunakan untuk mencatat informasi. Struktur data tempat data ini diatur sering mewakili entitas yang penting bagi organisasi (seperti pelanggan, produk, pesanan penjualan, dan sebagainya). Setiap entitas biasanya memiliki satu atau beberapa atribut, atau karakteristik (misalnya, pelanggan mungkin memiliki nama, alamat, nomor telepon, dan sebagainya).

Anda dapat mengklasifikasikan data sebagai terstruktur, semi terstruktur, atau tidak terstruktur.
Data terstruktur
Data terstruktur adalah data yang mematuhi skema tetap, sehingga semua data memiliki bidang atau properti yang sama. Umumnya, skema untuk entitas data terstruktur adalah tabular – dengan kata lain, data dihadirkan dalam satu tabel atau lebih yang terdiri dari beberapa baris yang mewakili setiap instans entitas data, dan kolom yang mewakili atribut entitas. Misalnya, gambar berikut menunjukkan representasi data tabular untuk entitas Pelanggan dan Produk.
Entitas Pelanggan:
ID Pelanggan | Nama Pelanggan | Alamat | Kota | Negara | Nomor Telepon |
---|---|---|---|---|---|
001 | Ahmad | Jalan Suka Jaya No. 10 | Jakarta | Indonesia | 08123456789 |
002 | Budi | Jalan Mawar No. 12 | Bandung | Indonesia | 08234567890 |
003 | Charlie | Jalan Merdeka No. 23 | Surabaya | Indonesia | 08567890123 |
004 | Diana | Jalan Kenanga No. 5 | Bali | Indonesia | 08123456781 |
005 | Erik | Jalan Cemara No. 7 | Semarang | Indonesia | 08567891234 |
006 | Fitri | Jalan Anggrek No. 3 | Jakarta | Indonesia | 08123456792 |
007 | Gunawan | Jalan Jambu No. 11 | Yogyakarta | Indonesia | 08567892345 |
008 | Hadi | Jalan Raya No. 4 | Malang | Indonesia | 08123456783 |
009 | Indah | Jalan Melati No. 6 | Bandung | Indonesia | 08234567895 |
010 | Joko | Jalan Cendana No. 8 | Surabaya | Indonesia | 08123456794 |
Entitas Produk:
ID Produk | Nama Produk | Kategori | Harga | Stok |
---|---|---|---|---|
001 | Laptop HP | Elektronik | 10.000.000 | 20 |
002 | Meja Kantor | Furniture | 2.500.000 | 15 |
003 | Sepatu Olahraga | Fashion | 500.000 | 50 |
004 | Kamera Canon | Elektronik | 8.000.000 | 10 |
005 | Buku Fiksi | Buku | 100.000 | 100 |
006 | Mouse Wireless | Aksesoris Komputer | 200.000 | 30 |
007 | Kemeja Pria | Fashion | 300.000 | 25 |
008 | Printer Epson | Elektronik | 3.000.000 | 8 |
009 | Sepeda Gunung | Olahraga | 5.000.000 | 5 |
010 | Gitar Akustik | Alat Musik | 2.000.000 | 12 |
Data semi terstruktur
Data semi-terstruktur adalah informasi yang memiliki beberapa struktur, tetapi yang memungkinkan beberapa variasi di antara instans entitas. Misalnya, meski sebagian besar pelanggan mungkin memiliki satu alamat email, beberapa di antaranya mungkin memiliki beberapa alamat email, dan beberapa di antaranya mungkin tidak memilikinya sama sekali.

Salah satu format data semi-terstruktur yang umum adalah JavaScript Object Notation (JSON). Contoh berikut ini menunjukkan sepasang dokumen JSON yang mewakili informasi pelanggan. Setiap dokumen pelanggan berisi alamat dan informasi kontak, tetapi bidang tertentu bervariasi di antara pelanggan.
Berikut ini adalah contoh sepasang dokumen JSON yang mewakili informasi pelanggan. Setiap dokumen pelanggan berisi alamat dan informasi kontak, tetapi bidang tertentu bervariasi di antara pelanggan:
Dokumen 1:
jsonCopy code{
"nama": "Ahmad",
"alamat": {
"jalan": "Jalan Suka Jaya No. 10",
"kota": "Jakarta",
"negara": "Indonesia"
},
"kontak": {
"telepon": "08123456789",
"email": "ahmad@email.com"
}
}
Dokumen 2:
jsonCopy code{
"nama": "Budi",
"alamat": {
"jalan": "Jalan Mawar No. 12",
"kota": "Bandung",
"negara": "Indonesia",
"kode_pos": "40123"
},
"kontak": {
"telepon": "08234567890",
"email": "budi@email.com",
"whatsapp": "08123456780"
}
}
Keterangan:
- Dokumen 1 dan Dokumen 2 mewakili informasi dari dua pelanggan yang berbeda.
- Pada Dokumen 1, hanya terdapat informasi telepon dan email pada bagian kontak, sedangkan pada Dokumen 2 terdapat informasi tambahan berupa nomor WhatsApp.
- Pada Dokumen 2, terdapat informasi tambahan berupa kode pos pada bagian alamat, sedangkan pada Dokumen 1 tidak terdapat informasi tersebut.
Data yang tidak terstruktur
Tidak semua data terstruktur atau bahkan semi terstruktur. Misalnya, dokumen, gambar, audio, data audio dan video, serta file biner mungkin tidak memiliki struktur khusus. Data semacam ini disebut sebagai data tak terstruktur.

Penyimpanan Data
Organisasi biasanya menyimpan data dalam format terstruktur, semi-terstruktur, atau tak terstruktur untuk merekam detail entitas (misalnya, pelanggan dan produk), peristiwa tertentu (seperti transaksi penjualan), atau informasi lain dalam dokumen, gambar, dan format lainnya. Data yang disimpan kemudian dapat diambil untuk dianalisis dan dilaporkan di lain waktu.
Secara umum, ada dua kategori penyimpanan data yang biasa digunakan:
- Penyimpanan file
- Database
Sumber: https://learn.microsoft.com/id-id/training/modules/explore-core-data-concepts/2-data-formats