Home / Veri Madenciliği / Veri Madenciliği Dersleri 01 – Veri Ambarı Nedir?

Veri Madenciliği Dersleri 01 – Veri Ambarı Nedir?

Veri madenciliği dersleri kapsamında bu ilk derste Veri Ambarı nedir sorusuna cevap vermeye çalışacağız. Veri Tabanı ifadesini bilenler bilir, internet ve yazılım dünyasında veriler veri tabanlarında tutulur. Veri ifadesi kritik bir ifadedir. Veri nedir sorusunu arattığınız zaman, bilginin en küçük parçası, anlamsız bilgi gibi ifadeler göreceksiniz. Bizim Veri Madenciliği ile ilgili derdimiz bilgiye ulaşmaktır. Yani verileri analiz ederek bilgiyi oluşturmak ve bunu daha değişik bir ortamda saklamaktır. Bilgi içeren kayıtları tutan ortama da Veri Ambarı (Data Warehouse) diyoruz.

Veriyi bilgiye dönüştürmenin çeşitli yolları vardır. Bilgi dediğimiz şey değişkendir. Bir banka müşterisine kredi kartı verilip verilmeyeceği, kredi kartı limitinin ne olacağı “bilgidir”. Kişinin harcamaları, geliri ise birer veridir. Biz kişinin gelirine göre kredi kartı verilip verilmeyeceğini analiz etmeli sonucu buna göre belirlemeliyiz. İşte bu noktada veri madenciliği devreye girer. Bankanın kendi politikasına göre kredi kartı sahip olma şartları neler ise gerekli veriler Veri Ambarlarına çekilir ve çeşitli algoritmalar ile hesaplanır. Bu sayede otomatik bir sistem oluşturulmuş olur. Bir kişinin kredi kartı alıp alamayacağına tek tek bakmak yerine veri madenciliği yaparak cevap verilebilmektedir.

Veri Ambarı Nedir?

Kısaca cevap vermiş olsak da bu yazının konusu olan Veri Ambarı nedir sorusuna daha detaylı yaklaşalım. Veri Tabanları genelde yazılımcıların bilgi girişi yapanların kullandıkları bir sistemdir. Veri Tabanlarında veri tutulur, verilerin anlamlı hale gelmesi oldukça karmaşık olabilir. Geleneksel veri tabanları yöntemleri ile çeşitli çözümler sunulabilse de çok büyük veri tabanlarında bu işlem çok ama çok karmaşık bir hale gelebilir. Bu yüzden yöneticilerin ve pazarlamacıların anlamlandırabileceği, daha anlaşılır işlenmiş veriye ihtiyaç ortaya çıkmıştır. İşte bu noktada Veri Ambarı bu ihtiyaca karşılık vermektedir. Veri ambarları en basit şekilde karar destek uygulamaları için tasarlanmış, geliştirilmiş bir ortamdır.

Yukarıdaki görselden de görebileceği üzere okların yönünü takip ederseniz asıl hedef veri madenciliğidir. Veri madenciliği için illa ki Veri Ambarı ihtiyacı yoktur. Ancak kurumsal büyüklükteki firmalarlar, kurumlarda Veri Ambarları önemli bir çözüm sunmaktadır.

Veri Ambarının Özellikleri

  1. Konuya Yöneliktir: Veri Ambarları anlamlı olmalıdır. Belirli bir amaca hizmet etmelidir. Okuyan bir kişi teknik bilgiye sahip olmasa bile anlayabilmelidir.
  2. Bütünleşiktir: Yani bir nevi tutarlıdır da denilebilmelidir. Veri Tabanlarından gelen bilgiler ile uyumlu olmaldır. Aksi taktirde hiçbir işe yaramaz. Buradaki kritik konu veri tipleri ve verinin ifade ediliş tipleridir. Veri Tabanı ile çalışırken bazı veriler değişik şekillerde tutulmuş olabilir. Mesela bir değer bir tabloda true false, başka bir tabloda 1 0 şeklinde tutulmuştur. Bunları Veri Ambarına taşırken tek bir ifade ile taşımanız gerekmektedir. Bütünleşikliğin sağlanması adına gerekli dönüşüm sağlanmalıdır. (Aslında bu sorun veri tabanlarındaki hatalardan ortaya çıkar, kısacası akşam yediğiniz hurmalar baya başınızı ağrıtabilir ancak bütünleşiklik kuralından vazgeçilmemelidir.
  3. Zaman Boyutu: Veri Ambarındaki en önemli konulardan bir tanesi verilerin zaman boyutlarının var olmasıdır. Normal programcılıktaki gibi verinin o anki değeriyle değil, geçmişteki değerleri ile de ilgilenilmektedir. Yıllara göre satış raporları giderleri gibi işlemler için zamansal boyutlu raporlar bulunmaktadır.
  4. Sadece Okunabilir: (Only Readable) Veri Ambarları okunabilir sonuçlar üretir. Yani veriler üzerinde değişiklik yapamaz, güncelleyemezsiniz. Bunu arşivde değişiklik yapmak gibi düşünebilirsiniz. 1984 kitabındaki gibi geçmişi değiştirmeye çalışmakla eşdeğerdir. Veri Ambarları sonuçlar değerlendirilsin diye üretilmiştir, sonuçları değiştirmek için değil. Bu yüzden veri tabanından gelen bilgiler burada sadece işlenmektedir. Ancak değiştirilememektedir.

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir