Bir veritabanı , genellikle bir tema veya etkinlikle ilgili yapılandırılmış, yarı yapılandırılmış veya ham veri veya bilgileri depolamayı ve almayı mümkün kılar ; bunlar farklı nitelikte olabilir ve az çok birbiriyle bağlantılı olabilir.
Verileri çok yapılandırılmış bir biçimde ( örneğin ilişkisel veri tabanı ) veya yapılandırılmamış ham veri biçiminde ( örneğin NoSQL veritabanları ile) saklanabilir . Bir veritabanı aynı yerde ve aynı bilgisayar ortamında yer alabilir veya birkaç yerde birkaç makineye yayılabilir.
Veri tabanı, bilgi toplama, biçimlendirme, depolama ve kullanma bilgisayar sistemlerinin merkezinde yer alır . Cihaz, bir veritabanı yönetim sistemi (kısaltma: SGBD ) içerir: veritabanını yöneten ve içeriğine erişimi yönlendiren bir motor yazılımı . Bu tür cihazlar aynı zamanda uygulama yazılımını ve bilgiye erişim ve bilginin kullanımına ilişkin bir dizi kuralı da içerir.
Bilgisayarların en yaygın kullanımlarından biri veri işlemedir . Veritabanları örneğin finans , sigorta , okul , epidemiyoloji , kamu yönetimi (istatistikler dahil) ve medya sektörlerinde kullanılır .
"Veritabanı" olarak adlandırılan birkaç nesne bir koleksiyon şeklinde bir araya getirildiğinde buna veritabanı denir .
Bir veritabanı, bilgi üretmek için bilgisayar araçlarıyla yeniden işlenebilen, sayılar, tarihler veya sözcükler gibi verileri depolayan bir "kapsayıcıdır" ; örneğin, bir dizin oluşturmak için bir araya getirilen ve sıralanan sayılar ve adlar . Yeniden ifadeler tipik olarak bul, seç, sırala, grupla ve birleştir işlemlerinin bir birleşimidir .
Verilerin toplanmasını, depolanmasını, yeniden işlenmesini ve kullanımını yöneten bir bilgi sisteminin veya bir veritabanı sisteminin (veya basitçe veritabanının ) merkezi parçasıdır . Bu cihaz genellikle motor yazılımını (bir sonraki paragrafa bakın), uygulama yazılımını ve bilgiye erişim ve bilgi kullanımına ilişkin bir dizi kuralı içerir.
Veritabanı yönetim sistemi veritabanı yapısını işleyen ve içinde saklanan verilere erişim yönlendiren programlar paketidir. Bir veritabanı, bir dosya koleksiyonundan oluşur; içerik işleme isteklerini alan ve dosyalar üzerinde gerekli işlemleri yapan VTYS üzerinden erişilir. İşlemlerin karmaşıklığını gizler ve içeriğin sentetik bir görünümünü sunar. DBMS, birkaç kullanıcının içeriği aynı anda değiştirmesine izin verir ve aynı veri kümesi üzerinde farklı görünümler sunabilir.
Veritabanlarının kullanımı, bir uygulamanın verileri uygulama tarafından manipüle edilen dosyalara yerleştirdiği geleneksel veri depolama yöntemine bir alternatiftir . Bilgi paylaşımını kolaylaştırır, bilginin tutarlılığının ve fazlalığının otomatik olarak kontrol edilmesini, bilgiye erişimin sınırlandırılmasını ve ham bilgiden özet bilginin daha kolay üretilmesini sağlar. Veritabanının birleştirici bir etkisi de vardır: Veritabanı kullanan bir toplulukta, tek bir kişi - veritabanı yöneticisi - veritabanının içeriğini tüm topluluk için faydalı olacak şekilde düzenler. topluluk üyeleri.
Bir veritabanı genellikle daha fazla disk alanı gerektirir, DBMS tarafından sunulan geniş işlev yelpazesi, işlemeyi daha karmaşık hale getirir ve arızaların daha geniş bir etkisi vardır ve kurtarılması daha zordur.
Verilerden yapılan kullanım, bir veritabanından diğerine farklılık gösterir. Veritabanları, kullanıcı sayısına, özellikle zayıf veya güçlü bir şekilde yapılandırılmışsa içerik türüne ve ayrıca veri tabanının kullanımına, özellikle operasyonel kullanıma veya analitik kullanıma göre sınıflandırılabilir. amaçlar :
Veritabanları, kullanıcı sayısına göre sınıflandırılabilir - tek, küçük bir grup veya hatta bir şirket. Tek bir kullanıcının hizmeti için kişisel bir bilgisayara bir ofis veritabanı kurulur. Oysa kurumsal bir veri tabanı , yüzlerce kullanıcıya hizmet veren güçlü bir bilgisayara kurulur. Merkezi bir veritabanı tek bir konuma kurulurken, " dağıtılmış bir veritabanı " birden çok konuma yayılmıştır.
Veritabanlarını sınıflandırmanın en popüler yolu, kullanımlarına ve içeriğin zamansal yönüne göredir:
operasyonel temeller veya OLTP ( çevrimiçi işlem işleme ) kullanıcıların günlük aktiviteleri takip etmelerine yardımcı olmayı amaçlamaktadır. Özellikle, faaliyet çerçevesinde gerçekleştirilen her bir işlemle ilgili bilgileri anında saklamayı mümkün kılarlar: satın almalar, satışlar, rezervasyonlar, ödemeler. Bu tür uygulamalarda vurgu, yanıt hızına ve aynı anda birden fazla işlemin gerçekleştirilmesine yöneliktir. OLAP olarak da bilinen analiz tabanları (İngilizce çevrimiçi analitik işlemeden ) istatistik ve tahmin elde etmek için üzerinde büyük çaplı operasyonların yapıldığı ölçümler gibi tarihsel bilgilerden oluşur . Veritabanları genellikle veri depoları (İngilizce datawarehouse operasyonel bir veritabanı için günlük olarak geçmiş verilerin büyük miktarda toplamak için kullanılan) veri tabanı. Veritabanının içeriği, yönetimde kullanılanlar gibi zamansal evrim ve istatistik analizlerini gerçekleştirmek için kullanılır . Bu tür uygulamalarda, çok karmaşık işlemleri gerçekleştirme yeteneğine vurgu yapılır ve motor yazılımı (DBMS) esasen bir analiz motorudur .Veritabanları bazen içerik özelliklerine göre de sınıflandırılır:
Sabit diskler , yığın depolama büyük kapasiteli, içinde icat edildi 1956 . Sabit diskin icadı, bilgisayarların büyük miktarda bilgiyi bir önceki ortama göre daha esnek ve verimli bir şekilde toplamak, sınıflandırmak ve depolamak için kullanılmasını mümkün kıldı: manyetik bant .
Veritabanı terimi ilk olarak 1964'te bir askeri bilgi sisteminin farklı kullanıcıları tarafından paylaşılan bir bilgi koleksiyonuna atıfta bulunmak için ortaya çıktı .
İlk hiyerarşik veritabanları 1960'ların başında ortaya çıktı . Bilgiler iki hiyerarşi düzeyine bölünmüştür: bir düzey, veritabanındaki çeşitli kayıtlarda aynı olan bilgileri içeriyordu. Kırpma daha sonra bir ağaç diyagramı şeklini alacak şekilde genişletildi.
1965 yılında Charles Bachman , bugün hala kullanılmakta olan Ansi / Sparc mimarisini tasarladı . In 1969 , o içindeki ağ veri modeli oluşturduk CODASYL konsorsiyum hiyerarşik modeli uygun olmadığı için bilgisayar uygulamaları için. Charles Bachman , 1973'te "veritabanı teknolojisine olağanüstü katkıları" nedeniyle Turing Ödülü'nü aldı .
In 1968 , Dick oluşturulan Seçim Pick, bir işletim sistemi , bir içeren "çok-değerli" veritabanı yönetim sistemi (MV RDBMS).
In 1970 , Edgar F. Codd onun matematiksel tezi belirtildiği ilişkisel cebir birimlerin bir dizi bir karşılaştırılabilir olduğunu ailesinden belirleyici bir ilişki matematik ve Var katılır Kartezyen ürünler . Bu tez, ilişkisel veritabanlarının kökenindedir. Edgar F. Codd , 1981'de Turing Ödülü'nü aldı .
İşletme-ilişki modeli tarafından icat edilmiştir Peter Chen içinde 1975 ; ilişkisel veritabanlarındaki verilerin organizasyonunu netleştirmeyi amaçlamaktadır.
1990'da, müşterilerin bilgisayarlarında, başlangıçta disketlerde ve daha sonra CD-ROM'da (Rene Janray'den sorumlu) aylık güncellemeler içeren LEADERS yasal veritabanı Belçika'da piyasaya sürüldü. 2000 yılında Kluwer şirketine satıldı. Bu arada, en önemli mağaza ve şirketler de dahil olmak üzere yaklaşık 1.000 müşteri topladı. ISAT'ta bu ürüne odaklanan bir çalışma sonu tezi, The Leaders Database: A Breakthrough in the World of Electronic Legal Publishing başlığını taşıyordu . 1998'de, veri tabanlarına ayrılmış bir kitapta, MARABOUT yayıncısı LEADERS veri tabanına bütün bir bölümü ayırdı.
İlişkisel modelde, ilişki bir tablodaki tüm bilgileri belirtirken, varlık-ilişkilendirme modelinde ilişki, ilgili bilgileri içeren iki tablo arasında var olan mantıksal bağlantıyı belirtir.
İlk veritabanları delikli kartların sunumuna dayanıyordu : sabit genişlikte satırlara ve sütunlara bölünmüş. Böyle bir dağıtım, programlama nesnelerinin saklanmasını zorlaştırır ; özellikle, nesne yönelimli programlamanın özelliği olan varlıklar arasında mirasa izin vermezler .
Ortaya çıktı 1990'larda , nesne ilişkisel veri tabanları nesnelerin saklama izin verirken, bir ilişkisel veri modelini kullanır. Bu veritabanlarında, nesnelerin miras ilişkileri, ilişkisel modelin varlıkları arasındaki ilişkilere eklenir.
Bir veritabanının yaşam döngüsündeki kilit aşamalar, tasarım ve devreye almadır.
Tasarımdan önce, bilginin özellikleri, bilgiler arasındaki ilişkiler ve veri tabanını barındıracak bilgisayar sisteminin özellikleri hakkında bilgi sahibi olmak için bilgi kullanıcıları ve üreticileri ile görüşülür. Bu adımın amacı, uygulamadaki bilgilerin özelliklerini ve kullanıcıların ihtiyaçlarını bir araya getirmek ve bunları veritabanı yöneticileri tarafından olduğu kadar kullanıcılar tarafından da anlaşılabilir şekilde basit bir şekilde formüle etmektir.
Daha sonra, varlıklar, nitelikler ve ilişkilerden oluşan bir diyagram şeklinde bilgi ve ilişki ağının genel bir diyagramı oluşturulacaktır . En iyi bilinen DCM ( Kavramsal Veri Modeli ) olan farklı veri modelleme yöntemleri vardır . Bu, özellikle , bir bilgi sisteminin tüm verilerinin, tüm aktörleri (ürün yöneticisi, geliştirici, bilgilendirildiyse müşteri…) tarafından anlaşılabilir şekilde yapılandırılmış bir diyagramının oluşturulmasına izin verir .
Bu plan daha sonra DBMS'nin komut dilinde formüle edilmiş talimatlara dönüştürülür ve veritabanının yapısını oluşturmak ve çalışır hale getirmek için talimatlar yürütülür.
Bir veri tabanının iç organizasyonunu - fiziksel veri modelinin - tanımlanması, oluşturulmasındaki son adımdır. Bu işlem, her şeyden önce , mantıksal veri modeline karşılık gelen kayıtların tanımlanmasından oluşur . Kayıtlar dosyalarda saklanır ve her dosya tipik olarak bir grup benzer kayıt içerir. Bu adım sırasında, verilerin bütünlüğünü garanti ederken, yeterli veri işleme hızıyla sonuçlanan bir model elde etmek için çeşitli teknikler kullanılır.
Fiziksel veri modelinin kalitesi , veritabanı işlemlerinin hızı üzerinde büyük bir etkiye sahiptir. Basit bir iyileştirme, veri işlemlerini 50 kat daha hızlı hale getirebilir; bu, büyük miktarda veri olduğunda daha da belirgin olan bir farktır. Erken 2000'lerin çeşitli terabaytlarca (10 içeren veri tabanları vardı 12 veri ve kimin iş Müşterilerin sadece onların veritabanlarını hızlandırmak bağımsız mühendis).
İşletime alındıktan sonra, izleme operasyonları, şemada değişiklik gerektirebilecek sorunları tespit etmeyi mümkün kılar. Kullanıcı ihtiyaçlarının değişmesi durumunda da değişiklik yapılabilir.
Bir veritabanının dahili organizasyonu - fiziksel veri modeli - verileri bulmak ve işlemek için VTYS tarafından kullanılan mantıksal veri modeline, işaretçilere ve etiketlere karşılık gelen kayıtları içerir . Kayıtlar dosyalarda saklanır ve her dosya tipik olarak bir grup benzer kayıt içerir. Dahili organizasyon, veri bütünlüğünü sağlarken, veri manipülasyonunda yeterli hıza ulaşmayı amaçlayan çeşitli teknikler kullanır.
Verilerin mantıksal organizasyonu, fiziksel organizasyonlarından bağımsızdır. Bu, tablolardaki kayıtlar biçimindeki organizasyonları etkilenmeden dosyalardaki verilerin konumunun tamamen değiştirilebileceği anlamına gelir. DBMS, dosyaları işlemleri hızlandıracak şekilde düzenler ve veritabanı yönetim sisteminin tasarlandığı donanım ve işletim sistemine bağlı olarak farklılık gösterir . Kayıtlar tipik olarak , boyutları donanım ( sabit sürücüler ) için en uygun boyutla hizalanan kümeler (İngilizce kümesi ) halinde gruplanır .
Fiziksel veri modelinde kullanılan ana teknikler dizinler, gerçekleştirilmiş görünümler ve bölümlemedir. Veri depolama genellikle RAID aygıtları tarafından yapılır ve DBMS, karma tabloları, B ağaçları, bitmapler veya ISAM dosyaları gibi teknikleri kullanır:
dizin Bir indeks verileri bir dizi veri arama işlemlerini hızlandırmak için tasarlanmaktadır. İndeksin yapısı, her bir işaretçinin bu değere sahip verileri bulmayı mümkün kıldığı işaretçilerle ilişkili değerleri içerir. Gerçekleştirilmiş görünüm Bir de materialized görünümde bir arama / toplanmasının sonucu birden çok kez kullanılmasına izin ve zamandan tasarruf veritabanına kaydedilir. Bu teknik özellikle analitik veri tabanlarında ve OLAP uygulamalarında kullanılmaktadır . bölümleme Bölümleme tekniğinde , DBMS, verileri birkaç sabit sürücü arasında dağıtır ve bu, her bir sabit sürücü tarafından gerçekleştirilen iş miktarını azaltarak işlemleri hızlandırır. RAID (İngiliz Yedekli pahalı olmayan disk dizisinden ) RAID tekniğinde, bir donanım aygıtı, verileri birkaç sabit sürücü arasında dağıtarak işlemleri hızlandırır ve bir arıza durumunda bilgi kaybını önler. Bu donanım aygıtı, sıradan bir sabit sürücü gibi bir yazılım tarafından kullanılır ; Hash tablosu (İngilizce hash'te ) Bu organizasyonda, aritmetik hesaplama ile herhangi bir değeri bir tamsayıya dönüştürmek için bir hash fonksiyonu kullanılır. Elde edilen sayı, bu değerin verilerinin kaydedileceği tam konumu belirlemek için kullanılır. B ağacı Mil B bir yapıdır ağaç tüm dalları aynı uzunluğa sahiptir ve her bir düğüm N / 2 ve N dalları arasında yer alır. Bu, indeksler için çok sık kullanılan bir yapıdır. bit eşlem Bitmap dizinleri genellikle yalnızca birkaç olası değerin olduğu veriler için kullanılır (örnek: cinsiyet M / F, haftanın günü vb.). Verinin olası değerlerinin her biri için dizin, N. verinin söz konusu değere sahip olması durumunda N. bitin "1" olduğu bir bit tablosu içerir . ISAM ( Dizine alınmış sıralı erişim yöntemi ) Bu organizasyonda kayıtlar, birincil anahtara göre sıralı olarak, silindirlere ve sabit boyutlu parçalara bölünmüş bir yapıda saklanır . Her parça, yeni kayıtların eklenmesine izin vermek için boş bir alana sahiptir. Bir ağaç yapısı, anahtar değeri ve her bir izin ilk kaydına bir işaretçi içerir. Gazete Bir günlük veritabanı üzerinde gerçekleştirilen son operasyonların listesini içerir. Bu günlük, veritabanı motoru tarafından, örneğin bir bilgisayar çökmesi durumunda veya işlemler bir hata içeriyorsa, işlemleri geri almak için kullanılır. Ayrıca bkz . BT işlemi .Bir veritabanı yönetim sistemi, veritabanlarının içeriğini yöneten bir dizi yazılımdır. Kayıt bulma, ekleme veya silme ( Oluştur , Oku , Güncelle , Kısaltılmış CRUD'yi Sil ), dizinleri işlemek , veritabanları oluşturmak veya kopyalamak gibi sıradan işlemleri gerçekleştirmek için kullanılır .
Veritabanı yönetim sisteminin mekanizmaları, veritabanlarının içeriğinin tutarlılığını, gizliliğini ve dayanıklılığını sağlamayı amaçlar. Yazılım, daha önce yetkilendirilmemişse, bir kullanıcının bilgileri değiştirmesine veya silmesine izin vermeyi reddedecektir; veritabanında mevcutsa ve bir benzersizlik kuralına tabiyse , kullanıcının bilgi eklemesini reddedecektir ; ayrıca ilişkisel veritabanlarında başvuru bütünlüğü kuralları gibi tutarlılık kurallarına uymayan bilgileri saklamayı reddedecektir .
Veritabanı yönetim sistemi, bir veritabanında yapılan her değişiklikle dizinleri otomatik olarak uyarlar ve her işlem, veritabanında bulunan bir günlüğe yazılır , bu da bir bilgisayar çökmesi durumunda işlemin kendisinin iptal edilmesine veya sonlandırılmasına izin verir ve böylece tutarlılığı garanti eder. veritabanının içeriği.
2009 yılı itibariyle IBM DB2 , Oracle Database , MySQL , PostgreSQL ve Microsoft SQL Server piyasadaki ana veritabanı yönetim sistemleridir.
Veritabanları, daha optimum güvenlik için kullanıcılarına sunucularda, İnternet üzerinden veya yerel sunucularda giderek daha fazla sunulur . Erişim az çok güvenlidir.
Bazı veri üreticileri (özellikle yerel yetkililer) veritabanlarının bir kısmını herkesin kullanımına ücretsiz olarak sunmaktadır. Yasal olarak sahip oldukları veya dağıtma yetkisine sahip (örneğin fotoğraflar) saklamacıları oldukları verilere bu durumda ücretsiz bir lisans altında erişilebilir (ör. CC-BY-SA ) veya bazen tüm veritabanının kendisine ücretsiz bir lisans altında erişilebilir. lisans ( örneğin ODBL ). Bu lisanslar , kaynak göstererek yeniden kullanım ve dönüştürmeye izin verirken, içerikler üzerindeki fikri mülkiyetin korunmasını mümkün kılar . Diğer birçok farklı lisans, az ya da çok kısıtlayıcıdır.
Bilgisayarların en yaygın kullanımlarından biri veri işlemedir. Bilgiye dayalı hizmetler sunan finans, sigorta, eğitim, kamu yönetimi ve medya sektörleri, bilgi toplumunun ana sektörleri veri tabanlarını kullanır. Pratik kullanım alanları arasında envanterler (stoklar, mağazalar, kütüphaneler), rezervasyon araçları (uçak uçuşları, sinema vb.), ruhsatlandırma (sürücü, avcılık, köpek sahibi)…), İnsan kaynakları, ücretler, endüstriyel üretim ( üretim makineleri genellikle bilgisayarlıdır), ayrıca muhasebe ve faturalandırma.
Tıbbi kayıtlar, vergi kayıtları veya silah taşıma izinleri gibi idari bilgileri toplamaya yönelik bilgisayar uygulamaları veri tabanlarından yararlanır.
Bilgisayarlı bir biletleme bilgisayar uygulamasında , seyahat veya konser biletleri bir veri tabanına kaydedilir.
Gelen muhasebe veya hazine yazılımı , girdileri yanı sıra veritabanına kaydedilir hesap planı; Rapor a, rapor veritabanı içeriğinin otomatik sentez ile elde. Benzer şekilde, bir bilgisayar uygulaması bilgisayar destekli üretim yönetimi (Rep. PAAG), stok durumu, personelin mevcudiyeti ve zaman bir veritabanına kaydedilir ve bir planlama raporu için temel sağlar .
Tıbbi teşhis yardım yazılımında , bir veri tabanına bir dizi patoloji ve teşhis kaydedilir. Bir arama motoru , kullanıcı tarafından seçilen patolojilere en uygun teşhisleri çıkarır.
Schengen Bilgi Sistemi polis ve gümrük hizmetleri tarafından kullanılan bir veritabanı uygulamasıdır Schengen bölgesi içinde Avrupa'da (... tutuklama emri, parmak izi, fiyatının yasaklar) toplamak ve adli bilgi alışverişi için.
ITIS , canlı türlerinin (bitkiler, hayvanlar, mantarlar, mikroorganizmalar, vb.) sınıflandırmasının bir kataloğunu içeren bir bilgisayar uygulamasıdır .
Amerika Birleşik Devletleri'ndeki bir istihbarat teşkilatı olan CIA , dünyanın en büyük veri tabanlarından birine sahiptir.
Amazon.com çevrimiçi kitapçı kataloğu , kataloglanmış 250 milyondan fazla kitapla dünyanın en büyük veritabanlarından biridir. Amazon.com ayrıca IMDb film veritabanına da sahiptir .
Kütüphaneler, özellikle üniversite kütüphaneleri, hedef kitlelerine veritabanlarına erişim sağlar. Bunlar genellikle harici hizmet sağlayıcılar tarafından sağlanan dijital kitaplar ve/veya genel veya özel basından makaleler içeren veri tabanlarıdır. Örneğin, Ulusal Bilgi Bilimleri ve Kütüphaneleri Okulu ( enssib ) kütüphanesi , kullanıcılarına A'dan Z'ye (basın), Cairn (basın ve e-kitaplar), Dawsonera (e-kitaplar) dahil olmak üzere 76 veritabanına erişim sunar. Électra (bibliyografik veritabanı), vb. Bazıları açık erişimli ve ücretsiz, diğerleri sadece yerinde erişim, diğerleri ise yerinde ve uzaktan erişim. Ek olarak, okul (enssib), bilgi bilimleri ve kütüphanelerdeki profesyoneller topluluğuna daha iyi hizmet vermek için kendi veritabanlarını üretir ve çevrimiçi hale getirir: 1992'den beri Fransız kütüphane inşaat üssü , Staj ve iş teklifleri service de l'enssib, Base Maguelone: Tipografik süslemeler veritabanı.
Gelen coğrafi bilgi sistemleri, eşleme bilgileri bir veritabanında kaydedilir. Gökyüzü haritalama bilgileri yıldız kataloglarında mevcuttur .
Haber grubu veya e-posta yazılımında mesajlar genellikle bir veri tabanına kaydedilir.
Virüsten koruma yazılımı genellikle bilgisayar virüslerinin bıraktığı parmak izlerinin depolandığı bir veritabanı kullanır .
Kayıt ayarları içeren bir veritabanı yapılandırması içinde işletim sistemleri , Windows . Nesne Veri Yöneticisi benzer bir veritabanı AIX işletim sistemleri .
Elektronik belge yönetim yazılımında elektronik belgeler bir veri tabanında saklanır. Bir içerik yönetim sisteminde, bir web sayfasının parçaları bir veritabanında saklanır ve e- ticaret yazılımında bunlar reklamlar ve reklam verenlerdir.
Bir e-öğrenme platformunda alıştırmalar, sınavlar, müfredat ve ayrıca öğretmen ve öğrenci dizini bir veritabanında saklanır.
SAP ERP ( SAP AG'den ) gibi bir ERP , tümü aynı veri tabanını kullanan bir dizi yazılımdan oluşur. Bu tür ürünler gibi çeşitli yazılımlar, faturalandırma , muhasebe , maaş , siparişleri ve envanterleri takip etme gibi olağan ticari işlemlerle ilgilidir .