Teknoloji dünyası hızla değişiyor ve bu değişimle birlikte, veri ile ilgili kavramlar da daha fazla önem kazanıyor. Veri, bilgi ve büyük veri terimleri, iş dünyasında, teknolojide ve günlük yaşamımızda giderek daha sık duyulan terimler haline geldi. Peki, bu terimler nedir? Bu terimlerin anlamına hep beraber bakalım.

Veri, temel olarak ham ve işlenmemiş bilgilerdir. Veriler, sayılar, metinler, semboller veya görüntüler şeklinde olabilir. Ancak veri, kendisi başlı başına bir anlam taşımaz. Mesela hava sıcaklığı, bir işletmenin günlük olarak yaptığı satışlar, ürün numaraları bunların her biri veridir. Tek başına çok bir anlam ifade etmeyebilir ama bu verileri kullanarak bizler bilgilere ulaşırız. Belirli işlemlerden geçmesi sonucu bilgi elde edilir. Hava sıcaklığının 0°C olduğu bir veri. Bugün hava soğuk, 0°C olduğundan dışarı çıkarsam mont almalıyım yanıma, kar yağabilir, parkta oturulmaz. Bu çıkarımlar ise bir verinin işlenmesi ile oluşan bir bilgiyi ifade eder. Veri ve bilgi arasındaki fark bir örnekle bu şekilde belirtilebilir.

Bilgi, yukarıda verdiğimiz örnekten anlaşılabileceği gibi, verinin işlenmiş, yorumlanmış veya anlamlandırılmış hali olarak tanımlanır. Bu, verinin bir bağlama yerleştirilmesi ve anlam kazanması sürecini içerir. Veri, işlenerek belirli bir bağlamda kullanılabilir hale getirildiğinde bilgiye dönüşür. Örneğin, işletme yukarıdaki satış verilerini analiz ederek belirli bir ürünün belirli bir dönemde ne kadar satıldığını, hangi bölgelerde daha popüler olduğunu ve gelecekteki satış tahminlerini hesaplayabilir. Bu, verinin bilgiye dönüşümünün bir örneğidir.

Bu şekilde baktığımız zaman aslında birçok veri ile karşı karşıya olduğumuzu görebiliriz. Hava durumu veya küçük bir şirketin verilerinin dışına çıkıp büyük şirketlerin, büyük teknoloji şirketlerinin verilerine baktığımızda şunu görürüz ki ellerinde çok fazla veri var. Bir sosyal medya şirketi elinde isim soy isim gibi verilerin dışında, kimlerle etkileşim kurduk, kimin fotoğrafına baktık, ne yorum yaptık, nerede kaç dakika vakit geçirdik, attığımız videolar, fotoğraflar derken depolanacak birçok veri söz konusu oluyor. Bir uçağın uçuşu bile birçok veri depolamakta. Uçakların teknolojilerine göre bu verilerin büyüklükleri değişebilir. Bir yolcu uçağı, bir uçuş sırasında hız, yükseklik, rotasyon açısı, motor performansı, hava durumu verileri, ses kayıtları ve daha fazlasını kaydedebilir. Bu veriler, uçuşun güvenli ve etkili bir şekilde yönetilmesi, hava trafik kontrolü ile iletişim ve uçak bakımı için önemlidir. Bu depolanan veriler birkaç gigabayt ila onlarca gigabayt arasında olabilir. Savaş uçağında ise uçuş verileri, hedef koordinatları, radar ve sensör verileri, görüntü ve video kayıtları, iletişim verileri ve daha fazlası depolanabilir. Bunlar da birkaç terabaytı bulabilir. Bu şekilde birçok veri elde ediliyor her gün. Bu veriler depolanıyor. Bunlar büyük veri dediğimiz kavramı oluşturuyor.

Veri, bilgi ve büyük verinin temel malzemesidir. Bilgi, verinin işlenmesi ve anlamlandırılması sonucu elde edilirken, büyük veri büyük miktarda verinin işlenmesini içerir. Veri işlenir ve bilgi elde edilir. Bilgi büyük veriyi daha anlamlı hale getirir. Veri, bilgi ve büyük veri arasındaki bağı bu şekilde açıklayabiliriz. Şimdi gelelim büyük veriye.

Büyük veri, daha fazla çeşitlilik içeren ve hacmi hızlıca artan verilerdir. Hacmi hızlıca artan diye tarif edildi çünkü uçak için düşünecek olursak, sürekli uçuşlar yapılıyor ve gigabaytlarca belki terabaytlarca veri depolanıyor her gün. Basitçe belirtmek gerekirse, büyük veri, özellikle yeni veri kaynaklarından elde edilen daha büyük, daha karmaşık veri kümeleridir. Bu veri kümeleri geleneksel veri işleme yazılımları ile işlenemeyecek kadar büyük ve karmaşıktır. Ancak bu büyük hacimli verileri bilgiye dönüştürebilirsek, daha önce üstesinden gelemeyeceğiniz iş sorunlarını çözmek için kullanılabiliriz.

Büyük veri, işletmeler, hükümetler ve bilim dünyası için büyük potansiyel taşır. Ancak belirtiğimiz gibi bu tür verilerin analizi ve işlenmesi geleneksel yöntemlerle zor olabilir. Bu nedenle, büyük veriyi işlemek ve anlamlı bilgilere dönüştürmek için özel teknolojiler, araçlar ve yetenekler geliştirilmiştir. Örneğin, Hadoop ve Apache Spark gibi açık kaynaklı çözümler büyük verinin işlenmesi için yaygın olarak kullanılır.

Büyük veri, günümüzde iş dünyası, hükümetler ve bilim dünyası için büyük bir öneme sahiptir. İşletmeler, müşteri davranışlarını anlayarak daha iyi hizmet sunabilir ve rekabet avantajı elde edebilirler. Hükümetler, kamu hizmetlerini daha verimli hale getirebilir ve suçla mücadelede veri analizini kullanabilirler. Bilim dünyası, büyük veri analiziyle daha önce çözülemeyen sorunlara ışık tutabilir.

Büyük veri her ne kadar yararlı kullanılabilecek olsa bile bazı sorunlar mevcuttur. Bu kadar veriyi saklamak için büyük depolama alanları gereklidir. Bu verileri kategorize etmek daha zordur, güvenliği önemlidir. Bu verileri işlemek için donanım, yazılım yatırımlarına iyi para ayırmak gerekebilir. Tabi bunlar bizi çok ilgilendirmiyor elimizde büyük veri olmadığını düşünecek olursak.

 Günün sonunda sosyal medya platformlarında her bir hareketiniz veri olarak kaydediliyor. Sadece sizin değil milyonlarca insanın verisi kaydediliyor ve büyük veri elde ediliyor. Bu büyük veri işlenip anlamlı bilgiler elde edilmeye çalışılıyor.

Tabi şunu hatırlatmakta fayda var. Veri büyük olsun olmasın işlenip bilgi elde edilebilir. Sizin Ahmet’in profiline girip, birkaç fotoğrafına baktığınız bilgisi bir büyük veri havuzuna dahil oluyor ama özelde sizin hakkında bir bilgi veriyor. Ahmet’in profiline baktınız ama neden? İşte buradaki bu veriyi bir yazılım değil belki bir insan analiz ediyor, işliyor. Ve buradan doğru veya yanlış bir bilgi üretiyor. Ve bu bilgiye göre size ithamlarda bulunuyor. Hani Ahmet ile küstün? Profilinde vakit geçirmişsin demek ki küs değilsin. Belki bu bilgi yanlış ama bunu ispatlamanız gerekiyor artık. Ahmet ile küs olduğuna dair bir mesaj bulup göstermen gerekiyor belki. Öyle bir mesaj yoksa o itham kalıyor. Yani;

Ne kadar az veri o kadar az bilgi. Ne kadar az bilgi o kadar az itham.