Teknoloji

Büyük Veri Nedir? • Big Data Analizi

Big Data Nedir?

Banner Reklam

Bu çalışmada big data Türkçe karşılığıyla büyük veri olgusu, big data’nın uygulama alanları, Big data analitiği ve büyük veri güvenliği boyutlarında araştırılmıştır. Bu kapsamda, big data uygulamalarıyla elde edilecek faydalar üzerinde durulmuştur.

Big Data Nedir? • Kısaca

İçeriğinden anlamlı sonuçlar çıkarmak ve gerektiğinde kullanmak üzere, devletler, kurumlar veya şahıslarca pek çok veri toplanmaktadır. Yöneticilerin karar verme aşamasında kullandıkları bilgi, verinin bilgi işlem süreçlerine tabi tutulmasıyla faydalı ve anlamlı bir şekle sokularak verilen kararların başarıya ulaşmasına yardımcı olan değeri, veri ise anlamlı ve yararlı bilgi hâline gelmeden önce işlenmesi gereken bilgisel ham maddeleri ifade etmektedir. Bu bağlamda, veriye dayanan bir yaklaşımla stratejik kararlar vermek, organizasyonların varlığını devam ettirebilmesi ve yenilikçilik temelli rekabet avantajını sürdürülebilir kılmasında büyük önem arz etmektedir.

Bilgisayar ve haberleşme teknolojileri, günümüzde hayatımızın pek çok alanında yer almaya ve insanların yaşama ve çalışma şekillerini değiştirmeye başlamıştır. Bilginin son kullanıcıları, birden fazla cihaz kullanarak veri üretmekte, bu cihazlar da sürekli artan sayıda olayı kayıt altına almaktadır. Kişisel bilgisayarların internetinden nesnelerin internetine (IoT, Internet of Things) geçiş sürecini yaşadığımız son günlerde, RFID (Radio Frequency Identification) ve sensör (algılayıcı) teknolojileri giderek yaygınlaşmaktadır.

Sensörlerden ve nesnelerin internetinden gelen, web sitelerinde, sosyal medyada ve mobil platformlarda üretilen veri ile organizasyonlar bünyesinde yer alan verinin bir araya getirilmesiyle elde edilen veri yığınları, “big data” kavramını ortaya çıkarmıştır. Diğer bir ifadeyle big data, dijital ortamlarda faaliyetlerin artmasıyla giderek daha geniş kitlelere ulaşan çok büyük miktarda veri kümelerini ifade etmektedir. CCTV (Closed Circuit Television) kameralar, GPS (Global Positioning System) ve sensör ağları aracılığıyla kaydedilen veri, dijital metinlerin kullanımıyla artan iletişim platformları, fotoğraf ve blog gönderileri, analiz için büyük miktarda verinin potansiyel olarak hazır olduğu anlamına gelmektedir.

Big data analitiği ile birçok alanda önemli faydalar sağlandığı kabul edilmekteyken, etik düzenlemelerden kullanıcıların gizliliğini ve güvenliğini sağlamak adına geliştirilecek mekanizmalara kadar büyük veriyle alakalı diğer konuların da dikkate alınması gerekmektedir. Çünkü büyük verinin analiz edilme potansiyeli, gizliliğin ihlal edilmesi ve kişisel özgürlük alanlarının kısıtlanması kaygılarını da beraberinde getirmektedir.

Big Data’nın Tarihi

“Big data” kavramı, ilk kez Michael Cox ve David Ellsworth tarafından 1997 yılında düzenlenen 8. IEEE Görüntüleme Konferansı’nda (Proceedings of the 8th Conference on Visualization), “ApplicationControlled Demand Paging for Out-of-core Visualization” adlı makalede kullanılmıştır.

Daha sonra Francis X. Diebold, “Big Data Dynamic Factor Models for Macroeconomic Measurement and Forecasting” adlı çalışmasında büyük verinin, fizik, biyoloji ve sosyal bilimler dâhil olmak üzere, birçok bilim alanında yüz yüze gelinmek zorunda kalınan ve kendisinden yararlanılması gereken bir “fenomen” olarak bahsetmektedir. Buradan hareketle veriye, “çağımızın ham maddesi” denilmektedir. Bu gerçek, doğal olarak WhatsApp, Google, Instagram,Amazon, Twitter ve Facebook gibi dev bilişim şirketlerince en başından beri bilinmekte, hatta bu husus söz konusu şirketlerin kuruluş felsefesinin temelinde yatmaktadır.

Big Data Nedir?

Öncelikle büyük verinin kesin ve sabit bir tanımının bulunmadığını ifade etmek gerekir. Bigdata, geleneksel veri tabanı tekniklerinin kullanılması suretiyle işlenmesi mümkün olmayan, farklı hacimlerdeki heterojen veriyi tanımlayan yeni bir kavramdır ve çeşitli dijital içeriklerden oluşmaktadır. 2012 yılında Davos’taki Dünya Ekonomik Forumu’nda tıpkı para, altın gibi varlıklara ek olarak, yeni bir ekonomik değer olarak “veri” den bahsedilmiştir.

Yapısal Veri (Yapılandırılmış Veri)

Yapısal veri, modellenmesi, girdi olarak sokulması, saklanması, sorgulanması, işlenmesi ve görselleştirilmesi kolay olan tüm veri türlerini ifade etmektedir. Genel olarak, belirli tür ve boyutlarda önceden tanımlı alanlarda sunulmakta, ilişkisel veri tabanlarında veya tablolarda yönetilebilmektedir. Nispeten daha katı ve daha kolay kimliklendirilebilen bir yapıya sahip olan yapılandırılmış veri türünden toplanacak faydalı bilgilerin elde edilmesi diğer veri türlerine kıyasla daha kolaydır.

Yapısal Olmayan Veri (Yapılandırılmamış Veri)

Yapısal olmayan veri, tanımlı bir format haricinde sunulan ve depolanan kayıt türleridir. Daha dağınık ve kimliklendirilmesi daha zor olan veri türünü temsilen tanımlanmıştır. Genellikle, kitaplar, makaleler, belgeler, e-postalar gibi serbest formatlardaki metinlerden ve resim, ses ve video gibi medya dosyalarından oluşmaktadır.

Yukarıdaki açıklamalara göre yapılandırılmış veri ile yapılandırılmamış veri arasındaki temel farkın, yapılandırılmış verinin üzerinde her türlü işlem ve sorgulamanın yapılabileceği, ilişkilerinin kolaylıkla kurulabileceği bir veri tabanı yönetim sistemi üzerinde bulundurulması olduğu görülebilir.

Büyük Verinin Değeri

Rotelle’nın, Ann Winblad’tan aktardığına göre, “Veri, yeni petroldür” ya da Michael Palmer’ın söylediği gibi “Veri, sadece ham petroldür, rafine edilmezse, değeri vardır ama kullanılabilir değildir” ifadeleri gelecekte veriye sahip olanlar ve veriyi iş süreçlerinde daha iyi kullananların çok daha değerli kurumlar/firmalar/kişiler olacaklarını ve bu şekilde rakiplerine karşı ciddî fark yaratacaklarını kastetmektedir. Bu cümleler günümüzde veri ile ilgili en popüler cümlelerdendir ve büyük veri ve veri yönetimi ile ilgili pek çok kaynakta geçmektedir.

Büyük Veri Bileşenleri

Görüldüğü üzere tanımlar çok büyük kesinlik taşımamaktadır. Belki bu kavram zamanla değişecek ve bugünün büyük verisi gelecekte aynı anlama gelmeyebilecektir. Bu yüzden big data kavramının tanımlamasında yardımcı olması için genellikle verinin hacmi, hızı, çeşitliliği, gerçeklik ve değerini ifade eden “5V” (volume, velocity, variety, veracity, value ) notasyonu, yaygın olarak onu diğer veri türlerinden ayıran kavramlar olarak kullanılmaktadır.

big data 5v
Big Data 5v

Çeşitlilik (Variety)

Big data, geniş bir yelpazede herhangi bir türde ve formatta üretilebilmekte ve bu karışık veri türleri arasında standart bir dizi veya kural bulunmamaktadır. Diğer bir ifadeyle çeşitlilik, bir veri kümesindeki yapısal heterojenliği belirtmektedir. Bu heterojen yapının %95’ini ise yapısal olmayan veri oluşturmaktadır. Hattâ bazı büyük web siteleri kullanıcının imlecini nerelerde gezdirdiğinin ve web kullanım bilgilerini bile veri olarak saklamaktadırlar. Bu çeşitlilik hem kendi arasında, hem de alt dallarıyla her geçen gün hızla büyümektedir. Big data ile birlikte günümüzde tüm bu çeşitler iş süreçlerinde de kullanılabilir hale gelmiştir.

Çalışmanın başlarında büyük verinin oluşumunda pek çok noktadan veri toplandığından bahsedilmişti. Bu doğrultuda günümüzde veri sağlayan pek çok araçtan söz edilebilir. Bu bağlamda da karşımıza bir başka yeni kavram olan “Nesnelerin İnterneti” yani “IoT”çıkmaktadır.

Hız (Velocity)

Veri sürekli hareket hâlindedir. Bu bağlamda veri akışının analizi, veri bilimcileri için önemli konulardan biri olmaya başlamıştır. Büyük verinin üretilme hızı çok yüksektir ve her geçen gün bu hız daha da artmaktadır. Bu açıdan bakıldığında veriyi işleyecek, analiz edecek süreçlerin de büyük verinin üretimiyle aynı hızda olması gerekmektedir. Örneğin, coğrafik konum olarak müşterinin nerede olduğuna dayanarak yapılan bir indirim/promosyon teklifi; müşteri o noktadan geçtikten sonra müşteriye ulaşırsa, başarılı olma şansı çok düşebilecektir. Bu da elde edilen verinin anlamsız olmasına neden olabilir.

Günümüz teknolojisiyle verilerin ne hızda üretildiğine örnek olarak, Whatsapp’ta dakikada 41,666,667 mesajın gönderilmesi, Zoom toplantılarında dakikada 208.333 katılımcının ağırlanması, Netflix’te her dakika kullanıcılar tarafından 404,444 saat video izlenmesi, Instagram’da dakika başı 347,222 story atılması verilebilir. Sosyal medya haricinde de veri üretiminin hızına örnek teşkil edecek birçok çalışma alanı mevcuttur. Örneğin, Formula 1 araba yarışında, bir araba üzerinde yer alan 150 sensör vasıtasıyla 20 gigabayt veri üretilmektedir. Benzer şekilde bir jet uçağı uçtuğu her 30 dakikada 10 terabayt veriyi sensörleri vasıtasıyla toplamaktadır.

Büyük verinin üretim hızına bir başka örnek olarak, CERN’de (Conseil Européen pour la Recherche Nucléaire – Avrupa Nükleer Araştırma Kuruluşu) gerçekleştirilen “Büyük Hadron Çarpıştırıcısı” deneyinde sensörler vasıtasıyla saniyede 1 petabayt büyüklüğünde verinin üretilmiş olması verilebilir. İnografi Domo araştırma merkezi tarafından 2020 big datasının 21. yüzyıl insanları hayatında kapladığı alanı gösteriyor. Data never sleeps.

big data never sleep
Büyük Verinin (Big Data’nın) Hayatımızdaki Boyutu

Hacim (Volume)

Big Data problemlerinin başında hacim boyutu gelmektedir. Çünkü veriyi depolama ve veriyeerişim için yenilikçi araçlar gerekmektedir. Örneğin bir doktorun hastasıyla ilgili tuttuğu not birkaç kilobaytlık metin dosyası olarak saklanabilecekken, tetkik için üretilen ham hâldeki görüntü dosyaları birkaç megabayt, manyetik rezonans gibi daha gelişmiş tanılama araçlarının sonuçları ise birkaç gigabayt olabilmektedir. Hastanede gerçekleştirilen ilave test sayısı kadar bu hacmin çoğalacağı düşünüldüğünde, terabayt ve hatta petabayt seviyeleriyle başa çıkmak gerekecektir. Şayet hastanın geçmiş verisinin de analizlerde kullanılması gerekli olursa veri hacminin eksabayt seviyesine gelmesi kaçınılmaz olacaktır.

Big data, artık mevcut veri tabanlarına sığamayacak, geleneksel veri analiz teknikleriyle işlenemeyecek, terabayt ve petabaytlardan çok daha yüksek hacimsel seviyelere ulaşmıştır. Hayatımızın bir parçası ve vazgeçilmezi hâline gelen akıllı telefonlar, IP (Internet Protocol) temelli uzaktan kontrol edilebilen cihazlar ve akıllı sayaç sistemleri gibi birçok donanım, sensörleri vasıtasıyla ürettikleri veriyi çeşitli uygulamalara aktarmaktadır. Dolayısıyla üretilen, depolanan ve iletilen veri miktarında üstel bir artış olmaktadır.

“Digital Universe Study” adlı bir çalışmada, 2020’de ulaşılacak veri miktarının, 2009’dakinin 44 katı olacağı ve yıllık veri hacminin 35 zettabayt seviyesine ulaşılacağı tahmin edilmekteydi -tabii 2019’un sonlarında Covid-19 gibi bir virüsün patlak vermesiyle birlikte dijitalleşme çağının hızlanacağını tahmin edememişlerdi-. 2014 itibarıyla dünya üzerindeki verinin yaklaşık %90’ı sadece son 2 sene içerisinde üretilmişken, her gün 2,5 eksabayt (2.5 kentilyon MB) hacminde veri üretimi gerçekleşmekteydi. 2003’e kadar insanlık tarihinde üretilmiş toplam veri miktarı 5 eksabayt hacmindeyken, günümüzde aynı miktardaki veri sadece 2 gün içerisinde üretilmektedir

Gerçeklik (Variety)

Gerçeklik, büyük verinin ne kadar doğru olduğunu veya güvenilirliğini göstermektedir. Veri, iş kararlarında kullanılabilecek ölçüde güvenilir olmalıdır. Verinin yüksek çeşitlilikte olması, analiz edilen verinin kalitesini ve güvenilirliğini sağlama sürecini zorlaştırmaktadır. Örneğin, sosyal medyada yansıtılan müşteri duyguları, her ne kadar değerli bilgiler içermekteyse de kendi içinde belirsizlikleri barındırabilmektedir. Dolayısıyla kesin olmayan ve belirsizlik içeren veriyle başa çıkma ihtiyacı, belirsiz verinin yönetimi ve veri madenciliği için geliştirilen araçların ve analiz yöntemlerinin kullanılmasıyla ele alınması gereken başka bir yönünü yansıtmaktadır. Bu etapta toplanan verinin doğruluğu ve geçerliliği son derece önem taşımaktadır. Doğru veya geçerli olmayan büyük miktardaki veri, analizler için hem temel teşkil etmeyecek, hem de yanlış yorumlamalara yol açabilecektir.

Toplanan big data istatistiksel hatalara ve yanlış yorumlamalara sebebiyet verebileceğinden, değerli bilginin elde edilebilmesi adına verinin gerçekliği kritik bir öneme sahiptir. Bu aşamada, amaç ve hedeflere uygun olan verinin elde edilmesinde bazı arındırma kontrolleri tesis edilmelidir.

Değer (Value)

Big data, değere dönüşüm için belirli teknoloji ve analitik yöntemler gerektiren, yüksek hacim, hız ve çeşitlilik ile karakterize edilen bilgi varlıklarıdır. Bu tanımdan hareketle büyük verinin değeri, verinin organizasyonlar ve toplum için ekonomik değer yaratabilecek bir anlayışa dönüşmesi ile ortaya çıkacaktır. Orijinal formda alınan veri, genellikle ilk adımda hacmine göre düşük bir değere sahiptir. Ancak bu tür geniş hacimli verinin analiz edilmesiyle yüksek bir değer elde edilebilmektedir. Büyük verinin değeri, birbiriyle ilişkili bireyler ve gruplar hakkındaki veya bilginin kendi yapısıyla alakalı veri parçaları arasında bağlantı kurularak ulaşılabilen örüntülerden elde edilmektedir.

Bilgisayar Veri Birimleri Sıralaması

Kısa YazılışlarıNormal YazılışlarıBoyutlarıİkili Sayı Sistemlerindeki karşılığı
ByteByte =8 Bit23
KBKilobyte =1024 byte210
MBMegabayt =1024 KB220
GBGigabayt =1024 MB230
TBTerabayt =1024 GB240
PBPetabayt =1024 TB250
EBEksabayt =1024 PB260
ZBZettabayt =1024EB270
YBYottabayt =1024 ZB280
Bilgisayar Veri Birimleri Sıralaması

Sırası ile En Küçük Depolama ve Veri Biriminden En Büyük Depolama Birimine Byte ve Katları

Nesnelerin Interneti

Nesnelerin interneti, her gün kullanılan nesnelerin içine çipler, sensörler ve iletişim modülleri yerleştirilerek, kısmen çevrimiçi ağ oluşturmakla, ama bundan da daha çok insanları çevreleyen her şeyi verileştirmekle ilgili bir kavramdır. Başka bir deyişle Nesnelerin interneti; elektronik cihazların (televizyon, buzdolabı, kombi, araba, kolunuzdaki Apple veya Galaxy Watch vb. dahil) kendi aralarında kurdukları iletişim kabiliyetlerini tanımlamak için kullanılan tabirdir.

Bu birbirine bağlı aygıtlar, verileri iletmek, derlemek ve analiz etmek için interneti kullanmaktadırlar. Birbirlerine bağlanan ve birbirleriyle haberleşen bu cihazların artması, veri patlamasına neden olmakta, veri patlaması sonucu büyük veri oluşmakta ve bununla birlikte günümüzde verinin analiz edilmesi ile ilgilide önemli sorunlar doğurmaktadır.

Veri Madenciliği

Data madenciliği, veri ambarlarında saklanan, yararlı olabilecek, aralarında bilinmeyen ilişkilerin olduğu verilerin keşfedilerek, bu verilerin hem anlaşılır hem de kullanılabilir bir şekle dönüştürülmesine yönelik geliştirilmiş yöntemler topluluğudur.

Veri Madenciliği İngilizce-Türkçe Ansiklopedik Bilişim Sözlüğü’nde, “Doğal Dillerin Semantik yapısına dayanarak elektronik metin belgeleri içinde saklı kalmış ilintileri, örüntüleri, stratejik bilgileri, modelleri vb. bulup ortaya çıkarmayı amaçlayan araştırma tekniği” olarak ifade edilmiştir.

Metin Madenciliği

Özellikle web ortamından alınan metin halindeki büyük verinin analiz edilmesinde metin madenciliği çok önemli bir istatistiksel tekniktir. Kimi zaman metin halindeki veriler sosyal medyadan elde edildiğinde buna sosyal medya madenciliği, web üzerinden elde edildiğinde buna web madenciliği gibi tanımlar yapılsa da ve her birinin kendine özgü yöntemleri olsa da, bunların geneli temel olarak veri madenciliği ve metin madenciliğine dayanmaktadır. Belirttiğimiz bu madencilik teknikleri beraberinde büyük veri ile ilgili bazı yapıları da gündeme getirmiştir. Bunlar arasında Doğal Dil İşleme, NoSQL, Google Map Reduce, Hadoop sayılabilir.

Big Data Kaynakları

Bugün düne göre, bugün de yarına göre daha fazla veri kaynağının varlığı söz konusu olacaktır. Akıllı telefonlar, tablet bilgisayarlar, sensörler, tıbbi ekipmanlar, web trafiği kayıtları, elektrikli scooterlar, sosyal ağlardaki etkileşimler ve eczacılık, meteoroloji, simülasyon ve hatta telefon ekranını izleyen gözlerinizin hareketlerini analiz eden sensörler gibi alanlarda faaliyet gösteren bilimsel araştırmalar gibi birçok kaynak, büyük veriyi beslemektedir.

Büyük Verinin Uygulama Alanları

Giyilebilir Teknolojide Büyük Veri Kullanımı ve IoT

Kişisel aktivite ve davranışlarını ölçümleyen bireyler tarafından üretilen veri, kendi kendine ölçüm verisi (self-quantification data) olarak adlandırılmaktadır. Örneğin kişilerin hareketlerini, egzersizlerini izleyen ve buradan elde edilen veriyi akıllı telefon uygulamasına aktararak verinin analiz edilmesini sağlayan bileklikler kendi kendine ölçüm verisi üretmektedir.

Ulaşımda Büyük Veri Uygulamaları ve Nesnelerin İnterneti

Hollanda İstatistik Bürosu, tüm yollarda bulunan sensörlerden gelen verileri toplayarak yolların kullanım oranlarını ortaya çıkartmıştır. Sensörler önünden geçen her aracın tipini (araba, kamyon ve benzeri) ve hızını algılayarak merkezi sisteme bildirmektedir. Yapılan bu çalışmayla ulaşımda alınması gereken önlemler ortaya çıkmaktadır. Projede toplanan veri miktarının yüksekliği sebebiyle büyük veri teknolojileri tercih edilmiştir.

Devlet Hizmetlerinde Big Data Uygulamaları

Devlet hizmetlerinde, her gün petabaytlar seviyesinde veri üretilmektedir. Bu verinin gerçek zamanlı analizi, hükümetlere eğitim kalitesinin artırılması, işsizlik oranının azaltılması, emeklilik imkanının sağlanması, yardımların tüm ihtiyaç sahiplerine ulaştırılması, trafikle ilgili canlı akış verisi temel alınarak trafik yoğunluğunun kontrol edilmesi ve mobil ambulans hizmetlerinin iyileştirilmesi gibi birçok alanda vatandaşlarına katma değerli hizmetler sunma konusunda yardımcı olacaktır. Ayrıca büyük veri analitiğiyle e-devlet portalinde sunulan hizmetlerin etkinliği ve verimliliği artırılabilir. Bu noktada büyük veri, vatandaşlara verilen hizmetlerin hızlı ve güvenilir olmasını sağlayarak, akıllı şehirlerin geliştirilmesinde kilit rol oynamaktadır.

Big Data’nın Güvenlik Boyutu

Big data birçok endüstri kolu ve karar vericiler için muazzam bir yenilik oluştursa da birçok kullanıcı için aynı zamanda büyük güvenlik riskleri barındırmaktadır. Bu riskler, big data araçlarının erişilebilen tüm kaynaklardan toplanan çeşitli veriyi depolaması, yönetmesi, analiz etmesi, görselleştirmesi ve paylaşmasından kaynaklı olarak ortaya çıkmaktadır. Belirli davranışsal verinin keşfedilmesi ve birleştirilmesinden dolayı, internet kullanıcıları başta olmak üzere veri üreten bireyler, hassas bilgilerin ortaya çıkması açısından savunmasız hâle gelmektedir.

Diğer bir ifadeyle büyük veri analitiğinde olması gerekenden daha fazla verinin toplanması mümkün olabilmekte, bu durum da birçok güvenlik ve gizlilik ihlaline sebebiyet vermektedir. Gizli veride güvenlik riskinin artmasından ve bulut bilişim teknolojilerinin benimsenmesinden dolayı veri ortamlarında güvenliğin sağlanması önemli bir konu olarak karşımıza çıkmaktadır. Günümüzde işlem gücü ve depolama alanlarının kolaylıkla temin edilebiliyor ve bulut bilişim teknolojilerinin benimseniyor olması, veri hacmini giderek büyütmektedir. Bu durum, veriyi dış dünyanın erişimine açmakta ve dolayısıyla verinin yanlış ellere geçmesini önlemek adına büyük veri güvenlik önlemlerinin alınmasını gerekli kılmaktadır.

Bir Günde Ne Kadar Veri Üretiliyor?

büyük veri nedir makale
Bir Günde Ne Kadar Veri Üretiliyor • Big Data

Araştırmanın sansasyonel tarafına geçmeden önce üzerinde yaşamımızı sürdürdüğümüz dünya üzerinde insan ırkı olarak internet ile olan ilişkimizi ortaya koymakta fayda olacaktır. İnternet kullanımındaki büyüme istatistikleri bize dünyanın her yerindeki insanların internete giderek daha fazla erişim kazandığını söylüyor. Mantıksal olarak, internet kullanıcılarının ve arama sorgularının sayısı da artıyor. Bu etkileyici bir bilgi büyüme oranı en azından şimdilik.

Dünyada 4,66 milyar aktif internet kullanıcısı bulunmaktadır (Kaynak: Statista). Bu da demek oluyor ki insanların %58.7’sinin internete erişimi var. Yalnızca son iki yılda dünya üzerinde şu ana kadar var olmuş bütün verilerin % 90’ı oluşturuldu. İnternet istatistiklerinin büyümesi, Asya’nın % 50,3 ile dünyada en çok kullanıcıya sahip olduğunu göstermektedir. Buna karşılık, Orta Doğu (% 3,9) ve Okyanusya / Avustralya sadece % 0,6 ile en düşük seviyeye sahiptir.

İçerisinde bulunduğumuz gezegenin her bir günü -yaklaşık olarak 24 saat- Netflix 582 Milyon saat (582.399,360) dizi, film veya belgesel izleniyor. Her gün Instagram’da 500 milyon (499.999,680) stroy paylaşılıyor. Her gün Youtube’da 720 bin (720.000) saat içerik yükleniyor. WhatsApp’ta 60 milyar (60.000,000,480) mesaj gönderiliyor. Bunlar muazzam sayılar, henüz aylarla ve yıllarla çarpılmamış halleri. Biz insanlık olarak çok mu geliştik…

Büyük Veri Nedir? • Big Data Analizi | Özet

Dünyadaki veri boyutunun, çeşitliliğinin ve üretilme hızının artması, Big data kavramının ve teknolojilerinin ortaya çıkmasına sebep olmuştur. Bu bağlamda sosyal medya, pazarlama, sağlık hizmetleri, bankacılık, sigortacılık ve kamu hizmetleri gibi birçok alanda big data analitiğinin faydaları algılanmaya başlanmıştır. Büyük veriden tam manasıyla yararlanabilmek için yapısal veriye ek olarak büyük verinin %95’ini teşkil eden yapısal olmayan verinin de veri analitiği süreçlerine dâhil edilmesi gerekliliği gündeme gelmiştir.

Büyük verinin insanlığa pek çok alanda yararlı olma potansiyeline sahip olduğu bilinen bir gerçekken, kişisel verinin gizliliğini tehlikeye sokabilecek olması da ayrıca ele alınması gereken bir güvenlik zaafı olarak karşımıza çıkmaktadır. İlk başta bir anlam ifade etmeyen veri, farklı veriyle bir araya gelerek gizlilik değeri içeren bir bilgiyi ortaya çıkarabilmektedir. Bu noktada elinde büyük veriyi bulunduranların ve veriyi bilgiye dönüştürme sürecinde başarılı olanların toplumları yönetme kabiliyetini elde edecekleri yadsınamaz bir gerçektir. Veriyi oluşturan biz insanlarken, büyük verinin genelinin sadece birkaç dev arama motoru ve sosyal medya şirketinin elinde bulunuyor olması, akıllara yeni bir olguyu, “bigdata tehdidi”ni getirmektedir. İnsanlığın faydası için veriden yararlanırken, kişisel bilgilerin mahremiyetinin ihlali boyutunda gerek teknik gerekse sosyolojik boyutta güvenlik önlemleri alınmalıdır

Teknik olarak, büyük veri araçlarında öncelikle kimlik tanımlama, kimlik doğrulama, yetkilendirme ve erişimlerin kayıt altına alınması gibi erişim kontrolleri uygulanmalı ve veri iletişiminde şifreleme teknolojilerinden yararlanılmalıdır. Sosyolojik boyutta ise öncelikle ulusal ve uluslararası platformlarda big data olgusu bütün yönleriyle ele alınmalı ve veri gizliliğini ele alan yasal düzenlemeler yapılmalıdır. Ayrıca kullanılan sensörlü araçlarla, akıllı telefonlarla ve internetteki faaliyetlerle hemen her dakika veri oluşturulduğunun bilincinde olarak hareket edilmeli ve bu bağlamda büyük veri farkındalığı, artısı ve eksisiyle topluma kazandırılmalıdır.

Banner Reklam

Muhammed AKAN

Bir mühendis, bir teknoloji manyağı ve bir mükemmeliyet tutkunu. Teknoloji hayranlığının ideal kombinasyonu. Ben Muhammed Akan, iyi bir ülkede iyi bir eğitim aldım. 2016'nın son çeyreğinden 2020'nin Haziran ayına kadar Google Mühendisi olarak çalıştım. Bu unvan ile birçok devlet kurumuna web güvenlik semineri verdim. Şu an üniversite öğrencisi olarak eğitim hayatıma devam ediyorum. İlgimi çeken konular hakkında akademik düzeyde araştırma yapıyor, araştırdıklarımı okuyor, düşünüyor, yazıyor ve paylaşıyorum.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Çerez Bildirimi