Veri Sermayesi ve Datavist – Paul Sonderegger / Oracle – Bölüm 1/2

by Sinan Oymacı 0

>>> Paul Sonderegger ile yapılan röportajın birinci bölümü (1/2) <<<

>>> Paul Sonderegger ile yapılan röportajın ikinci bölümünü (2/2) buradan okuyabilirsiniz <<<

Paul Sonderegger - Oracle - 4Oracle tarafından İstanbul, Türkiye’de düzenlenen “Oracle Büyük Veri ve Analitik Zirvesi” esnasında büyük veri stratejisti Paul Sonderegger ile bu harika görüşmeyi yapma fırsatını bulduk.

Merhaba, Paul. Öncelikle, bize biraz kendinden bahsedebilir misin?

Oracle’da büyük veri stratejistiyim. Oracle’da yaptığım işi; şirketin veri sermayesi ‘Data Capital’ üzerinde yaptığı araştırmaları yönetmek ve veri yönetimi konusunda görev yapan çeşitli ürün gurubu yöneticileri ile işbirliği yaparak, gerek yerinde, gerekse de bulutta yer alan verilerin entegrasyonu, analizi ve uygulamalarını birleştirerek bütün bu teknolojilerin iletişimini sağlamak olarak özetleyebiliriz. Zamanımın büyük bir çoğunluğunu müşterilerimizin, veri dünyası değiştikçe şirketlerin rekabetlerinin nasıl değiştiğini anlamalarını sağlamakla geçiriyorum.

Büyük verinin her şeyi değiştirdiğini söylüyorsunuz. Bize büyük verinin ne olduğunu anlatabilir misiniz? Elde edilmiş olan ne tür veriler büyük veriyi oluşturuyor?

Büyük verinin, onu kullanan şirketler kadar çok ve farklı tarifinin olduğunu söyleyebiliriz. Oracle’ın büyük veri tanımlaması ise çok basit. Günlük faaliyetlerimiz sırasında elde ettiğimiz ve kullandığımız veriyi büyük veri olarak tanımlayabiliriz. Büyük veri, belirli bir teknoloji demek değildir. Oracle tarafından yaratılmış belirli bir çözüm aracı da değildir. Büyük veri olması için belirli bir sayının üzerine çıkmanız ya da belli sayıda farklı verilere sahip olmanız da gerekmiyor.

Büyük veri konusundaki en önemli husus, şirketlerin, günlük işlerini yaparken elde ettikleri, çok farklı tarzdaki verilerden oluşması. Görsel ve işitsel verilerin yanı sıra sayısal kayıtlar da çoklukla elde edilmekte ve tüm bu veriler yeni algoritmalar, analizler ve uygulamalarda kullanılmaktadır.

Sayısal verilerden söz ettiniz. Video kayıtları da bir veri midir?

Olabilir. Ancak, burada küçük ama hassas bir ayrım var. Sayısallaştırma ‘digitization’ ile veriselleştirme ‘datafication’arasında önemli bir fark var. Sayısallaştırmada, analog olan bir şeyi alıp sayısallaştırıyorsunuz. Yani, bir bilgiyi kâğıt üzerine kaydetmiş gibi oluyorsunuz.

Video kaydına gelince, bir video kaydında, bir deneyimi sayısallaştırmış oluyorsunuz. Bunu bir veriye dönüştürmek ise biraz daha çaba harcamanızı gerektiriyor. Kaydı gözden geçirmeniz, parçalara bölmeniz, belki bir takım ses analizleri yapmanız, çok fazla hareketin olduğu veya ses olmayan sahneleri belirlemek gibi. Burada tanımlanan her metadata aslında bir veriselleştirme. Yani, ikisi farklı şeyler.

internette “datavist” diye bir terime rastlıyoruz. Nedir bu, “datavist”?

Datavist, sayısal verileri değerlendirerek analitik konusunda çalışan kullanıcı demek. Şu andaki en büyük eksiklik, veri ile düşünen yöneticiler, sorunları, verileri kullanmak suretiyle çözen müdürler ve sorunların üstesinden gelebilmek için veri kullanan kişilerin azlığı. Bir çok şirketin ihtiyaç duyduğu kişiler ise işte bu tür datavistler. Pazarlama stratejileri konusuna aşina olabilirler, müşteri segmentasyonu konusunu da bilebilirler ama, asıl bilmeleri gereken, ellerindeki veriyi, daha fazla bilgi elde edebilmek için nasıl süzüp, nasıl değerlendirecekleri hususu.

Örneğin, geleneksel pazarlama müdürleri müşteri segmentasyonu konusunda harikadırlar, demografikler ise muhteşemdir, psikografikler insanların neler hissettiklerini hemen çözerler, belirli ürünleri kullandıkça insanların hislerinin nasıl değiştiğini hemen anlayabilirler. Ancak, datavist olan bir pazarlama müdürü, şu Twitter’dan akan veriyi neden değerlendirmiyoruz diyerek işe başlar. Bu sayede de büyük bir veriyi hashtagler ve ürün isimleri vasıtası ile toparlayıverir. bBazı çözümlemeler yaptıktan sonra insanların mesajları arasından elde ettiği bilgilerle bu tweetleri bilgi depoları gibi kullanarak neyi tam olarak istediğimizi anlamamızı sağlamakta kullanır. Datavist yöneticilerin farkı, dünyanın ötesine de bakabilmeleridir, daha önceleri hiç kullanılmamış olanveri kaynaklarını görebilmeleri ve sorunları çözmede bu verileri kullanabilmeleridir.

Bu amaca yönelik yapay zekâ algoritmaları mevcut mu?

Mevcut ve sayıları her geçen gün daha da artıyor.

Peki, yeterli olabiliyorlar mı?

Ne yapmak istediğinize bağlı. Örneğin, Oracle’ın “Büyük Veri Hazırlama Hizmeti” adını verdiği bir ürünü var. Büyük Veri Hazırlama, analiz edilecek veriyi hazırlamaya yarayan bulut bazlı bir hizmet. Yapay zekâ tekniklerinden oluşan bir doğal dil işleme tekniğini büyük verinin üzerinde kullanıyor ve istediğiniz bazı bilgileri topluyorsunuz, örneğin belirli terimlerin ya da gramatik bazı ilişkilerin ortaya çıkarılması gibi. Yani, eldeki veriyi daha kullanışlı bir hale getirmeye yarayan bir tür yapay zekâ.

Aksi takdirde, bütün o tweetleri elden geçirmeniz mümkün değil. Yapay zekâ olmadan bir insanın bunu becerebilmesi olanak dışı, öyle değil mi?

İşte doğru olan da bu. İnsan ölçeklerinin ötesinde veri üretiyoruz. O halde, insan becerilerinin ötesine geçebilmemizi sağlayacak araçlar kullanmamız gerekiyor.

Bir datavistin geleceği, tüm veriyi toparlayan kişi değil de, tüm verinin toparlanarak önüne konulan kişi, yani yönetici olmalıdır.

Datavist, eldeki veriyi analiz edebilmek için doğru soruları soran kişi midir? Bir datavistin en belirgin özelliği nedir?

Datavist kafa yapısı; Bazı yöneticilerde var, veri bilimcilerde de var hatta gazetecilerde de çok var. Eldeki veriyi daha kullanışlı hale getirmek için analiz etmeye geldiğimizde ise, müşterilerimizin aslında insanlardan oluşan takımlar olduğunu görüyoruz. Her takım için ayrı bir beceri setinizin olması gerekiyor.

Genelde karşınızda işi iyi bilen biri vardır ve her zaman yeni bir soru sorabilecek yeteneğe de sahiptir. Ellerinde ne tür verilerin olduğu hakkında fikir sahibidirler ama, programlama becerileri yoktur, hatta istatistiksel veri işleme yetenekleri de yoktur. Kendilerine gerçek dünya ile matematiksel bir ilişki kurmalarını sağlayacak matematiksel yeteneklere sahip bir veri bilimcisine ‘Data Scientist’ ihtiyaç duyarlar. Ancak bu tür insanlar da kod yazmayı sevmezler, hatta veri hazırlığı yapmaktan hiç haz duymazlar. Burada veri mühendisliğini ‘Data Engineer’ yapacak olanlar başka kişilerdir. Veri mühendisleri Python, sql gibi dilleri çok iyi kullanırlar ve verileri, veri bilimcisi için hazırlarlar.

Bu arada, sözünü etmemiz gereken bir üçüncü kişi daha vardır ve bu kişiye de biz öykücü ‘Storyteller’ diyoruz. Bu bambaşka biri olabilir ya da bu üç kişiden biridir ama, bu öykücü dediğimiz kişi, insanların, bu soruyu neden sorduğumuzu anlamamıza yardımcı olan kişidir.

Soruya cevap bulabilmek için bir dataviste ve cevaba güvenebilmeniz için de veriye neler yapıldığını bilmenize gerek bulunuyor. İşte, veri bilimcisi takımlarında bu dört rol karşımıza çıkıyor.

Öykücü’den söz ettiniz. Oracle’da da böyle bir Öykücü pozisyonu var mı?

Oracle’da çalışan bir çok kişi için bu, görevin de ötesinde. Ürün gurubu yöneticilerinde mutlaka olması gerektiğine inandığımız bir özellik. Bir şeyin neden yararlı olduğunu insanlara anlatmanız gerekir. Elbette, ürününüzün ne işe yaradığını iyi bilmeniz gerekiyor. İletişim kurabilmeniz için de neyin önemli olduğunu çok iyi bilmeniz lâzım. Bunu yapabilecek pek çok kişi var bünyemizde.

Paul Sonderegger - Oracle - 5Veri savaşları ‘Data Wars’ ne demek? Büyük Veri ile ilintili mi? Siz bu kavramları kullanıyor musunuz?

Olaya bir başka ışık altında bakalım, veri sermayesi ışığı altında ele alalım.

Büyük verinin büyük bir olay haline gelmesinin ana sebebi; büyük verinin bu kadar çok konuşulmasının ardında büyük bir ekonomik öykünün yatması ve bu öykü’de de, veri sermayesi konusunun yükselişte olmasıdır. İş, yeni sayısal ürünlerin ya da hizmetlerin üretimine gelince, artık verinin, finansal sermayenin yanında yer aldığını görmekteyiz. Bu bir metafor değildir.

Güzel bir metafor olmasına karşın, veri yeni bir petrol, yeni altın değil, yeni bir elektrik değil. Söylediğimiz şey, aslında veri, kelimenin tam anlamı ile ekonomi kitaplarındaki sermaye tarifinin bire bir karşılığıdır. Bu sermayeyi inşa etmek için doğal kaynakları kullandığınızı düşünün, bu araç-gereç de olabilir, finansal sermaye de olabilir. İşte elde ettiğiniz bu veriyi bir ürüne ya da bir hizmete yerleştirmeniz gerekir. Sermaye dediğimiz şey, işte budur. Burada söylediğimiz şey de, veri tüm bu tanımlamaların karşılığıdır.

Örneğin, kendine yeni bir pazar yaratmak isteyen bir perakendecinin finansal sermayeye ihtiyacı vardır. Para lâzımdır. Eğer bu yeni alanda yeni olanaklar yaratmak için envanterlerini büyütmeye yetecek finansal sermayeyi bulamazlarsa, başarılı olamazlar. Benzer şekilde, yine bu aynı perakendeci yeni bir fiyatlandırma algoritması ortaya çıkarmak isterse veya yeni bir tavsiye motoru yapmak isterse ancak yeterli veriye sahip olmazsa, yine başarılı olamaz. Artık veri, yeni sayısal ürünlerin ya da hizmetlerin yaratılmasındaki en olmazsa olmaz ekonomik faktörlerden biri durumunda. Eğer elinizde gerekli veri yoksa, düşlediğiniz hizmeti hiç bir yere ulaştıramazsınız. Özellikle birbirleri ile rekabet içerisinde olan şirketlerin vazgeçilmez bir parçası durumundadır. Yani artık şirketler, bu verileri rakiplerinden önce sayısallaştırıp, verileştirme yarışının içerisindeler.

Örneğin, sağlık ve yaşam sigortası hizmetleri veren şirketler var. Bu sigorta şirketleri, insanların üzerlerinde taşıyabildikleri cihazlar, bilezikler, saatler gibi tüketici elektroniği üreten şirketlerle çok ilgililer. Bu aletleri üreten şirketler, risk analizlerini sigorta şirketlerinden çok daha iyi yapmalarını sağlayacak veriye sahipler ve bu da o tür bir veri sermayesinin elde edilmesi için büyük bir rekabet ortamı yaratmakta.

Büyük veriyi kullanabilen avantajlı duruma geçer. Buna veri savaşları diyebilir miyiz?

Bu, nereden baktığınıza bağlı. Ancak, bu konu doğrudan rekabet gücünüzle ve benzersiz bir değeri benzersiz bir yolla yaratabilme stratejinizle ilgili. Harvard İşletme Okulu’ndan ‘Harvard Business School’ Michael Porter, stratejiyi işte böyle tanımlıyor.

Artık şirketlerin bütün faaliyetlerini rakiplerinden önce sayısallaştırıp, veriselleştirmeyi başarmış olmaları sonucunda birleşiyorsunuz. O halde, verinin kaynağını ele geçirmeleri gerekiyor. Yani, herhangi bir faaliyet siz daha onu kaydedemeden olup, bitiyorsa, o veriyi yakalama şansınız kalmıyor. Asla geri getiremiyorsunuz. Aslında, veri kaynakları konusunda da önemli bir rekabet var.

Bir sonraki adım daha da ilginç, çünkü, veri, daima daha fazla veri üretme eğilimindedir. Elde ettiğiniz verileri kullanmanızı sağlayacak algoritmaları yarattığınızda, bu algoritmalar kendi performanslarını arttıracak veriler yaratırlar ve bunu sistemin içerisine yerleştirerek gelecekteki performanslarının artmasına yol açarlar.

Kişiler arasında mobil ödeme yöntemleri ile çalışan sistemlerdeki dolandırıcılık olaylarını izleyen müşterilerimiz var. Kişiler, cep telefonu kanalı ile herhangi bir ödeme yaptığında bunun doğru mu, sahte bir ödeme mi olduğunu algılayabilen gerçek zamanlı algoritma yazılımlarına sahipler. İşte, başka soruşturma yöntemleri ile asla saptayamayacakları bu sahteciliği, bu yöntemle anında ele geçirip sahtecilik konusundaki veriye sahip olabiliyorlar. Ayrıca, müşteri şikayetleri sonucunda, aslında yasal olup da onların sahte diye değerlendirdikleri verileri de doğrulama olanağına sahipler. İşte bu veri, sisteme geri dönüp, algoritmanın gelecekte aynı yanlışı yapmaması için kendini düzeltmesini sağlamakta. Ve bu şekilde elde edilmiş ve kendi kendini düzeltmiş olan veri ve algoritma sadece o şirkete ait. İşte bu benzersiz birikim, artık elde edilmesi çok zor ticarî bir avantaja dönüşmüş durumda.

Bir sonraki aşamada ise, platformlar artık kazanma eğilimine geçiyorlar. Platform rekabeti bilgi yoğun çalışan endüstrilerde gördüğümüz bir husus. Yazılım gibi, hisse senedi alım satımı yapan şirketler gibi, daha güncel faaliyetler içerisinde olan şirketler sayısallaştırma ve veriselleştirme araçlarını daha yoğun kullanırlar. Ama, platform rekabeti artık gerçek dünya endüstrileri arasında, daha önceleri görülmemiş ölçüde izlenmekte.

Örneğin, tarım işi ile iştigal ediyorsanız, tarlanızın üzerinde uçup bitkilerin resmini çeken ve sonra bu resimlerdeki yeşil tonlarını analiz edip bitkilerin daha ne kadar klorofile ihtiyaç duyduklarını ortaya çıkartabilecek yöntemler var. Size bir reçete verebiliyor. Bu bilgi traktörünüzün arkasına takılmış olan gübreleme cihazına ulaşıyor ve gübrenizin muhteviyatı ve miktarı, yeni gelen bu bilgiye göre değişiyor. İşte traktörünüzün bu yeni durumu sizin sayısal zirai hizmet platformunuz. Çünkü, traktörünüzü üreten şirket, o uçan cihazı üreten şirketle rekabet ediyor. Aynı zamanda gübreleme cihazınızın üreticisi ile de rekabet halinde. Bu, onların alışageldikleri geleneksel bir rekabet yöntemi değil ama artık bundan böyle bu tür bir rekabet yöntemine alışmaları gerekiyor.

>>> Paul Sonderegger ile yapılan röportajın birinci bölümü (1/2) <<<

>>> Paul Sonderegger ile yapılan röportajın ikinci bölümünü (2/2) buradan okuyabilirsiniz <<<

Toplantı sonrası Oracle Büyük Veri Stratejisti Paul Sonderegger ile gerçekleştirdiğimiz İngilizce video röportajı aşağıda izleyebilirsiniz.