Artifica.io

We’re at Crunchbase

Artifica — Tue, 20 Feb 2024 10:43:47 +0000

Artifica is listed at Crunchbase with the pre-seed investment round details. Please check our profile page

Our investment round is announced at egirişim

Artifica — Fri, 16 Feb 2024 07:26:15 +0000

Egirişim, which started with a personal blog with Hilmi Öğütcü in 2012, was incorporated in January 2016 and is a platform where active and current content from the entrepreneurial ecosystem is shared. Within e-entrepreneurship; new and local startups, startups receiving investment, entrepreneurs, investment networks, venture capital investment funds, crowdfunding platforms, open-to-application programs, startup acceleration programs and incubation centers, entrepreneurship competitions, hackathons, etc. is located.

All news and content within e Girişim are taken directly from the source.

Since the day we were founded, we have been in close communication with both the entrepreneurs and the stakeholders of this ecosystem, and we continue to convey to you the information we receive from them, that is, from the source, in the fastest and most accurate way.

Click the link to read the article about our investment round.

E-Ticaret ve Yapay Zekâ Kesişimi

Prof.Çağdaş Hakan Aladağ — Mon, 18 Sep 2023 07:53:03 +0000

E-ticaret, günümüz iş dünyasının en hızlı büyüyen sektörlerinden biri olarak karşımıza çıkmaktadır. İnternetin yaygınlaşması ve dijitalleşme, geleneksel mağazacılık modelini kökten değiştirmiş ve tüketicilerin alışveriş alışkanlıklarını tamamen dönüştürmüştür. Bu büyüme trendi, e-ticaret işletmelerini daha rekabetçi hale getirirken, aynı zamanda onları daha veri odaklı ve analitik düşünmeye zorlamıştır. İşte burada yapay zekâ devreye girmektedir.

Yapay zekâ, e-ticaret sektöründe adeta devrim yaratmış ve işletmelerin veri tabanlı kararlar almasına yardımcı olmaktadır. Örneğin, müşteri tercihlerini anlama, ürün önerileri yapma, stok yönetimi, fiyatlandırma stratejileri ve müşteri hizmetleri gibi kritik alanlarda yapay zekânın kullanımı giderek artmaktadır. Bu teknoloji, büyük veri analizi ve öğrenme algoritmaları sayesinde, her müşterinin benzersiz ihtiyaçlarına ve tercihlerine daha iyi uyum sağlamak için kişiselleştirilmiş hizmetler sunmayı mümkün kılmaktadır. Bunun sonucunda ise müşteri memnuniyeti artmakta ve işletmeler daha fazla satış yapma potansiyeli yakalayabilmektedir. Ayrıca, stok yönetimi ve talep tahmini gibi alanlarda yapay zekâ, işletmelere maliyet tasarrufu sağlayarak verimliliği artırmakta ve kaynakları daha etkili bir şekilde kullanmalarına imkan sağlamaktadır.

Akademik danışmanlığını büyük bir mutlulukla yürüttüğüm Artifica şirketi de e-ticaret alanında yapay zekâ tabanlı güncel ve etkin uygulamalar geliştirmektedir. 8 Ağustos 2023 tarihinde, Artifica şirketi “E-ticarette Yapay Zeka: Geleceğin Trendleri ve Fırsatlar” başlıklı bir webinar etkinliği düzenledi. Şirketin kurucularından ve alanında uzman Sadi Gürsoy ile birlikte benim de konuşmacı olarak katıldığım bu ilgi çekici etkinlikte, günümüz dünyasının en popüler konu başlıklarından e-ticaret ve yapay zekâ konularının kesişiminden bahsetmeye çalıştık. Soru — Cevap şeklinde, konulara örneklerle açıklama getiren ve daha sonra katılımcıların da sorularıyla zenginleşen bu çevrimiçi etkinliğin videosunu YouTube üzerinden de izleyebilirsiniz. İlgili etkinliğin temelinde yer alan soru ve cevapları aşağıda sizlerle detaylı biçimde paylaşacağım. Konuşmanın daha da detaylarına ulaşmak ve katılımcıların sorularının da yer aldığı kısımları dinlemek için aşağıda verilen bağlantıdan, tüm içeriği de izleyebilirsiniz.

E-ticarette neden yapay zekâ uygulamalarına ihtiyaç vardır? Bu uygulamalar gerçekten gerekli midir?

Bu sorunun yanı için öncelikle kısaca tarihsel sürece bakmak gerekir. Ticaret para yokken bile insan yaşamında var olan ve hayatı doğrudan yönlendiren çok önemli bir kavramdı. Halen günümüzde de büyük küçük tüm şirketlerin, devletlerin üzerinde en çok durdukları konuların en başında Ticaret kavramı yer almaktadır. Ekonominin en önemli belirleyici faktörlerinden biridir. Bu nedenle, bugün burada konuşacaklarımız tüm büyük ya da küçük ölçekli ticari kurumları ve hatta büyük devlet kurumlarını çok yakından ilgilendiren konulardır.

Ticaret önceleri değiş tokuş ile sağlanıyordu. Ardından paranın icadı ile büyük bir dönüşüm geçirdi. Bilgisayar teknolojisinin gelişmesiyle çok yakın zamanda da, e-ticaret ile yine çok önemli bir dijital değişime tanıklık ettik. Gelin bu önemli değişimi, her birimizin de mutlaka yaşadığımız, bir örnek üzerinden düşünelim.

Bir müşteri standart bir sokak mağazası veya AVM mağazasına girdiğinde satıcının işi nispi olarak kolaydı. Burada müşteriyi önceden gözlemler, ilgilendiği ürünlere bakar, üstünde olan ürünleri dikkate alır, vücut dili ile ilgili tahminlerini yapar ve alışverişinin amacını sorardı: ‘Kendisi için mi bakıyor hediye mi olacak’, Daha sonra da aklındakileri öğrenmek için soruları sorar ve en uygun ürün veya ürünleri tavsiye ederdi. Müşterinin kafasında soru işareti varsa veya bazı noktalarda ikna edilmesi gerekiyorsa da bu konuda gerekli özeni gösterir ve müşteriye yardımcı olarak satışı kapatırdı. Kısacası satıcı burada müşteriyi segmente yani kategorize eder, kişisel bir hizmet sunar ve tercihine göre de ürün önerir ve satışı gerçekleştirir.

E-ticaretin başladığı ilk zamanlarda, bu kadar lüks maalesef e-ticarette bulunmamaktaydı. Müşteriler genelde e-ticareti kolaylık için seçmekteydi (bugünde bunun böyle olduğu söylenebilir). Akıllarında bir ürün vardı. Eğer bu ürünü internet üzerindeki e-ticaret sitesinden kolaylık ile bulurlarsa satın alırlar bulamazlar ise satın almazlardı. Az önce bahsedilen senaryoda olduğu gibi, e-ticaret ortamında (bilgisayar başında) müşterilere hizmet edecek, destek verecek kimse yoktu. Burada ürünü bulmak da yetmeyebiliyordu, eğer akıllarında ürün ile ilgili bir soru işareti varsa onlara destek olacak, sorularına cevap verip ikna edecek birine ihtiyaçları vardı ama böyle bir yardım bulunmamaktaydı. Bu gibi sebeplerden dolayı fiziki mağazalarda olan müşteri memnuniyeti ve müşteriye sunulan kişiselleştirmenin fazla olması, ister istemez e-ticareti dezavantajlı duruma geçirmekteydi.

İşte tam bu noktada, yapay zekâ yani makine öğrenme yaklaşımları devreye girerek, Ticaret kavramındaki son önemli değişimi günümüzde gerçekleştirmeye başladı. E-ticaret sitesini gezen müşteri sayısının çokluğu ve bu verinin makine öğrenilmesinde kullanılması ile beraber artık daha etkin bir şekilde müşteriler kategorize edilebilmekte, bu kategorilere göre ürün önerme, gezilen ürün için müşterinin aklındaki soruları daha öncekilere bakarak tahmin edip bunların cevaplarını doğru şekilde müşteriye gösterme ve seçtiği ürünlere özel kampanya veya ilgili ürün önererek satışı artırma gibi hizmetler sunulabilmekte. Yapay zekâ algoritmalarının bugün ulaştığı seviye, e ticarette hedeflenen ciro ve karlılıklarının gerçekleştirilmesinde gerçekten çok etkili çözümler üretmektedir. Yani ticarette günümüzde var olabilmeniz için, e-ticarette etkin yapay zekâ uygulamalarıyla yer almanız artık kaçınılmaz bir gerçektir.

Yapay zekâ uygulamaları ile e-ticarette neler yapılmaktadır? Bu yapay zekâ uygulamalarının kullanılması e-ticarette nasıl avantajlar yaratmaktadır?

· Kişiselleştirilmiş Öneriler: Yapay zekâ, müşterinin geçmiş alışveriş geçmişini ve tarama alışkanlıklarını analiz ederek kişiselleştirilmiş ürün önerileri sunabilir. Bu, müşteri memnuniyetini artırır ve sonuç olarak satışlar da artışa neden olur.

· Fiyatlandırma ve İndirim Optimizasyonu: Yapay zekâ, rekabetçi fiyatlandırma ve indirim stratejileri oluşturabilir, böylece en iyi satış sonuçları elde edilebilir.

· Stok Yönetimi ve Tahminler: Yapay zekâ, stok seviyelerini tahmin edebilir ve talep tahminleri yaparak stok yönetimini optimize edebilir. Yapay zekâ uygulamalarından faydalanan satıcılar, verilerden güç alarak ürün geliştirmeden fiyatlandırmaya farklı süreçlerde daha doğru karar verebilir.

· Müşteri Analitiği: Yapay zekâ uygulamaları, müşteri davranışlarını analiz edebilir ve bu verileri kullanarak şirketin pazarlama stratejilerini optimize etmek mümkündür. Potansiyel müşteri hedef kitleleri doğru bicimde tespit edilebilir ve yine bu müşteriye etkin bir bicimde ulaşmak için kullanılabilir.

· Chatbotlar ve Sanal Asistanlar: Yapay zekâ destekli chatbotlar, müşterilere 7/24 destek sağlayabilir, soruları yanıtlayabilir ve hızlı çözümler sunabilir. İnsan Kaynakları

· Güvenlik ve Dolandırıcılık Önleme: Yapay zekâ, sahtekârlığı tespit etmek ve müşteri verilerini korumak için güvenlik önlemleri sağlayabilir.

· Görsel ve Dil İşleme: Yapay zekâ, ürün görsellerini analiz ederek benzer ürünleri bulabilir veya metin tabanlı yorumları anlayarak müşteri geri bildirimlerini değerlendirebilir.

Yapay zekâ uygulamalarının e-ticarette getirdiği avantajlar başlıklar altında toplanırsa:

· Satışların artırılması

· Müşteri hizmetlerinin etkin bir bicimde gerçekleştirilmesi

· Envanter yönetimi

· Site içi müşteri memnuniyeti

· Doğru ürünlerin doğru kişilere gösterilmesi

· Doğru rekabetçi stratejiler üretilmesi

· Güvenliğin ve dolayısıyla şirket itibarının sağlanması

Yapay zekâ uygulamaları e-ticarette gerçekleştirilen Kişiselleştirilmiş Öneriler neyi ifade eder? Bunu gerçekleştirmek e-ticarette nasıl bir avantaj sağlamaktadır?

E-ticaret sitesinden alışveriş yapacak her müşterinin ne istediğini tam bilebilmesini, aradığı ürünün tam adını / model kodunu bilmesini veya almayı düşündüğü ürünün tam olarak kategorisini bilmesini beklemek akılcı bir davranış olmayacaktır. Makine Öğrenimi burada yine devreye girer. Amaç satış yapmak olduğu için ve daha da doğrusu her müşteriye hitap etmek olduğu için, kullanıcıların aradığı her ürün en kısa ve doğru şekilde müşterilere sunulmalıdır. Sonuçta müşteri aradığı ürünü sitede bulursa satın alacaktır. Bulamazsa almayacaktır yani, satış gerçekleşmeyecektir.

Bir e-ticaret sitesinde yapılan aramaların kaydedilmesi, buradan gelen sonuçlardan müşterilerin ürünleri seçmesi ve ardından satın almaya giden süreç makine öğrenmesi için harika bir kaynaktır. Burada bilgi ile oluşturulacak bir makine öğrenmesi algoritması hem müşteriye aradığını daha kolay bulmasını sağlayacak hem de daha etkili önerilerde bulunacaktır. Çünkü eldeki bilgide satın alma verileri de vardır ve bunlar da müşterilere daha çok ürün satın almak üzere öneriler sunmasını sağlamaktadır. Ayrıca günümüzde yapılan çalışmalara bakıldığında arama sonuçları da yapay zekâ ile manipüle edilmekte ve müşteri sitede olmayan bir ürünü bile arasa ona muadil ürünler sunulmaktadır. Üstelik bu sadece e-ticaret tarafında değil örnek vermek gerekirse Netflix tarafından bile kullanılmaktadır. Platformda olmayan bir içerik aradığınızda size onun muadili olduğunu düşündüğü veya eldeki geçmiş verilere bakarak karar verdiği içerikleri önermektedir. Bu iş e-ticaret tarafına uygulandığında ise iki ayrı durum vardır. Olmayan ürünün muadilini sunabileceğimiz gibi, müşteriye bir taraftan da daha çok karlılık sağlayacak aynı işlevi sağlayan farklı bir ürün sunulabilir. Bu şekilde evrimleşmiş algoritmaların birçok site tarafından kullanılmaya başlandığını da görmekteyiz.

Yapay zekâ uygulamaları e-ticarette Fiyatlandırma ve İndirim Optimizasyonu’nda nasıl bir yarar sağlamaktadır?

Online sitelerden alışveriş yapan müşterilerin en büyük hassasiyetleri fiyat konusundadır. Eğer bir ürün fiziki mağaza ile aynı fiyata sahipse, müşteriler genellikle bu ürünü gidip birinci el olarak mağazadan almayı tercih ederler. Ayrıca unutmamak gerekir ki e-ticaret müşterisinin en sevdiği iş satın almaya karar verdiği ürün veya ürünleri farklı sitelerde kıyaslayarak, en uygun fiyata satan güvendiği yerden satın almaktır. Bu konuda işleri fiyat kıyaslama olan birçok firma da hizmet vermektedir.

Makine Öğrenimi tam olarak burada devreye girerek fiyatları dinamik olarak ayarlar. Bu algoritmaların ilk kullanım örneği uçak bileti satan firmalarda başlamıştır. Müşterinin aramalarına, günün saatine, talep ve arama sayısına, rakiplerin fiyatlarına ve müşterinin segmentine göre farklı fiyat opsiyonları oluşturmakta ve fiyatlar sunmaktadır. Bu sayede satışları ve ciroyu artırmaktadırlar. Ki bir sitede satılan ürün sayısının çokluğu ve sitede yapılan aramalar, ürün gezinme sayıları ve rakiplerin de pozisyonları göz önüne alındığında bu işin ne kadar ciddi bir iş yükü ve kompleksite (karmaşıklık) içerdiği gözlemlenebilir. Makine öğrenmesi ise içeride biriken verilerin de artması ile (ki burada büyük veriden söz ediyoruz) gün geçtikçe daha optimize fiyat döngüleri sağlayarak, burada sitelerin ciro ve karlılıklarına katkı sağlamaktadır.

Yapay zekâ, e-ticarette fiyatlandırma stratejilerinde devrim yaratarak işletmelerin dinamik ve kişiselleştirilmiş fiyatlandırma modellerini benimsemelerini de sağlamıştır. Yapay zekâ algoritmaları müşteri davranışı, rakiplerin fiyatlandırması ve piyasa koşulları gibi faktörleri göz önünde bulundurarak ürünler için en uygun fiyatları gerçek zamanlı olarak belirleyebilmektedir. Bu da, işletmelerin gelirlerini en üst düzeye çıkarırken rekabetçi düzeyde kalmalarını sağlar. Ayrıca yapay zekâ, farklı müşteri segmentleri için en etkili fiyatlandırma stratejilerini belirlemek üzere fiyat esnekliğine ilişkin verileri de analiz edebilmektedir.

Stok Yönetimi ve Tahminler için yapay zekâ uygulamaları nasıl kullanılır ve ne gibi avantajlar sağlarlar?

E-ticarette doğru ürünü doğru zamanda sergilemek en önemli satış etkenlerinden bir tanesidir. Tam tersi ise oldukça yüklü zararlara sebep olmaktadır. Günümüz e-ticaret dünyasına baktığımızda ortada çok büyük sayıda ürün ve sipariş verisi bulunmaktadır ve bu da her gün artmaktadır. Bu yoğun trafik ve büyük veri hacmi insan olarak analizi imkânsız hale getirmektedir. Yapay zekânın bir kolu olan makine öğrenmesi burada devreye girer. Sipariş ve müşteri verisinden trendleri tahmin edebilmekte, buna uygun olan ürünleri belirleyebilmekte ve doğru zamanda tedarikini sağlayacak analizler yapabilmektedir. Bu sayede e-ticaret siteleri en doğru satın alma kararlarını vererek, talep olan ürünler için doğru fiyat ve zamanlama sunmakta ve satışlarını artırmaktadırlar.

Verimli envanter yönetimi e-ticaret işletmeleri için çok önemlidir ve yapay zekâ bu yönetim şeklini de oldukça güçlendirebilmektedir. Makine öğrenimi algoritmaları sayesinde yapay zeka, envanter seviyelerini optimize etmek için geçmiş satış verilerini, mevsimsel eğilimleri ve pazar talebini analiz edebilir. Bu, işletmelerin depolama maliyetlerini azaltmasına, stok kesintilerini en aza indirmesine ve sorunsuz bir tedarik zinciri sağlamasına yardımcı olur. Yapay zekâ uygulamaları, talebi doğru bir şekilde tahmin ederek işletmelere müşteri beklentilerini karşılama ve kârlılığı artırma gücünü de sağlar.

E-ticarette yapay zekâ uygulamalarının getirdiği avantajlardan biri olan Müşteri Analitiğinden biraz daha detaylı bahsedebilir mi?

Mağazadan alışveriş yapacak bir müşteri içeriye girdiğinde, tecrübeli bir satış personeli müşterinin davranışlarından ve sorduğu sorulardan çok kolay bir şekilde ilgilendiği ya da ilgilenebileceği ürünü tahmin eder, buna göre ona önerilerde bulunur, aklındaki soru işaretlerini giderir ve alışveriş yapmasını sağlayabilir. Hatta satın alınacak ürün yanında benzer ürünleri de önererek satış tutarını da yükseltebilir.

Online satış tarafında gelindiğinde ise, ürün önerme işlemleri ciroya ciddi oranda katkı yapmaktadır. Üstelik de reklam için bütçe harcamadan yapıldığından dolayı karlılığa katkısı göz ardı edilemeyecek kadar yüksektir. Buradaki küçük ama çok önemli ipucu ise bir satıcı gibi düşünmek ve doğru ürün ile müşterinin karşısına çıkmaktır. Günümüzde makine öğrenmesinin de yaygınlaşması ile birlikte birçok e-ticaret sitesi alt yapı ile birlikte ya da dışarıdan hizmet alarak ürün önerme teknolojilerini kullanmaktadır. Ölçümleme araçlarının da gelişimi ile birlikte bu sayede gerçekleşen ciro artışı ve karlılık da an be an hesaplanabilmektedir. Trend analizlerinin doğru ve hızlı yapılabilmesi aynı zamanda da alışveriş alışkanlıklarının sıkı sıkıya takip edilip analiz edilmesi, ürün tavsiyesindeki ürünlerin çok daha etkin ve satın alma tercihine uygun olması bu şekilde sağlanabilmektedir. (McKinsey tarafından) Yapılan bir araştırma göstermiştir ki Netflix üstündeki izlenmelerin %75’i öneriler ile sağlanmaktadır ve daha da ilginci Amazon üstünde yapılan araştırmada ise siparişlerin %35’ini sistem tarafından müşteriye tavsiye edilen ürünler oluşturmaktadır.

E-ticarette yapay zekâ uygulamaları Müşteri İlişkilerinde nasıl bir role sahiptir?

E-ticaret yoğun rekabetin yaşandığı ve müşterinin sadece bir tık ile rakibi tercih ettiği bir mecradır. Dolayısı ile burada en önemli konulardan bir tanesi de müşteri hizmetleri ve müşteri desteğidir. Bir e-ticaret sitesinin sağladığı destek hem itibarını güçlendirir hem de müşterinin tekrarlı alışveriş yapmasını sağlar. İşin geneline bakıldığında, birçok müşteri destek hattını aramaktan, sonu gelmez menüler arasında tuşlamaktan ve destek için gerçek bir insanı beklemekten pek hoşlanmaz. Aynı zamanda müşterilerin mailler atarak destek istemekten, gelen destek takip numaralarından ve daha önemlisi uzun saatler boyunca cevap beklemekten de pek hoşlandıkları söylenemez. Birçoğumuz da buna benzer tatsız tecrübeler yaşamışızdır. Müşterilerin böyle tatsız durumlarla karşılaşması doğal olarak satışları önemli ölçüde düşürecektir.

Diğer taraftan da, firmalar için bir destek departmanı oluşturmak, burası için insan kaynağı istihdam etmek ve süreçleri en etkin şekilde yönetmek oldukça yüksek bir maliyet oluşturmaktadır ve bu da yine karlılığı olumsuz etkilemektedir. Ayrıca cevaplar ve çözümler insanlara bağlı olduğu için hem insanların yetişmesi zaman almakta hem de hizmet kalitesi değişebilmektedir. Yapay zekânın bir kolu olan makine öğrenme sayesinde günümüzde, Chat Bot (sohbet robotları) teknolojileri kullanmaya başlamıştır. Chat botlar, müşteri ile yazışarak sorunu anlayabilir ve hızlı bir şekilde müşterilere cevap verebilirler. Günümüzde özellikle bankalar olmak üzere birçok firmanın, ilk müşteri desteğini chat botlar ile verdiğini görmekteyiz.

E-ticarette en önemli konulardan biri Güvenlik ve Dolandırıcılıktır. Bu konuda yapay zekâ uygulamalarından nasıl yararlanılmaktadır?

E-ticaret sitesi yöneticiler için Chargeback (Müşterinin alışverişe itiraz etmesi ve bankanın gerek müşteri memnuniyeti gerekse de haklı sebepler ile bu ödemeyi müşteriye iade etmesi durumu) tam bir kâbustur. Bir e-ticaret sitesinden ilk kez alışveriş yapan müşterilerin en çok çekindikleri nokta güven konusudur ve buradan satın alacakları ürün / hizmet için kafalarında güvenlik konusunda soru işaretleri vardır.

E-ticaret siteleri maalesef dolandırıcılar karşısında zayıflık gösterebilmektedirler. Bu konuda sistemler 7/24 hizmet verdikleri ve farklı yerden farklı ortamlardan devamlı kullanıcıları online sitelere bağlandıkları için hedef olmaktadırlar. Burada gerçekleşebilecek bir olumsuz işlem öncelikli olarak itibar kaybı yaşatmaktadır. Makine Öğrenimi yine burada devreye girer ve şüpheli olan davranışları tespit eder. Burada kullanıcının tekrarlı hareketlerinden tutun da daha önceki saldırılarda tespit edilen beklenmeyen hareketine kadar her istek analiz edilir ve sahtekârlık (fraud) işlemi gerçekleşmeden bu kullanıcı için engelleme gerçekleştirilir.

Bu yazı Prof. Dr. Çağdaş Hakan Aladağ’ın E-Ticaret ve Yapay Zekâ Kesişimi yazısından alınmıştır.

🛍️ E-Commerce Insights: Top Selling Categories in the US for 2023

Artifica — Fri, 25 Aug 2023 14:47:20 +0000

🥇 Toys, Hobby, and DIY: Unveiling the champions of US online shopping! 💥 This year, the toy, hobby, and DIY category takes the crown with a dazzling forecast of $256 billion in consumer spending. That’s a whopping 27.7% of the anticipated total US e-commerce revenue in 2023.

🚀 With an impressive year-over-year growth rate of 19.1%, this category is on fire, outpacing its 2022 counterpart’s growth of 13.2%. 📈 It’s a testament to the rising trend in creative and hands-on pursuits captivating consumers.

🎈 And the excitement doesn’t stop there! Brace yourselves for the ascent: by 2027, the toys, hobby, and DIY category is projected to shine with a staggering $385 billion in revenue. 🌟

👗 Fashion’s Finest: Right behind, the fashion category sashays into second place, poised to secure $164 billion in 2023.

💡Electronics: follows suit at $131 billion, and beauty, health, personal, and household care, along with furniture, add to the vibrancy of the top five, each contributing $93 billion and $90 billion, respectively.

🌐 Keep your finger on the pulse of e-commerce trends as we witness these categories evolve and flourish!

🙌 You definitely need an accurate category structure and more visibility to be successful in these categories. Before the 4th quarter comes, organize your categories and make your e-commerce site more visible with your SEO-friendly product content.

📌 Try the 14-day free trial now to effortlessly produce product content suitable for your e-commerce store 👇

https://artifica.io/get-a-demo/

What is E-Commerce SEO?

Artifica — Tue, 15 Aug 2023 11:18:05 +0000

One of the most talked about SEO strategies of recent times is E-Commerce SEO. This is the art of optimizing your online store’s website to rank higher on search engine results pages. By strategically using relevant keywords, enhancing site structure, and refining content, you make it easier for potential customers to find your products organically.

Benefits of E-commerce SEO

Why is E-Commerce SEO a game-changer for online retailers? 📈 Let’s break it down:

Increased Visibility: When your store ranks higher in search results, your products are more likely to be discovered by eager shoppers.

Targeted Traffic: E-Commerce SEO attracts users actively seeking your products, leading to higher conversion rates.
Cost-Effective: Compared to paid ads, SEO offers a cost-effective long-term strategy with sustainable results.
Credibility Boost: Higher rankings lend credibility to your brand, making consumers more likely to trust and choose your products.
Improved User Experience: SEO involves optimizing site speed, navigation, and mobile-friendliness, creating a seamless shopping journey.
Competitive Edge: Outshine competitors by appearing at the forefront of search results, capturing the lion’s share of clicks.

Strategy Essentials for E-commerce SEO

Here are some E-Commerce SEO essentials to keep in mind:

Keyword Research: Identify high-intent keywords that resonate with your target audience and integrate them into your product descriptions, titles, and meta tags.
Optimized Product Pages: Craft unique, compelling, and informative product descriptions that highlight benefits and features.

Site Speed and Mobile Optimization: Ensure your website loads quickly and looks great on all devices.
High-Quality Visuals: Use high-resolution images and videos that showcase your products from different angles.
User-Friendly Navigation: Make it easy for visitors to explore your store, find what they need, and make a purchase.

Final Thoughts

E-Commerce SEO is your secret sauce for standing out in the crowded e-commerce landscape. By enhancing your online visibility, driving targeted traffic, and boosting credibility, you’re paving the way for e-commerce success. 🚀 Ready to take your store to new heights? Let’s optimize and soar together!

Start using Artifica today make all those process easy for you. Optimize content to be SEO compatible and make category anaylsis for your products in bulk!

Don’t forget to follow us on your social media accounts👇

Mastering E-Commerce Preparation for Q4

Artifica — Thu, 10 Aug 2023 09:35:11 +0000

As the year progresses, the anticipation for the final quarter grows exponentially in the world of e-commerce. Q4, with its holiday season festivities and grand shopping events, presents a golden opportunity for businesses to make their mark and achieve remarkable success. To ensure your e-commerce venture thrives during this crucial period, it’s essential to have a well-thought-out strategy in place. In this blog post, we’ll explore winning strategies that can help you maximize your e-commerce preparation for Q4 and set the stage for a remarkable season.

🎄 E-Commerce Preparation for Q4: Setting the Stage

With the holiday season fast approaching, the first step in your e-commerce preparation for Q4 is to ensure that your online store is ready to welcome and convert visitors into loyal customers. Here’s how you can achieve that:

🛍️ Ensure Your Website Converts: A seamless shopping experience is paramount to driving conversions. High-quality images, informative product descriptions, and trust-building elements create an environment that encourages visitors to make purchases. Aim for a conversion rate of 2-3%, an achievable target that can significantly impact your sales figures.

🎁 Make it an Unforgettable Experience: Stand out from the crowd by offering an exceptional shopping experience. Fast-loading websites and intuitive navigation are prerequisites for customer satisfaction. Personalized customer service, provided through live chat or AI-powered chatbots, adds a human touch. Elevate the experience by incorporating beautiful packaging and handwritten notes, creating a memorable unboxing moment.

🎄 Gift-Giving Made Easy: Simplify gift-giving for your customers by offering gift wrapping and personalized cards. Showcase the allure of your gifts through engaging social media videos. A well-organized Gift Guide can help customers discover the perfect presents effortlessly, enhancing their shopping journey.

🚀 Start Early for Black Friday: To stand out during the Black Friday and Cyber Monday rush, consider launching your promotions a week earlier. This strategic move can capture the attention of early-bird shoppers and help you avoid the ad frenzy that typically ensues. By being the first to shine, you position your brand as a trendsetter.

🎯 Know Your Audience: Understanding your target market’s financial situation is pivotal. As disposable income might vary, adapt your marketing strategies accordingly. Consider branching out to secondary markets with higher spending capacity. Tailored communication that resonates with your audience’s needs and emotions drives success.

🎉 Clear Old Stock Creatively: Creativity is the key to clearing out slow-moving stock without resorting to site-wide sales. Curate special bundles that combine products, offering value to customers and boosting revenue. This approach not only maintains customer satisfaction but also contributes to a thriving business.

Optimization for Success

🌟 Optimize for Search Engines: To increase your online visibility, focus on search engine optimization (SEO). Implement relevant keywords in product descriptions, meta tags, and blog content. Crafting holiday-themed blog posts can attract organic traffic and engage potential customers, enhancing your online presence.

Conclusion

As the holiday season draws near, e-commerce preparation for Q4 becomes an imperative. By embracing these winning strategies, you can set the stage for a remarkable success story. From converting visitors into loyal customers to offering an unforgettable shopping experience and adapting to your audience’s needs, each strategy contributes to your e-commerce triumph. Remember, early preparation, optimization, and a deep understanding of your customers can make this Q4 a season to remember 🎄🎉

Start using Artifica today make all those process easy for you. Optimize content to be SEO compatible and make category analsis for your products in bulk!

Don’t forget to follow us on your social media accounts👇

Geleceği En İyi Gören Yapay Zekâ Modeli Hangisi?

Prof.Çağdaş Hakan Aladağ — Mon, 07 Aug 2023 14:20:39 +0000

Gelecekte ne olabileceğini tahmin etmek, çok uzun zamandır insanlığı düşündüren, merak uyandıran bir konudur (Aladağ, 2017). “Yarın yağmur yağıp yağmayacağı”, “gelecekte ne zaman büyük bir deprem meydana gelebileceği” ya da “ekonomide ne zaman bir kriz yaşanabileceği” gibi soruların cevapları daima merak uyandırmış ve insanlığı bu ve bunun gibi soruların cevaplarını aramaya yöneltmiştir. Tarihte krallar, padişahlar, devlet adamları, komutanlar ve bilim adamları başta olmak üzere birçok insan geleceği tahmin etmeye çalışmıştır. Bazen bilimsel bir bakış açısıyla, bazen de farklı inançlara göre doğaüstü güçlerle, gelecekte ne olacağı sorusunun yanıtı aranmıştır hep. Hangi yöntemle olursa olsun yapılan gelecek tahminlerine göre, bazen bir ülkenin kaderini belirleyecek ekonomik bir hamle, bazen çok büyük bir savaşın sonucunu şekillendirecek stratejik bir müdahale yapılmıştır. İnsanlık tarihi yapılan gelecek tahminleri doğrultusunda verilen büyük veya küçük kararlarla doludur. (Aladağ, 2009)

Günümüzde, artan teknolojik olanaklar doğrultusunda giderek zorlaşan rekabet koşulları, bireylerin, işletmelerin, kurumların ya da ülkelerin “Gelecekte ne olabilir?” sorusunun cevabını daha büyük bir iştahla araştırmalarına neden olmaktadır. Günümüz rekabet koşullarında, en iyi stratejileri belirleyebilmek için geleceğe yönelik tahminler elde edebilmek amacıyla birçok yöntem geliştirilmiş ve geliştirilmektedir. Gelecek olayları ya da koşulları tahmin etmeye öngörü denir. Farklı disiplinlerden araştırmacılar daha güvenilir öngörüler elde edebilmek için çeşitli yöntemler üretmekte ya da mevcut yöntemleri daha da iyileştirmek için çalışmaktadırlar. (Aladağ, 2009)

Gelecek tahmini elde etmek amacıyla üzerinde en çok çalışılan veri türlerinden biri zaman serileridir. Olayların zaman içinde gözlemlenmesi ile elde edilen ölçümlerin oluşturduğu serilere zaman serileri denir (Günay vd., 2007). Belli bir zaman aralığında, havadaki kirlilik oranı, su tüketimi, elektrik tüketimi, bir ülkeye gelen turist sayısı, bir hastaneye gelen hasta sayısı, kişi başına düşen milli gelir, işsizlik oranı, rüzgâr şiddeti, hava sıcaklığı, borsa değerleri, fiyat tahmini, e-ticaret verileri ve bunlar gibi farklı zaman serileri için öngörüler elde etmek amacıyla çeşitli matematiksel modeller kullanılmaktadır (Tokgozoglu vd., 2021). Zaman serileri öngörü yöntemlerinin temel dayanak noktası, geçmişte gözlemlenen değerler göz önünde bulundurularak oluşturulan modelle gelecek tahminleri yapmaktır (Aladağ vd., 2009). Öncelikle gözlemlenmiş zaman serisi değerlerini en iyi temsil eden istatistiksel ya da makine öğrenme temelli model oluşturulur. Daha sonra oluşturulan bu model kullanılarak gelecek için tahminler elde edilir.

Günümüzde zaman serileri analiz edilip gelecek öngörüleri elde edilirken kullanılan yaklaşımlar, ARIMA gibi istatistik temelli modellerden (Box ve Jenkins, 1970), Yapay Sinir Ağları (Gündoğdu vd., 2016) veya Bulanık Zaman serileri (Güney vd., 2018) gibi makine öğrenme temelli modellere ya da tüm bu modellerin akıllı birleşimlerinden oluşan melez modellere (Aladağ, 2014) kadar büyük bir çeşitlilik göstermektedir. Gün geçtikçe, daha güvenilir öngörüler elde etmek amacıyla çok çeşitli yeni yaklaşımlar literatürde yer almaktadır (Aladağ ve Potas, 2022).

Literatürde geliştirilen bunca çeşitli öngörü yaklaşımları için ortak ve çok önemli bir sorun vardır. Kullanılan öngörü yöntemi istatistik ya da makine öğrenme temelli olsun, herhangi bir bulanık zaman serisi ya da derin öğrenme modeli olsun karşılaşılan en hayati sorun, modelden üretilen öngörülerin gerçeği ne kadar iyi yakaladığının nasıl ortaya konulacağı yani, kullanılan modelin ne kadar güvenilir öngörüler verdiğinin nasıl ölçüleceğidir. Bir başka ifadeyle, en iyi öngörüleri veren modelin nasıl seçileceği en önemli problemdir (Aladağ, 2019).

Herhangi bir zaman serisi için çeşitli modellerin öngörü performansı yani, ne kadar iyi, ne kadar güvenilir öngörüler ürettiği bir performans ölçütü tarafından belirlenir. En iyi öngörü modelinin belirlenmesi çok önemli problem olduğu için literatürde bu konu üzerinde yapılmış birçok çalışma mevcuttur (Aladağ, 2017). En iyi modelin belirlenmesinde yaygın olarak kullanılan bazı performans ölçütleri aşağıda verilmiştir.

Akaike bilgi kriteri (Akaike information criterion, AIC):

AIC, hem modelin uyumunu hem de karmaşıklığını dikkate alarak optimal bir denge sağlamayı hedefler. AIC, 1970’lerde Hirotugu Akaike tarafından geliştirilmiştir. Temel fikir, bir modelin verilere uyum sağlama yeteneğinin, modelin karmaşıklığından ne kadar “maliyetli” olduğunu değerlendirmektir. AIC, hem modelin uyumunu ölçen bir terim hem de modelin karmaşıklığını cezalandıran bir terim içerir.

AIC’nin formülü aşağıdaki gibidir:

AIC = -2 * log-likelihood + 2 * k

Burada, log-likelihood, modelin veriye uyumunu ölçen logaritmik olabilirlik fonksiyonudur. k, modelin serbestlik derecesini temsil eder, yani kullanılan parametre sayısıdır.

AIC, model seçimi için kullanılan bir istatistiksel ölçüdür. AIC değeri, daha düşük olması tercih edilen bir değerdir. Daha düşük AIC değeri, daha iyi bir model uyumunu ve daha az karmaşık bir modeli gösterir. AIC kullanılarak farklı modeller karşılaştırılır ve en küçük AIC değeri olan model tercih edilir.

AIC’nin avantajlarından biri, farklı model türlerini ve karmaşıklıklarını karşılaştırabilmesidir. Ancak AIC, bazen özel durumlar için yanlı sonuçlar verebilir ve gerçek modele tam olarak uymaz. Bu nedenle, model seçimi için tek başına kullanılmamalıdır. Diğer kriterler ve analiz yöntemleriyle birlikte değerlendirme yapmak önemlidir.

Bayesian bilgi kriteri (Bayesian information criterion, BIC):

BIC, veriye en uygun olan modelin hem iyi bir uyum sağlamasını hem de basitlik ilkesine uymasını dikkate alır. BIC, Akaike Bilgi Kriteri’ne (AIC) benzer bir kriterdir, ancak daha fazla parametre içeren modellerin cezalandırılmasında daha kesin bir yaklaşım kullanır. BIC’nin amacı, karmaşık modellerin aşırı uyum yapmasını önlemek ve daha basit modelleri tercih etmektir.

BIC, bir modelin kalitesini ölçmek için iki bileşeni kullanır: uyum terimi ve parametre cezası terimi. Uyum terimi, modelin veriye olan uyumunu ölçerken, parametre cezası terimi modelin karmaşıklığını göz önünde bulundurur. BIC değeri, düşük değere sahip olan modelin tercih edilmesini sağlar.

BIC’nin formülü aşağıdaki gibidir:

BIC = -2 * log-likelihood + k * log(n)

Burada, log-likelihood, modelin veriye uyumunu ölçen logaritmik olabilirlik fonksiyonudur. k, modelin serbestlik derecesini temsil eder (yani, kullanılan parametre sayısıdır) ve n, veri noktalarının sayısıdır.

BIC, model seçimi için kullanılan yaygın bir kriterdir ve genellikle maksimum olabilirlik tahminine dayalı istatistiksel modellerin seçiminde tercih edilen bir ölçüdür. Daha düşük BIC değeri, daha iyi bir model uyumunu ve daha basit bir modeli gösterir.

Ortalama Kare Hatası (Mean Square Error, MSE):

Gerçek değerler ile tahmin edilen değerler arasındaki farkların karelerinin ortalamasıdır. MSE, MAE’ye benzer şekilde tahmin hatalarının büyüklüğünü ölçer, ancak büyük hataların daha fazla ağırlığı vardır. Ayrıca, tahmin edilen değerlerin gerçek değerlere göre hata miktarını ölçer.

Yine MSE, gerçek değerlerle tahmin edilen değerler arasındaki farkların karelerinin ortalamasını alır. Aşağıdaki formülle gösterilebilir:

MSE = (1/n) * Σ(Gerçek Değer — Tahmin Değeri)²

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

MSE, tahmin hatalarının büyüklüğünü ölçer. Karelerin alınması, hataların pozitif veya negatif olmasına bakılmaksızın tüm hataları pozitif değerlere dönüştürür ve büyük hataların daha fazla ağırlığı olduğunu gösterir. MSE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir.

MSE, orijinal veri birimlerinden bağımsız olarak kareli hata miktarını ölçer. Bu nedenle, RMSE (Kök Ortalama Kare Hatası) ile birlikte kullanılarak tahminlerin orijinal veri birimlerinde değerlendirilmesi tercih edilebilir.

MSE, zaman serileri analizinde yaygın olarak kullanılan bir performans ölçütüdür. Ancak, MSE değeri, hataların büyüklüğünün ölçeğine bağlı olarak değişebilir ve farklı veri setleri arasında doğrudan karşılaştırma yapmak için dikkatlice kullanılmalıdır. MSE, diğer ölçütlerle birlikte kullanılarak tahmin modellerinin doğruluğunu değerlendirmek için kullanılır.

Kök Ortalama Kare Hatası (Root Mean Square Error, RMSE):

MSE’nin karekökü alınarak elde edilir. RMSE, tahmin hatalarının standart sapmasını ölçer ve orijinal veri birimleri üzerinde yorumlanabilir. Ayrıca, tahmin edilen değerlerin gerçek değerlere göre hata miktarını ölçer.

Buna ek olarak, gerçek değerlerle tahmin edilen değerler arasındaki farkların karelerinin ortalamasını alır ve sonucun karekökünü alarak hesaplanır. Aşağıdaki formülle gösterilebilir:

RMSE = √((1/n) * Σ(Gerçek Değer — Tahmin Değeri)²)

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

RMSE, ölçeği orijinal veri birimlerinde değerlendirmeyi sağlar. Bu nedenle, RMSE değeri, tahmin modelinin gerçek değerlere göre ne kadar hata yaptığını daha kolay yorumlamamıza yardımcı olur. RMSE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir.

RMSE, özellikle büyük hataların daha fazla ağırlığı olduğu durumlarda kullanışlıdır. Karelerin alınması nedeniyle büyük hataların daha belirgin bir etkisi vardır. Bununla birlikte, RMSE değeri, hataların büyüklüğünün ölçeğine bağlı olarak değişebilir ve bu nedenle farklı veri setleri arasında doğrudan karşılaştırma yapmak için dikkatlice kullanılmalıdır.

RMSE, zaman serileri analizinde yaygın olarak kullanılan bir performans ölçütüdür ve tahmin modellerinin doğruluğunu değerlendirmek için diğer ölçütlerle birlikte de kullanılır.

Ortalama Mutlak Hata (Mean Absolute Error, MAE):

Gerçek değerler ile tahmin edilen değerler arasındaki mutlak farkların ortalamasıdır. MAE, tahmin hatalarının büyüklüğünü ölçer ve düşük bir MAE değeri, daha iyi bir tahmin performansını gösterir. Buna ek olarak, tahmin edilen değerlerin gerçek değerlere göre ortalama hata miktarını ölçer.

MAE, gerçek değerlerle tahmin edilen değerler arasındaki mutlak farkları alır ve bu farkların ortalamasını hesaplar. Aşağıdaki formülle gösterilebilir:

MAE = (1/n) * Σ|Gerçek Değer — Tahmin Değeri|

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

MAE, hataların mutlak değerlerini kullanır, yani pozitif veya negatif hataların önemi arasında ayrım yapmaz. Bu nedenle, MAE, hataların büyüklüğünü doğrudan yansıtır. MAE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir.

MAE, orijinal veri birimlerinde değerlendirilir, bu nedenle tahminlerin orijinal veri birimlerinde anlamlı bir ölçüm sağlar. Aynı zamanda, MAE, büyük hataların etkisini yumuşatır, çünkü mutlak değerler kullanılır.

Ortalama Mutlak Hata Yüzdesi (Mean Absolute Percentage Error, MAPE):

Gerçek değerlere göre tahmin hatalarının yüzdesel farklarının ortalamasıdır. MAPE, tahmin hatalarını orantılı olarak değerlendirir ve ölçeklendirme etkisini azaltır. Tahmin edilen değerlerin gerçek değerlere göre yüzde olarak ne kadar hata yaptığını ölçer.

MAPE, gerçek değerlerle tahmin edilen değerler arasındaki mutlak farkları gerçek değerlere göre yüzde olarak ifade eder ve bu farkların ortalamasını alır. Aşağıdaki formülle hesaplanır:

MAPE = (1/n) * Σ |(Gerçek Değer — Tahmin Değeri) / Gerçek Değer| * 100

Burada n, gözlem sayısını temsil eder ve Σ sembolü, tüm gözlemler için toplamın alındığını ifade eder.

MAPE’nin yüzde cinsinden ifade edildiği unutulmamalıdır. Yüzde olarak ifade edilen bir oran olduğu için, 0 ile sonsuz arasında bir değer alır. MAPE değeri ne kadar düşükse, tahmin modelinin daha iyi performans gösterdiği anlamına gelir. Ancak, MAPE değeri bazen sıfır olan gerçek değerlerden kaynaklanan bölme sorunları nedeniyle sınırlı bir kullanımı vardır. Bu nedenle, MAPE’nin sıfır olan gerçek değerlere karşı hassas olduğunu unutmamak önemlidir.

MAPE, zaman serileri tahminlerinin doğruluğunu değerlendirmek için kullanılan faydalı bir ölçüttür. Ancak, bazen yüzde oranlarının yorumlanması zor olabilir ve mutlak değerlere dayalı ölçütlerle birlikte kullanılması daha geniş bir perspektif sunabilir.

Ortanca Mutlak Hata Yüzdesi (Median Absolute Percentage Error, MdAPE):

MdAPE, tahmin edilen değerlerin gerçek değerlere göre yüzde olarak medyan hata miktarını ölçer. MdAPE, gerçek değerlerle tahmin edilen değerler arasındaki mutlak farkları gerçek değerlere göre yüzde olarak ifade eder ve bu farkların medyanını alır. Aşağıdaki formülle hesaplanır:

MdAPE = Median(|(Gerçek Değer — Tahmin Değeri) / Gerçek Değer|) * 100

MdAPE, yüzde cinsinden ifade edilen bir orandır ve 0 ile 100 arasında bir değer alır. Medyan kullanılması, tahmin hatalarının dağılımında aykırı değerlerin etkisini azaltır ve daha dirençli bir ölçüt sağlar.

MdAPE, MAPE kriterine benzer bir ölçüttür, ancak medyan kullanılarak hesaplandığı için daha dirençli bir ölçüdür. Aykırı değerlerin etkisi daha azdır ve tahminlerin yüzde hata miktarının daha dengeli bir ölçümünü sunar. Diğer performans ölçütleriyle birlikte kullanılarak daha kapsamlı bir değerlendirme sağlar.

Yön Sağlamlığı (Direction Accuracy, DA):

Yön sağlamlığı kriteri, tahmin edilen değerlerin gerçek değerlerin yönünü doğru bir şekilde tahmin etme yeteneğini ölçer.

Zaman serileri analizinde genellikle bir sonraki adımın yönünü tahmin etmek önemlidir. Örneğin, hisse senedi fiyatları üzerinde çalışırken, yatırımcılar gelecekteki fiyat hareketinin yönünü tahmin etmek isteyebilirler. Bu durumda, yön sağlamlığı ölçütü, tahmin edilen yönün gerçek yönle ne kadar uyumlu olduğunu değerlendirir.

Yön sağlamlığı, genellikle doğru yön tahminlerinin toplam gözlem sayısına oranı olarak ifade edilir. Yüzde cinsinden ifade edilen bir orandır ve %0 ile %100 arasında değer alır. Yüzde 50’lik bir yön sağlamlığı, rastgele tahmin etmekle aynı performansı gösterirken, yüzde 100’e yaklaşan bir yön sağlamlığı, tahmin modelinin gerçek yönleri mükemmel bir şekilde tahmin ettiğini gösterir.

Yön sağlamlığı, diğer performans ölçütleriyle birlikte kullanılarak bir tahmin modelinin başarısını daha kapsamlı bir şekilde değerlendirmeye yardımcı olur. Ancak, yön sağlamlığı tek başına yeterli bir ölçüt değildir. Zaman serileri analizinde kullanılan diğer ölçütlerle birlikte değerlendirme yapmak daha sağlıklı sonuçlar elde etmemizi sağlar.

Geleceği tahmin etmek amacıyla yapılan zaman serileri analizlerinde, en güvenilir gelecek öngörülerini üreten modeli seçmek için yukarıda verilen performans ölçütleri sıklıkla kullanılmaktadır. Ek olarak, yukarıda verilen performans ölçütleri dışında da literatürde önerilen yine pek çok çeşitli ölçüt bulunmaktadır. Yukarıda açıklandığı gibi, performans ölçütleri modelin ürettiği tahminler ile bunlara karşılık gelen, gerçekleşen/gözlenen değerler arasındaki farkı yani, hatayı ölçmektedir. Ve dikkat edilirse, her performans ölçütü bahsedilen hatayı farklı bir şekilde hesaplamaktadır. Buna göre, uygulamalarda kullanılan performans ölçütüne göre seçilen en iyi model yani, en iyi öngörüleri vermesi beklenen model değişebilmektedir. Bir başka ifadeyle, aynı veri seti için bile her farklı performans ölçütü farklı bir modeli en iyi model olarak belirleyebilir. Ve literatürde kullanılabilecek onlarca farklı performans ölçütü mevcuttur. Tam bu nokta hayati önemde bir soru ortaya çıkar:

En iyi modeli belirlemek için hangi performans ölçütü kullanılmalıdır?

Bir örnek üzerinde anlatılanları açıklamaya çalışalım. Günümüzün en önemli ve popüler alanlarından olan e-ticaret ile ilgili bir uygulama düşünülsün. Bu önemli uygulama alanında, Artifica yapay zeka yazılım geliştirme şirketiyle (Artifica.io, 2023) üzerinde beraber çalıştığımız bir projeden örnek vermek istiyorum. Örneğin, bir X ürününün fiyat tahmini elde edilmek istensin. Bu amaçla, yapay sinir ağları yaklaşımı kullanılsın. Kullanılacak yapay sinir ağı çeşidine bağlı olarak binlerce yapay sinir ağı modeli belirtilen fiyat tahmini için kullanılabilir. Sözü geçen bu binlerce sinir ağı modelinden hangisinin en iyi olduğunu yani, hangi modelin en iyi tahminleri verdiğini belirlemek amacıyla, her model için performans ölçütü değeri hesaplanır. Ve en az hatayı veren model yani, gerçeğe en yakın sonuçları üreten model X ürünü fiyat tahmini için kullanılır.

Yukarıda özetlenen süreçte, AIC, BIC, RMSE, MAPE, MdAPE ve DA performans ölçütleri kullanılsın. Yukarıda açıklamaları verilen bu kriterler kendilerine göre sağladıkları avantaj ve dezavantajlara sahiptirler. X ürünü fiyat tahmini için denenen binlerce sinir ağı modelini değerlendirmek amacıyla kullanıldıklarında, yapılarındaki farklılıklardan dolayı, hepsi farklı bir sinir ağı modelini en iyi olarak belirleyebilir. Peki bu durumda en iyi sinir ağı modeli hangisidir? Bir başka ifadeyle, hangi performans ölçütüne göre karar vermeliyiz?

Belirtilen bu performans ölçütlerine ait yukarda verilen açıklamalar incelendiğinde, her birinin modelin öngörü hatasını farklı bir açıdan ölçtüğü görülmektedir. Örneğin AIC modeldeki parametre sayısını cezalandırarak hatanın içine dahil eder. Diğer yandan, RMSE gerçekleşen gözlemle modelin ürettiği tahmin arasındaki hatayı doğrudan ölçer. DA ise gerçekleşen gözlemle modelin ürettiği tahmin arasındaki miktar farkını değil, sadece artış azalışların gözlemle karşılık gelen tahmininde aynı şekilde olup olmadığını ölçer. Benzer biçimde, tüm performans ölçütleri gözlemler ve modelin ürettiği tahminler arasındaki uzaklığı farklı bir açıdan ölçmektedir. Buna göre, bu kriterlerin hangisine göre seçim yapılmalıdır?

Aladağ ve arkadaşları (2010, 2008) bu önemli sorunun farkına varmış. Bu problemi geliştirdikleri bir yaklaşımla çözmeyi başarmışlardır. Aladağ ve arkadaşlarının geliştirdiği parlak fikrin arkasındaki nokta şudur: “Her farklı kriter hatayı başka bir açıdan ölçüyorsa, her kriteri kullanarak hatayı farklı farklı açılardan ölçen tek bir kriter geliştirmek.” Buna göre, birçok farklı kriteri aynı anda kullanarak, gözlemler ve tahminler arasındaki farkı aynı anda birçok farklı açıdan ölçebilen yeni bir performans ölçütü geliştirmişlerdir (Aladağ vd., 2010). Geliştirdikleri bu kritere Ağırlıklı Bilgi Kriteri (Weighted Information Criterion) adını vermişlerdir (Eğrioğlu vd., 2008).

Tek bir performans ölçütü kullanıldığında o ölçütün yaklaşımıyla tahmin hataları ölçülürken, WIC kullanıldığında birden çok yaklaşımla tahminlerin hatası hesaplanır ve en iyi model buna göre belirlenir. Şimdi yukarıda verilen örneğe dönüldüğünde, “hangi performans ölçütünü kullanmalıyız” sorusu artık ortadan kalkmıştır. Aşağıda formülü verilen WIC kullanılarak en güvenilir öngörüleri veren yapay sinir ağı modelini belirlemek oldukça basittir.

WIC = w1 AIC + w2 BIC + w3 RMSE + w4 MAPE + w5 MdAPE + w6 DA

Açıkça görüldüğü gibi, WIC farklı tüm performans ölçütlerinin sağladığı farklı bilgiyi tek bir ölçütte toplamayı başarır. Böylece en iyi modelin seçiminde etkin biçimde çalışarak en doğru kararın verilmesini sağlar. Yukarıda her ölçüt karşılık gelen bir wi ağırlığıyla çarpılmaktadır. Aladağ ve arkadaşları geliştirdikleri bu etkin performans ölçütünü ilk tanıttıkları makalede belirtilen ağırlıkları uzmanlığa göre seçmişlerdir (Eğrioğlu vd., 2008). Ancak bu durum WIC ölçütünün objektif çalışamaması anlamına gelebilir. Bu nedenle, Aladağ ve arkadaşları WIC kriterini geliştirerek, çözümlenen veriye göre, wi ağırlıklarını optimizasyon ile kendi belirleyen Uyarlamalı Ağırlıklı Bilgi Kriterini (Adaptive Weighted Information Criterion, AWIC) önermişlerdir (Aladağ vd., 2010). WIC kriterinin yeni versiyonu olan AWIC optimizasyon süreci ile ağırlıklarını da çözümlenen zaman serisine uygun olarak kendi belirleyen, çok etkin bir makine öğrenme performans ölçütüdür.

X ürünü fiyat tahmini için en iyi yapay sinir ağı modelinin belirlenmesi süreci AWIC ile işletildiğinde, X ürünü fiyat verisine uygun şekilde çalışan ve incelenen tüm modellerin hatasını aynı anda birçok farklı açıdan ölçebilen bir performans ölçütü kullanılmış olur. AWIC ölçütüne göre belirlenen en iyi yapay sinir ağı modeli kullanıldığında, gerçeğe en yakın öngörüleri elde etmek de artık mümkün olacaktır.

Bu yazının orjinalini okumak için tıklayınız: https://medium.com/@chaladag/gelece%C4%9Fi-en-i%CC%87yi-tahmin-eden-yapay-zek%C3%A2-modeli-hangisi-bdb1f319362d

Bizi sosyal medya hesaplarınızda takip etmeyi unutmayın!✨

Kaynaklar

Aladağ, Ç.H. (2009) Yapay Sinir Ağlarının Mimari Seçimi için Tabu Arama Algoritması. Doktora Tezi. Hacettepe Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, Ankara, Türkiye.

Aladag, Ç.H., Eğrioğlu, E., Kadılar, C. (2009) Forecasting nonlinear time series with a hybrid methodology, Applied Mathematics Letters 22, 1467–1470.

Aladag, C.H., Egrioglu, E., Gunay, S., Basaran, M.A. (2010), Improving weighted information criterion by using optimization, Journal of Computational and Applied Mathematics, 233, 2683–2687.

Aladag, C.H., Yolcu, U., Egrioglu, E., Eren, B. (2014) Fuzzy lagged variable selection in fuzzy time series with genetic algorithms, Applied Soft Computing, 22, 465–473.

Aladag, C.H., Editor, (2017) Advances in Time Series Forecasting, Volume 2, Bentham Science Publishers Ltd., eISBN: 978–1–68108–528–9, ISBN: 978–1–68108–529–6.

Aladag, C.H. (2019) Architecture Selection in Neural Networks by Statistical and Machine Learning, Oriental Journal of Computer Science and Technology, 12 (3), pp. 76–89.

Aladag, C.H., Potas, N., Editors, (2022) Modeling and Advanced Techniques in Modern Economics, World Scientific, London.

Artifica.io yazılım geliştirme şirketi (2023) https://artifica.io

Box, G.E.P. ve Jenkins, G.M. (1970) Time series analysis: Forecasting and control, San Francisco: Holden-Day.

Egrioglu, E., Aladag, C.H. and, Gunay, S. (2008), A new model selection strategy in artificial neural network, Applied Mathematics and Computation 195, 591–597.

Günay, S., Eğrioğlu, E., Aladağ, Ç.H. (2007) Tek Değişkenli Zaman Serileri Analizine Giriş, Hacettepe Üniversitesi yayınları, ISBN 978–975–491–242–5.

Guney, H., Bakir, M.A., Aladag, C.H. (2018) A Novel Stochastic Seasonal Fuzzy Time Series Forecasting Model, International Journal of Fuzzy Systems, Volume 20, Issue 2, pp 729–740.

Gundogdu, O., Egrioglu, E., Aladag, C.H., Yolcu, U. (2016) Multiplicative Neuron Model Artificial Neural Network Based on Gaussian Activation Function, Neural Computing and Applications, Volume 27, Issue 4, pp 927–935.

Tokgozoglu, K., Aladag, C.H., Gokceoglu, C. (2021) Artificial neural networks to predict deformation modulus of rock masses considering overburden stress, Geomechanics and Geoengineering, pp. 1–17.

Bilgi İstem Mühendisliği (Prompt Engineering) Nedir?

Artifica — Mon, 07 Aug 2023 13:28:55 +0000

Yapay zeka serisinden bir önceki yazımız olan “Makine Öğrenmesinde Doğru Performans Ölçütünü Seçmek: Sınıflama ve Kümeleme Modellerindeki Farklı Ölçütler“den sonra son dönemde çok fazla kişinin arattığı bilgi istem mühendisliği nedir yazısıyla karşınızdayız.

Yapay zeka üzerine ilginiz ne seviyede olursa olsun son birkaç ay içerisinde Büyük Dil Modelleri (Large Language Models) üzerine yapılan çalışmalardan habersiz kalmak neredeyse imkansız.

OpenAI şirketinin ChatGPT-3’ü kullanıma açmasının ardından yapay zeka dünyasında odak tamamen bu konuya kaymış durumda. Kullanıcının istemine uygun bir şekilde metin üretebilen ChatGPT, yapay zeka ile ilgilenen/ ilgilenmeyen herkesin çekti. Sorulan sorulara ve metin üretimiyle alakalı bütün isteklere oldukça doğru cevap verebilmesi, önceki soru/cevapları hatırlayabilmesi sayesinde insanlar yapay zeka ile sohbet edebilme fırsatı buldu.

Bu ilgi üzerine çokça kullanılmaya başlanan ChatGPT, bir rekora imza atarak bildiğimiz tüm yazılımlardan çok daha kısa sürede, sadece 5 günde 1 Milyon kullanıcıya sahip oldu. Ocak 2023 verilerine göre 2 milyar aktif kullanıcısı olan Instagram’ın 1 milyon kullanıcıya 2.5 ayda ulaşabilmiş olması, Chat GPT’nin gelecekte internet erişimi olan herkes tarafından kullanılacağını ortaya koyuyor.

Geçtiğimiz 5 ay içinde ChatGPT kullanıcıları yazılımı pek çok farklı alanda kullandı. Edebi yönünün sınanmasından herhangi bir bilim alanında sorulan sorulara yanıt vermesine, makale yazımından dünyanın en prestijli okullarının sınavına dair soruların sorulmasına kadar birçok konuda başarısı ölçüldü ve neredeyse tüm denemelerde oldukça başarılı sonuçlar üretti. Bu da, insanları bu teknolojiden nasıl faydalanabilecekleri konusunda araştırma yapmaya yönlendirdi.

Büyük Dil Modellerinden uygun ve verimli yanıtlar alabilmek için gönderilen istemin (prompt) doğru şekilde seçilmesi gerekiyor. Doğru bir istem belirlemek için de bu modelleri ve nasıl eğitildiklerini tanımak gerekiyor.

Büyük Dil Modelleri Nasıl Eğitilir?

Bir Büyük Dil Modeli oluştururken gerçekleştirilmesi gereken ilk adım, önceden eğitilmiş bir model oluşturmaktır. Bu model denetimsiz bir şekilde, yani etiketsiz verileri kullanarak, metin içerisindeki desen ve örüntüleri tanıma amaçlı kurulmuştur. Bu desen ve örüntüleri anlama süreci, ön eğitim olarak adlandırılır.

Desen tanıma işlemleri “Yinelemeli Sinir Ağları” (Transformer Neural Networks) ve “Dikkat Mekanizmaları” (Attention Mechanisms) sayesinde yapılmaktadır. Dikkat mekanizması, veriler arasındaki ilişki ve bağımlılıkları modelleme konusunda son derece etkili olan, girdi dizisindeki her bir elemanı diğer elemanlarla birbiriyle ilişkilendiren bir mekanizmadır. Bu ilişkilendirme, her verinin birbiriyle olan ilişki ve özelliklerine bağlı olarak yapılır. Böylece her eleman ağırlıklandırılmış olur. Bu ağırlıklandırma sonucu, sıralı bir veri geldiğinde (örneğin bir metin) hangi elemana daha çok dikkat edilmesi gerektiğini belirler. Yani bir cümlenin karakteristiğini belirleyen sözcüğün hangisi olduğunu cümle içerisindeki konumuna, özelliğine ve diğer sözcüklerle ilişkisine bakarak karar verir.

Yinelemeli sinir ağları, her bir elemanın bağımsız ve tüm elemanların aynı anda işlenmesini sağlar. Dikkat mekanizması, kodlayıcının bir elemanın vektörünü hesaplarken diğer elemanların vektörlerine dikkat etmesini sağlar. Metin içerisindeki bağımlılıklar ve örüntüler hesaplandıktan sonra bu mekanizma ile yeni metinler doğal bir şekilde üretilebilir.

Etiketsiz verilerle eğitilen ön eğitimli bu model, içerisinde bir miktar etiketli veri bulunan bir veri kümesi kullanılarak “Öğrenme Aktarımı” (Transfer Learning) yöntemiyle ile eğitilir. Böylece, etiketsiz veriler ile eğitilen ilk model etiketli verilerle tekrar eğitilir ve model içerisinde doğru veya yanlış ağırlıklandırılan elemanlar saptanır. Buna “Öz Denetimli Öğrenme” (Self-Supervised Learning) adı verilir.

Eğitimi tamamlanmış olan model yeni metin üretmeye hazırdır ancak kendisini geliştirmesi gerekmektedir. Yeni üretilen metinler, kullanıcılar tarafından oylanır. Üretilen metin, istenen cevapla uyuşması halinde olumlu, aksi halde olumsuz olarak oylanır. Bu oylar, eğitim için bir ödül-ceza görevi görür. Yani model, geri bildirimlerle ödüllendirilir veya cezalandırılır. Böylece yeni üretilen metinlerin daha yüksek güvenilirliğe sahip olmasını sağlanır.

Büyük Dil Modelleri Nasıl Çalışır?

ChatGPT gibi üretken büyük dil modelleri istem üzerine çalışır. Yani girdi olarak bir metin alır. Girdi öncelikle matrise dönüştürülür ve dikkat mekanizmasıyla elemanlar arası ilişkiler belirlenir. Girdi alındıktan sonra cevap olarak üretilen metinde kullanılacak olan bir sonraki sözcük olasılıksal olarak tahmin edilir, böylece yeni bir cevap oluşturulur. Oluşturulan cümleler sonucunda özel bir örnekleme tekniği kullanılır ve olası cümleler kullanıcıya sunulur.

Girdide verilen metnin sözcük sırası, metnin büyüklüğü gibi etmenler üretilecek olan cevabı etkilemektedir. Modelde bir girdi analiz edilirken Doğal Dil İşleme (Natural Language Processing) adı altında birçok işlem uygulanmaktadır. Söz dizilimleri, edat ve bağlaç tespiti, sözcük kök ve ek analizi vb. bir çok dil bilimi tekniği kullanılarak analiz edilir. Bu nedenle kullanılan sözcüklere, dil kurallarına, sözcük ve söz dizilimlerine dikkat etmek önemlidir.

Girdileri üretmek ve yukarıdaki konulara dikkat etmek modelin performansını artırmaktadır. Çünkü modelin verdiği cevap “Sıfır-Çekimli Öğrenme” (Zero-Shot Learning) veya “Birkaç-Çekimli Öğrenme” (Few-Shot Learning) gibi yöntemlerin uygulanması sonucu oluşturulur. Yani bir girdi verildiğinde yalnızca girdiyi veri olarak alır ve onu öğrenir. Girdi (içerisinde barındırdığı bilgi ve ilişki bakımından) ne kadar zenginleştirilirse aldığımız cevap o kadar zenginleşecektir. Bu girdiyi düzenleme, zenginleştirme ve belli bir formata sokma işlemi Bilgi İstem Mühendisliği (Prompt Engineering) olarak adlandırılmaktadır.

Bilgi İstem Mühendisliği (Prompt Engineering) Nasıl Yapılır?

Amacın Belirlenmesi

Öncelikle modelden ne isteneceği netleştirilmelidir. Modeli metin sınıflandırma, cümle tamamlama veya chatbot tarzı bir soru-cevap görevi için kullanıyor olabiliriz. Amacın doğru belirlenmesi girdinin formatını belirlemede önemli bir rol oynar.

Sistem Mesajı

Amacın belirlenmesinin ardından alınacak olan cevabı belirli bir standarda sokmak için girdiden önce bir bilgilendirme mesajı yazılabilir. Bu, alınacak olan cevabın belirli bir formatta gelmesini sağlar ve istediğimiz cevaba yaklaşmasını sağlar. Buna “sistem mesajı” denir. (Özetle sistem mesajı; modelden alınacak cevabı belli bir standarda sokmak için en başta yazılan bir istemdir. Bu istemin içeriği, modelden alınan verimi doğrudan etkilemektedir.)

Bir örnek vemek gerekirse,

Sistem mesajı olmadan:

Sistem mesajı ile:

Görüldüğü üzere, istemden önce çıktının formatı net bir şekilde belirtildiğinde istediğimize uygun formatta cevap alabiliyoruz.

ChatGPT temel dil olarak İngilizce eğitildiği için, en doğru içerikleri İngilizce kullanıldığında üretebilmektedir. Aşağıdaki örneklerde aynı ihtiyacın Türkçe ve İngilizce sorulması durumunda alınan cevaplar örneklenmiştir.

“Act as” kalıbı, İngilizce kullanımda sistem mesajını belirtmek için kullanılabilecek en net kalıplardan birisidir.

Bu kalıp kullanılarak aynı probleme farklı bakış açılarıyla cevap alabilmek mümkün olabilmektedir. Örneğin uyku problemi için bir Klinik Psikolog tavsiyesi üretmek istediğimizde aşağıdaki gibi cevap üretilirken;

Psikiyatrist tavsiyesi istendiğinde aşağıdaki gibi “Bipolar Disorder” rahatsızlığından da bahsedilen bir cevap alınabilmektedir.

Bilgi İstem Mühendisliğinde Talimat ve Yönlendirme Mesajları

Girdinizi belirli bir sırayla yazmak ve bağlamsal ilişkiler kurmak alacağınız cevabın doğruluğunu artırabilir. Örneğin, modelden (asistandan) almak istediğiniz cevabın formatı en başta belirlenebilir. Bu, sistem mesajından daha farklı bir durumdur. Diyelim ki bir konuyla alakalı birkaç örnek ve bağlamsal bilgiler verip bu örnek ve bilgilere göre bir yanıt isteyeceksiniz. Modelin örnek ve bilgileri nasıl ele alacağı konusunda talimatlar sizi istediğiniz cevaba yaklaştıracaktır.

Söz Dizimi Ekleme

Girdiyi açık bir söz diziminde oluşturup belirli noktalama işaretleri kullanmak modelin anlama kapasitesini artırabilir. Nokta, ünlem gibi noktalama işaretleri cümleler arasında durdurma kriteri olarak kullanılır ve amaca yönelik istemi güçlendirir.

Görevi Alt Parçalar Halinde İfade Etmek

Ulaşılmak istenen cevaba birkaç adımda ulaşmak cevapların güvenilirliğini artırır ve istenen cevaba ulaşma olasılığını yükseltir.

Parametre Ayarı

Temperature : Sıcaklık parametresinin değiştirilmesi, modelin çıktısını değiştirir. Sıcaklık parametresi 0 ile 1 arasında ayarlanabilir. Yüksek bir değer (örneğin 0.7), çıktıyı daha rastgele hale getirerek daha farklı yanıtlar üretirken, daha düşük bir değer (0.2 gibi), çıktıyı daha odaklı ve somut hale getirecektir. Daha yüksek bir sıcaklık kullanılarak kurgusal bir hikaye üretilebilir. Oysa yasal bir belge oluşturmak için çok daha düşük bir sıcaklık kullanılması önerilir.

Sıcaklık değeri olarak önerebileceğimiz değerler ise şöyle;

· Yaratıcılık beklemeden sadece bir metni özetlemek, format ve gramer hatalarını düzeltmek gibi talepler için 0 ile 0.3 arasında

· Metin üretme talepleri için 0.5’a yakın değerler

· Pazarlama / reklam gibi amaçlar için çok yaratıcı metinler üretme talepleri için 0.7 ile 1 arasında

değerler kullanabilirsiniz.

Temperature: 0.1 ile

Temperature: 0.9 ile

Sıcaklık ile ilgili diğer örnekler:

Top_probability: Top_probability başka bir parametredir ve model yanıtının rasgeleliğini de kontrol etmesi bakımından Sıcaklık’a benzer, ancak arka planda çalışma prensibi biraz farklıdır. Genel tavsiye, her seferinde bu iki parametreden birini değiştirmektir.

Yukarıda da görüldüğü üzere Bilgi İstem Mühendisliği’nde kullanılan, Büyük Dil Modellerinden alınan cevabın güvenilirliğini ve doğruluğunu artıran yöntemler belirtilmiştir. Bu teknikleri kullanarak Büyük Dil Modellerinden alacağınız verimi arttırabilir ve bu modelleri çok daha efektif kullanabilirsiniz.

Bilgi İstem Mühendisliği Artifica Teknoloji’de Nasıl Kullanılıyor?

Artifica Teknoloji olarak, e-ticaret platformlarındaki ürünlerin analizini pek çok farklı derin öğrenme modeliyle yapan bir yazılım geliştirmiş bulunuyoruz. Bu yazılım e-ticaret platformlarındaki ürünleri kategorizasyon ve içerik hatalarını yapay zeka ile tespit eden ve ürünlerin fiyat tahminlerini yapabilen yüksek teknoloji bir yazılım. Bu özelliklere ek olarak, uzun süredir üstünde çalıştığımız Büyük Dil Modelleri teknolojisi ile e-ticaret platformlarındaki ürünler için SEO uyumlu başlık ve içerik üretebilmekteyiz. İçerik oluşturmanın yanı sıra, Büyük Dil Modellerinden diğer yapay zeka modellerinin performansını zenginleştirmek için sentetik veri üretiminde de yararlanmaktayız. Bu tür modellerin ve teknolojilerin geliştirilen proje içerisinde doğru ve verimli bir şekilde kullanılabilmesi için en doğru sistem mesajı belirlenmeli, girdiler en doğru formatta yazılmalı ve modelden alınan cevaplar en doğru şekilde sunulmalıdır.

AI-Commerce’te bizi oldukça heyecanlandıran bir özellik olarak kullandığımız İçerik Üretimini (Content Generation) geliştirirken edindiğimiz Büyük Dil Modelleri tecrübemizi, bir veri bilimcinin gözünden paylaştık. Bir sonraki yazıda görüşmek üzere.

Müstecep Berca Akbayır & Yusuf Sadi Gürsoy

Bu yazının orjinalini linke tıklayarak okuyabilirsiniz: https://medium.com/@bercaakbayir/bi%CC%87lgi%CC%87-i%CC%87stem-m%C3%BChendi%CC%87sli%CC%87%C4%9Fi%CC%87-prompt-engineering-3fb640f0b5d0

Bizi sosyal medya hesaplarınızda takip etmeyi unutmayın!✨

Kaynakça:

https://learn.microsoft.com/en-us/azure/cognitive-services/openai/concepts/advanced-prompt-engineering?pivots=programming-language-chat-completions

https://learn.microsoft.com/en-us/azure/cognitive-services/openai/concepts/prompt-engineering

https://github.com/dair-ai/Prompt-Engineering-Guide/blob/main/guides/prompts-basic-usage.md

https://arxiv.org/abs/1706.03762

https://www.wired.com/story/how-chatgpt-works-large-language-model/#:~:text=LLMs%20use%20a%20combination%20of%20machine%20learning%20and%20human%20input.&text=All%20of%20this%20text%20data,of%20multiple%20nodes%20and%20layers.

https://www.digitalinformationworld.com/2023/01/chat-gpt-achieved-one-million-users-in.html

Makine Öğrenmesinde Doğru Performans Ölçütünü Seçmek: Sınıflama ve Kümeleme Modellerindeki Farklı Ölçütler

Prof.Çağdaş Hakan Aladağ — Mon, 07 Aug 2023 13:06:34 +0000

Artifica olarak başlattığımız Türkçe yapay zeka içerik serisinin bir önceki yazısı “Öğrenme Aktarımının Gerçek Hayat Problemlerinde Kullanımı” yazısından sonra serinin 3. yazısı ile karşınızdayız. Bu yazıda makine öğrenmesi modellerini yakından inceleyeceğiz.

Makine öğrenmesi sınıflama ve kümeleme modelleri, büyük miktarda veriye dayalı karar alma süreçlerini otomatikleştirmek için kullanılır. Bu modeller, verileri doğru bir şekilde sınıflandırarak veya gruplandırarak belirli özelliklere sahip olanları birbirinden ayırt etmeyi sağlarlar. Bu işlem, doğru bir performans ölçütünün seçilmesine bağlıdır.

Sınıflama modellerinde, doğru bir performans ölçütü, modelin doğru sınıflandırma yapmasını sağlar. Doğru sınıflandırma, modelin tahminlerinin gerçek değerlere ne kadar yakın olduğunu gösterir. Sınıflama modellerinde kullanılan performans ölçütleri arasında doğruluk, hassasiyet, özgüllük, F1 skoru ve ROC eğrisi gibi ölçütlere yer verilir.

Doğruluk, modelin doğru tahmin ettiği verilerin yüzdesini ifade ederken, hassasiyet, modelin gerçek pozitiflerin yüzdesini tahmin etmesini ifade eder. Özgüllük ise modelin gerçek negatiflerin yüzdesini doğru bir şekilde tahmin etmesini ifade eder. F1 skoru, hassasiyet ve özgüllük arasında bir denge sağlayarak modelin performansını ölçer. ROC eğrisi ise modelin doğru sınıflandırma oranını gösterir.

Kümeleme modelleri ise, verileri doğru bir şekilde gruplamak için kullanılır. Kümeleme modellerinde doğru bir performans ölçütü seçimi, verilerin doğru bir şekilde gruplandırılmasını sağlayacaktır. Kümeleme modellerinde kullanılan performans ölçütleri arasında Silhouette skoru, Cohesion ve Separation, Entropi ve Purity yer almaktadır.

Silhouette skoru, bir veri noktasının kendi kümesinde ne kadar benzer olduğunu ölçerken, Cohesion ve Separation, küme içindeki benzerlikleri ve küme arasındaki farklılıkları ölçer. Entropi, bir kümenin homojenliğini ölçerken, Purity ise kümenin içindeki farklı sınıfların oranını ölçer.

Doğru performans ölçütlerinin seçilmesi, sınıflama ve kümeleme modellerinin etkili bir şekilde kullanılmasını sağlar. Performans ölçütlerinin farklı amaçlar için farklı modellerin seçilmesine olanak sağladığı göz önüne alındığında, model seçiminde performans ölçütleri dikkate alınmalıdır. Ayrıca, performans ölçütlerinin yanı sıra, verilerin nitelikleri, boyutu ve özellikleri gibi faktörler de modellerin seçimi için önemlidir.

Performans ölçütlerinin seçimi, model seçiminde oldukça önemlidir. Ancak, verilerin nitelikleri, boyutu ve özellikleri gibi faktörler de modellerin seçimi için önemlidir. Veri boyutu arttıkça, modelin performansını ölçmek ve model seçimini yapmak zorlaşır. Ayrıca, verilerin niteliği de modellerin seçimi için önemlidir. Örneğin, veriler karmaşık bir yapıya sahipse, sınıflama ve kümeleme modellerinin doğru seçimi, doğru performans ölçütleri kullanarak yapılmalıdır. Bu nedenle, verilerin özelliklerinin ve niteliğinin dikkate alınması, doğru performans ölçütlerinin seçilmesi için oldukça önemlidir.

Etkili bir sınıflama veya kümeleme modeli oluşturmak için doğru bir performans ölçütünün yanı sıra veri özelliklerinin de dikkate alınması gereklidir. Örneğin, veriler kategorik veya sayısal olabilir. Kategorik veriler için farklı sınıflama yöntemleri kullanılırken, sayısal veriler için farklı yöntemler kullanılır. Ayrıca, verilerin boyutu da performansı etkiler. Büyük boyutlu veriler daha fazla hesaplama gücü ve bellek gerektirirken, küçük boyutlu veriler daha hızlı işlenirler.

Bunun yanı sıra, sınıflama ve kümeleme modellerinin etkili bir şekilde kullanılabilmesi için doğru öznitelik seçimi de önemlidir. Öznitelikler, verilerin temel özelliklerini ifade eder ve doğru seçilmesi, modelin doğru sonuçlar vermesini sağlar. Öznitelik seçimi yaparken, verilerin boyutu ve niteliği göz önünde bulundurulmalıdır.

Sonuç olarak, yapay zekâ sınıflama ve kümeleme modelleri, büyük miktarda veriye dayalı karar alma süreçlerini otomatikleştirmek için kullanılır. Doğru performans ölçütü seçimi, modelin doğru sonuçlar vermesini sağlar. Performans ölçütleri, farklı amaçlar için farklı modellerin seçilmesine olanak sağlar. Verilerin nitelikleri ve boyutu, performansı etkiler ve doğru öznitelik seçimi yapılması önemlidir. Tüm bu faktörler, etkili bir sınıflama veya kümeleme modelinin oluşturulmasına katkı sağlar.

Örneklerle bu anlatılanları detaylandırmaya çalışalım. Sınıflama modellerinde kullanılan performans ölçütlerinden biri doğruluk (accuracy) ölçütüdür. Doğruluk, modelin doğru tahmin ettiği verilerin yüzdesini ifade eder. Örneğin, bir sınıflama modeli 100 adet örnek üzerinde çalıştırıldığında, 80 örneği doğru sınıflandırmışsa, doğruluk ölçütü %80 olarak hesaplanır. Ancak, doğruluk ölçütü tek başına yeterli değildir. Örneğin, sınıflandırılan verilerin bir sınıftan diğerine çok dengesiz dağılım gösterdiği durumlarda, modelin doğruluk oranı yüksek olabilir ama aslında performansı düşük olabilir.

Bu durumda kullanılabilecek performans ölçütlerinden biri F1 skoru’dur. F1 skoru, hassasiyet (precision) ve özgüllük (recall) ölçütlerinin harmonik ortalamasını ifade eder. Hassasiyet, modelin gerçek pozitiflerin yüzdesini tahmin etmesini ifade eder. Özgüllük ise modelin gerçek negatiflerin yüzdesini doğru bir şekilde tahmin etmesini ifade eder. Örneğin, bir sınıflama modeli hastalık teşhisi için kullanılıyorsa, hassasiyet modelin hasta olanların yüzdesini doğru tahmin etmesini, özgüllük ise sağlıklı olanların yüzdesini doğru tahmin etmesini ifade eder. F1 skoru, hem hassasiyet hem de özgüllük performansını dengeler ve performans ölçütü olarak daha güvenilirdir.

Kümeleme modellerinde kullanılan performans ölçütlerinden birinin Silhouette skoru olduğu belirtilmişti. Silhouette skoru, bir veri noktasının kendi kümesinde ne kadar benzer olduğunu ölçer. Örneğin, bir mağaza müşteri veri setinde, müşterilerin satın alma alışkanlıklarına göre farklı kümelere ayrılmak isteniyor. Silhouette skoru, her bir müşterinin ait olduğu kümedeki diğer müşterilere ne kadar benzediğini ölçer. Bu ölçütün yüksek olması, kümenin homojen olması anlamına gelir.

Küme içindeki benzerlikleri ve küme arasındaki farklılıkları ölçen Cohesion ve Separation ölçütlerinden bahsedilmişti. Cohesion, bir kümenin içindeki örneklerin birbirine ne kadar benzediğini ölçer. Separation ise, farklı kümeler arasındaki örneklerin birbirinden ne kadar farklı olduğunu ölçer. Bu ölçütlerin yüksek olması, kümenin homojen olması ve farklı kümelerin birbirinden ayrı olması anlamına gelir.

Regresyon modellerinde ise performans ölçütleri genellikle hata ölçütleri olarak kullanılır. Örneğin, ortalama kare hata (mean squared error) ölçütü, modelin gerçek ve tahmin edilen değerler arasındaki farkların karelerinin ortalama değerini ifade eder. Bu ölçütün düşük olması, modelin daha iyi bir şekilde uyum sağladığı anlamına gelir. R-kare (R-squared) ölçütü ise, modelin ne kadar iyi bir şekilde uyum sağladığını belirlemek için kullanılır. R-kare değeri 1’e yaklaştıkça, model gerçek verilere daha yakın bir şekilde uyum sağlamış demektir.

Bu performans ölçütleri, makine öğrenmesi içinde sıkça kullanılan ancak yalnızca birkaç örnektir. Hangi performans ölçütünün kullanılacağı, veri setinin özelliklerine ve modelin amaçlarına bağlıdır. Ayrıca, bir performans ölçütü yalnızca bir bakış açısını yansıttığı için, birden fazla performans ölçütü kullanmanın daha sağlıklı sonuçlar elde etmek için önemli olduğu da unutulmamalıdır.

Bu yazının orjinalini okumak için tıklayınız: https://medium.com/@chaladag/makine-%C3%B6%C4%9Frenmesinde-do%C4%9Fru-performans-%C3%B6l%C3%A7%C3%BCt%C3%BCn%C3%BC-se%C3%A7mek-s%C4%B1n%C4%B1flama-ve-k%C3%BCmeleme-modellerindeki-farkl%C4%B1-29d98fa20b3c

Sosyal medya hesaplarınızda bizi takip etmeyi unutmayın! ✨

Öğrenme Aktarımının Gerçek Hayat Problemlerinde Kullanımı

Artifica — Mon, 07 Aug 2023 12:00:01 +0000

Gün içerisinde birçok problemle karşılaşıyoruz ve bu problemleri çözerken daha önceki deneyimlerimizden sıklıkla yararlanıyoruz. Daha önce karşılaştığımız bir probleme benzer bir durumla karşı karşıya kaldığımızda önceki deneyimlediğimiz durumlardan öğrendiklerimizi ve çıkardığımız dersleri son karşılaştığımız durumda biraz duruma göre yorumlayarak yine kullanıyoruz. Bu son karşılaştığımız durumdan öğrendiklerimizi de ileride elbette kullanacağız. Bu şekilde bilgi birikimimiz ve tecrübemiz kümülatif olarak artmakta ve problemlerle karşılaştıkça yaptığımız hataları daha az yapmakta ve deneyim kazanmaktayız. Böylece kendimizi zaman ilerledikçe geliştiriyoruz.

Alan Turing’in “I propose to consider the question, ‘Can machines think?’” (“Makineler düşünebilir mi?” sorusunu ele almayı öneriyorum.) cümlesiyle başladığı ve yeni bir bilim sahasının doğumuna sebep olan makalesinin ardından makinelere insan gibi düşünebilme yeteneğinin kazandırılması konusunda ciddi çalışmalar yapıldı. İstatistiksel ve matematiksel modeller yazıldı, birçok yaklaşım geliştirildi. Bütün bu çalışmaların ardında makinelerin insana benzer bir şekilde düşünebilme yeteneğini kazandırma çabası yatmaktadır. Özellikle son dönemlerde adı çokça duyulan ve makine öğrenmesi modellerinin performansını artırmasıyla adından çokça söz ettiren öğrenim aktarımı (transfer learning) yaklaşımı da yine bu mottoyla geliştirilmiştir.

Yazının başlangıcında da dediğimiz gibi günlük hayatta karışımıza çıkan problemleri çözerken deneyimlerimizden yararlanıyoruz. Böylece problemleri daha kolay çözüyoruz ve hata yapma riskimizi minimize ediyoruz. Örneğin, bisiklet sürmeyi öğrenirken bir çok problemle ilk kez karşılaşıyoruz. Örneğin dengede kalma, çevre kontrolü, bisikleti kontrol etme ve tüm bunları yaparken de pedalı çevirmeye devam etme… Bütün bu becerileri aynı anda ilk kez öğreniyoruz. Bisiklet sürmeyi öğrenmemizin ardından motosiklet öğrenmek istediğimizde öğrenme sürecimiz bisiklet sürmeyi öğrendiğimiz zamana göre çok daha az zorlayıcı olacaktır. Çünkü bisiklet sürerken edindiğimiz dengede kalma, araç ve çevre kontrolü gibi edindiğimiz becerileri motosiklet sürerken de kullanıyoruz. Böylece öğrenme sürecimiz daha hızlı ve kolay oluyor.

Makine öğrenmesi sürecinde de bu tarz bir yaklaşımı ‘öğrenme aktarımı’ ile gösterebiliriz. Teknik olarak süreç aynı şekilde işlemektedir. Makine öğrenmesi modelini belli bir problem özelinde geniş bir veri setiyle eğitildikten sonra modelde güncellenen parametreler saklanır. Saklanan bu parametreler, çözülen bu probleme benzer veya ilişkili görülen bir problemi çözmek için kurulan makine öğrenmesine verilir. Bir önceki problemin bilgilerini taşıyan model yeni olan problemi tanıyarak çözmeye çalışır. Böylece sıfırdan model kurmadan daha kısa sürede daha başarılı sonuçlar üretilir.

Makine öğrenmesi dünyasında öğrenme aktarımı ile oldukça başarılı sonuçlar elde edilmiştir. Ayrıca mevcut problemleri başarıyla çözmesinin yanı sıra genel yapay zekaya ulaşma serüveninin önemli adımlarından biri olarak tanımlanmaktadır.

Öğrenme aktarımını kısaca tandıktan sonra gerçek hayat problemlerine uyarlamasını inceleyebiliriz. Ama önce bazı teknik konulara hakim olunmalı ve bu yaklaşımın teknik kısımları bilinmelidir.

Yapay Sinir Ağlarının Temelleri

Beyin hücrelerinden (nöron) ilham alınarak geliştirilen bu matematiksel model, 2000’lerin başına kadar bilgisayarların çok gelişmemiş olmasından kaynaklı olarak bu modelden verimli bir şekilde yararlanılamadı. Ancak özellikle son dönemlerde bilgisayarların işlem performanslarının artmasıyla yapay sinir ağları birçok problemin çözümünde kullanılıyor ve yeni yaklaşımlarla geliştirilmeye devam ediliyor.

Yukarıda da görüldüğü üzere mimari ve çalışma mekanizması olarak yapay sinir ağları, biyolojik sinir ağlarına oldukça benzemektedir. Dendritlerden alınan elektriksel sinyaller gövdeden geçerek akson boyunca uçtaki dendritlere iletilir ve bir sinir hücresindeki elektriksel sinyalin geçişi tamamlanır. Yine aynı şekilde yapay sinir ağlarında girdi olarak mevcut bilgiler gelir. Wn olarak tanımladığımız ağırlıklarca toplam fonksiyona (yukarıdaki şemada linear function olarak adlandırılan kısım) iletilir. Burada toplam fonksiyonunda stratejiye bağlı olarak ortalama fonksiyonu, medyan fonksiyonu gibi doğrusal fonksiyonlar kullanılır ve bu noktada bütün ağırlıklandırılmış bilgiler birleştirilir. Birleştirilen bilgiler belirli bir eşik değer atamasının yapılacağı aktivasyon fonksiyonuna iletilir ve niyahetinde bir çıktı değer elde edilir. Çeşitli mimarilerce bu sinir ağları tekrar ve tekrar çalıştırılır.

Sinir ağlarında geri yayılım (backpropagation):

Geri yayılım algoritması, yapay sinir ağının ürettiği sonuç olan tahmin edilmiş değeri gerçek veriyle kıyaslar ağın hata fonksiyonunu elde eder.Bu fonksiyon sayesinde ağın hata miktarını hesaplar ve ağın doğruluğunu artırmak için bu hataya göre ağırlıklar atanır.Gradyan iniş algoritması (gradient descent algorithm) ile ağın ağırlıkları optimize edilir. Her iterasyonda bu işlemler tekrarlanır ve ağırlıklar güncellenir.

Öğrenme Aktarımı (Transfer Learning)

Yazının başlangıcında da belirtildiği gibi öğrenme aktarımı, bir problemin çözümünde edinilen bilgileri başka bir problemde kullanılması ve tecrübelerin aktarılmasıdır. Örneğin bir görüntü sınıflandırma projesi için çalıştığımızı varsayalım. İlk problem olarak ultrason görüntülerinden kanser teşhisi koymaya çalıştığımızı varsayalım.

Elimizde Sağlık Bakanlığı’ndan temin ettiğimiz Türkiye genelini temsil eden büyük bir veri olduğunu varsayalım. Probleme uygun bir sinir ağı modeli kurduk, sıfırdan eğittik ve güncellenen ağırlıkları sakladık. Şu an elimizde büyük bir veriden öğrenen güçlü bir yapay sinir ağımız ve onun eğitim süresince güncellenmiş ağırlıkları var. Bunun anlamı şu an sinir ağı bu problem üzerinde bir deneyime sahip olduğudur. Ardından bir hastaneden görece olarak daha düşük bir boyutta veri temin ettik. Bu veriyle modeli sıfırdan eğitmek yerine bu problem için kurulan sinir ağına önceki problemde güncellenen ağırlıkları verdiğimizde çok daha iyi bir başlangıç noktası olacaktır.

Bu problem üzerinde tecrübe edinmiş olan sinir ağı daha az veri görmüş olmasına karşın oldukça iyi bir sonuç verecektir. Böylece önceden öğrenilen bilgiler burada kullanılmış olup tecrübe aktarılmıştır.

Öğrenim Aktarımı Çeşitleri

Öğrenim aktarımının genel bir problemi makine öğrenmesi metotlarıyla çözdükten sonra daha özel bir problem üzerinde edinilen tecrübenin aktarılmasıyla problemi çözme stratejisi olduğundan bahsettik. Bu süreç içerisinde karşılaşılan bazı senaryolar vardır.

İlk modeli üretirken çözmek istediğimiz problem ile öğrenme aktarımı ile çözmek istediğimiz problem aynı veya ilişkili olabilir ancak buna karşın bu iki problemin çözümünde kullanacağımız veriler farklı olabilir. Buna Dönüştürücü Öğrenme denmektedir. Örneğin yukarıda verdiğimiz ultrason görüntülerinden kanser tespiti örneği bir dönüştürücü öğrenme çeşididir.

Bir diğer senaryoda ise ilk modelin üretildiği problemle öğrenme aktarımının uygulanmak istenen problemin farklı olmasıdır. Örneğin ImageNet ile bir model eğitmek istediğimizi varsayalım. ImageNet, içerisinde milyonlarca görselin ve binlerce farklı kategorinin bulunduğu bir veri setidir.

Oldukça geniş ve genel bir veri setinden bahsetmekteyiz. Bu veri setini kullanarak oluşturduğumuz bir yapay sinir ağını hayvan görsellerini tahmin etmek üzere kullandığımızı düşünelim. İlk modelimizi oluşturmuş olduk ve problemimizi çözdük. İkinci safhada ise insan yüzlerini tanıyan bir model üretmemiz istendi. İlk problemde hayvanları sınıflandıran bir modelden edinilen bilgileri şimdi insanları sınıflandıran bir problem için kullanıyoruz. Buna da tümevarımsal öğrenme (inductive learning) denmektedir.

Öğrenim Aktarımı Mimarisi:

Öğrenim aktarımını uygularken oluşturulması gereken bir mimari yapı vardır. Adım adım mimariyi inceleyecek olursak:

1. Önceden Eğitilmiş Modeli (Pre-trained Model) Seçmek

Bazı geliştiriciler tarafından önceden büyük bir veri setiyle eğitilen ve geliştirmeye açık bir şekilde paylaşılan bazı modeller mevcuttur. Sıklıkla kullanılan bazı önceden eğitilmiş model çeşitleri şunlardır:

VGG:

Oxford Üniversitesi’nde bir grup araştırmacı tarafından üretilen model, 16 ve 19 katmanlı olmak üzere iki çeşiti mevcuttur. VGG, özellik çıkarımı ve sınıflandırma için kullanılan bir mimaridir ve görüntü sınıflandırma alanında bir dönüm noktası olarak kabul edilir. Imagenet yarışmasında oldukça iyi sonuçlar üreterek adını duyuran VGG modeli, görüntü işleme alanında çalışma yapan birçok geliştirici tarafından tercih edilmiştir.

ResNet:

Residual Networks (ResNet) adındaki bu model Microsoft uzmanlar tarafından üretilmiş olup geliştiricilere açık bir şekilde paylaşılmıştır. Esas olarak aşırı öğrenme problemine çözüm olarak gelişitirilmiştir ve klasik sinir ağlarına kıyasla çok daha fazla katmana sahiptir. Ancak katman fazlalığından dolayı yine aşırı öğrenmeye yatkındır. Bundan dolayı artık blok adı verilen bir strateji barındırır. Blok içerisinde girdi ve çıktıları birbirine bağlayarak kısa yollar oluşturur. Çıktılar, girdilere eklenmiş olur ve yeni özellikler tanınmış olur. Görüntü işleme alanında en çok tercih edilen modeldir.

Inception / Xception:

Google uzmanları tarafından geliştirilen bu model, en çok tercih edilen modeller arasında yer almaktadır. Xception, VGG ile Inception modellerinin birleşiminden meydana gelir ve klasik sinir ağlarına kıyasla daha yüksek doğruluğa ve daha düşük hesaplama maliyetine sahiptir. Görüntü işleme, sınıflandırma ve nesne tespitinde sıkça tercih edilir.

2. Katmanları Dondurma (Freezing) ve Yeni Katmanları Eğitme

Önceden eğitilmiş modeli seçtikten sonra yapılması gereken işlem probleme özgü özellik çıkarımı ve katmanları dondurma işlemidir.

Yukarıda basitçe görüldüğü üzere bir evrişimsel sinir ağı modeli 3 kısımdan oluşmaktadır. Giriş katmanı, saklı (orta) katmanlar ve çıkış katmanı. Son aşamada tam bağlantı yapılarak evrişimsel sinir ağlarının kurulumu tamamlanır. Önceden eğitilmiş modellerde genel mantık, ilk ve orta katman olduğu gibi tutulur ve son katman probleme özgü olarak yeniden yazılır. Bu noktada yeni problemimiz için önceden eğitilmiş modeli kurduktan sonra parametreleri transfer ederiz. Böylece ilk 2 katmanda güncellenmiş parametrelerimiz olmuş olur.

Kurulan önceden eğitilmiş modele ek olarak son bir katman daha yazılır. Bu son katman, probleme özgü olarak değişmektedir. Son katmanın yazılmasının ardından tam bağlantı kurulur ve mevcut modelimiz tamamlanmış olur. Buradan sonra dikkat edilmesi gereken nokta önceden eğitilmiş modeldeki katmanların dondurulmasıdır. Böylece model, yeni verilerle yeniden eğitildiğinde ilk katmanlardaki bilgi kaybolmamış olur ve yeni verilerle eğitimimiz tamamlanmış olur.

3. İnce Ayar (Fine Tuning)

Bu aşama, öğrenim aktarımı için zorunlu değildir. Ancak birçok senaryoda performansı artırdığı görülmüştür. Katmanlar dondurulup modelin yeni katmanları eğitildikten sonra modelin eğitimi tamamlanmıştır. Bu aşamaların üzerine dondurulmuş olan katmanlar çözünerek (yeniden eğitilebilir hale getirerek) model tekrar eğitilir. Model tekrar eğitilirken sinir ağının öğrenim oranını düşürmek, optimizasyon aşamasında daha detaylı arama yapılması sağlar ve daha yavaş ve detaylı bir öğrenim ile bütün sinir ağı tekrar eğitilir. Bu eğitim, önceki eğitimin üzerine ek olarak tanımlanır ve genel olarak sonuçları iyileştirmektedir.

Öğrenim Aktarımına Neden İhtiyaç Duyulmaktadır ?

Önceden eğitilmiş modelin ağırlıkları, önceki problemlerde edindiği bilgileri ve tecrübeleri barındırmaktadır. Öğrenim aktarımının en büyük avantajı, yeni veriyle sinir ağını sıfırdan eğitmek zorunda olmamamız. Önceden eğitilen sinir ağının üzerine yeni veriyle eğitim yapılarak çok daha iyi bir başlangıç yapılması sağlanıyor. Ayrıca sinir ağlarını başarılı bir şekilde eğitmek için yüksek bir miktarda veriye ihtiyaç duyulmaktadır. Daha az veriyle daha karmaşık problemler, öğrenim aktarımı stratejisiyle mümkün hale gelmektedir.

Artifica Teknolojide öğrenme aktarımı neden kullanıldı?

Artifica Teknoloji, geçtiğimiz günlerde çıkarmış olduğu AI-Commerce adındaki ürününde görüntü işleme ve bilgisayarlı görü, doğal dil işleme ve tabular veriyle sınıflandırma modelleri gibi 9 farklı derin öğrenme modelini bir arada kompoz bir şekilde kullanarak e-ticaret sektöründeki ürünlerin analizini yapmakta ve kategorizasyon hatalarını düzeltmektedir. Bilgisayarla görü alanında yapay zeka modellerini eğitirken öğrenim aktarımına sıkça başvurmaktayız. Artifica Teknolojinin veri tabanında yer alan milyonlarca ürün görseliyle eğitilen konvülasyonel sinir ağları, çeşitli durumlarda tekrardan eğitilmektedir. MLOps ekosistemi içerisinde birçok tetikleyiciyle bu modeller tekrar eğitilir. Eğer sezonluk yeni veri gelirse, modellerin doğruluk oranları düşerse çeşitli stratejilerle veri tabanından veriler tekrardan eğitime tabii tutulur ve modeller güncellenir. Ayrıca, temel model olarak geniş veri setimizle eğitilmiş modellerimiz Artifica Teknolojiden hizmet alan müşterilerimizin bizlere sağladığı verilerle, tekrar eğitime tabii tutulur ve kümülatif bir öğrenme süreci gerçekleşir. Bu sayede zaman geçtikçe yapay zeka modellerinin başarı yüzdesi sürekli gelişmektedir.

Artifica Teknolojide öğrenme aktarımı nasıl kullanıldı?

İlk Deney

AI-Commerce’in ürünlerin doğru kategorizasyonunu yapabilmesi için başarılı bir görüntü sınıflandırma modeline ihtiyaç vardı. İlk olarak artıklardan öğrenebilen bir evrişimsel sinir ağı mimarisi kuruldu. Kurulan evrişimsel sinir ağının mimarisi özet olarak:

Giriş katmanı 60x60x3 boyutunda bir girdi tensörü alır. Giriş katmanının ardından ağ çeşitli evrişimli bloklardan oluşmaktadır.Her blok, bir önceki bloktan gelen bir artık bağlantıya sahiptir ve iki ayrılabilir evrişim katmanı, toplu normalleştirme ve dropout düzenlemesi içerir. Her bloktaki ayrılabilir evrişim katmanlarının filtre sayısı sırasıyla 256, 512 ve 728’den artar. Son katman ise toplu normalleştirme ve global ortalama havuzlama katmanlarının takibiyle tamamlanır. Sınıf sayısına uygun bir şekilde çıktı katmanının yazlmasıyla ağda tam bağlantı tamamlanır. Böylece ağ, eğitime hazır hale getirilmiştir.Yapılan bu çalışma ile daha az hesaplama gücüyle daha yüksek doğruluk amaçlanarak verimli bir ağ modeli tasarlanmak istenilmiştir.

Deneyin diğer adımı olarak veri tabanında yer alan verilere benzer bir şekilde küçük bir veri kümesi seçildi. Modelin bu verilerle eğitilmesi sonucu yüzde 70’e yakın bir doğruluk oranı yakalanmıştır.

Deneyin ikinci kısmında bir önceden eğitilmiş model kurulmuştur. Model olarak ResNet50 seçilmiş olup son katman probleme özgü olarak yeniden tasarlanmıştır. İlk ve saklı katmanlar dondurularak ağırlıklar korunmuştur. En son olarak ise mevcut epoch sayısının yüzde 30’u, öğrenme oranının (learnnig rate) yüzde 10’u olacak şekilde ince ayar adımı tanımlanmıştır. Bunun anlamı, asıl eğitim süreci bittikten sonra mevcut epoch sayısının yüzde 30’u kadar daha eğitim devam edecek ve bu ikinci eğitim aşamasında optimizer asıl eğitimde kullanılan öğrenim oranının onda biri büyüklükte olacak şekilde daha detaylı bir optimizasyon süreciyle eğitim devam edecektir. Deney sonucunda öğrenme aktarımında sıklıkla karşılaşılan bazı problemler meydana gelmiştir. Bu problemler ve çözümleri aşağıdaki adımlarda anlatılmıştır:

Aşırı öğrenme (Overfitting):

Öğrenme aktarımı uygulanırken en çok karşılaşılan problemlerden birisidir. VGG, ResNet, Inception gibi önceden eğitilmiş modeller, katman sayılarından kaynaklı olarak oldukça kompleks modellerdir. Daha az veriyle eğitim amaçlayan geliştiriciler bu modelleri kullanırken aşırı öğrenme gibi sorunlarla karşılaşabilmektedirler. Bu problemi çözmek için izlediğimiz adımlar:

1. Veri Artırma

Veri artırma (data augmentation) adımı, aşırı öğrenme probleminin üstesinden gelmek için uygulanması gereken ilk adımlardan birisidir. Aşırı öğrenme problemi, modelin genelleştirme yeteneğini kaybetmesinin ardından meydana gelmektedir. Bu adımda, her bir görseli 0.2 radyan ile döndürerek birer kopya oluşturur ve eğitime dahil ederiz. Farklı açılardan gösterilen görseller modelin genelleştirme yeteneğini artırmaktadır.

2. Bırakma (Dropout)

Bırakma (dropout), bir düzenlileştirme tekniğidir. Her katmanda nöronlardan geçen bilginin bir kısmı bırakılır, diğer bir tabirle “unutulur”. Böylece herhangi öğrenilen bir özelliğe fazla dayanmadan eğtiim süreci devam eder. Saklı katmanlarda bırakma oranının yaklaşık yüzde 50 civarında olması önerilmektedir.

3. Erken Durdurma (Early Stopping)

Sinir ağlarında eğitim devam ederken modelin doğruluğu artmayabilir veya artmasına karşın hatalar minimize edilemeyebilir. Bu noktada aşırı öğrenme problemi başlamış demektir. Eğitim süresince eğer ardışık 3 epochta bu durum gözlenirse eğitim orada kesilir ve aşırı uyum başlamadan eğitim tamamlanır.

Patlayan Gradyan (Exploded Gradient) Problemi:

Derin öğrenmede, öğrenme sürecinde yapay sinir ağının geri yayılım sürecinde gradyanın çok büyük olmasından kaynaklı olarak patlayan gradyan problemi ortaya çıkar. Bundan dolayı ağırlık güncellemelerinin çok yüksek bir değerle olması uçta çok yüksek ağırlıkların birikmesine neden olur ve model kararsız hale gelir.

Eğer sinir ağı modelinizi eğitirken eğitim süresince loss (kayıp) değeriniz çok yüksek çıkıyorsa veya NaN değerini veriyorsa patlayan gradyan problemi var demektir. Ağırlıklar çok yüksek değer aldıktan sonra kayıp fonksiyonu minimize edilemez, kullanılan optimizasyon algoritması (adam, rmsrop vb.) çözüm uzayında global maksimumu bulmakta zorlanır ve çözüm uzayında salınım hareketi yapmaya başlar. Bu problemin çözümü için aşağıdaki yollar izlenmiştir :

1. Daha düşük öğrenme oranı:

Bir sinir ağını eğitirken amacımız geri yayılım (back propagation) süresince ağırlıklar ağda güncellenirken kayıp (veya maliyet) fonksiyonunu minimize etmeye çalışırız. Eğer öğrenme oranını düşürürsek ağırlıkların güncelleme oranını düşürürüz, böylece gradyanların aşırı büyüme ihtimalini düşürmüş oluruz.

2. L1 (lasso) ve L2 (ridge) Düzenlileştiricileri:

L1 ve L2 düzenlileştiricileri, aşırı öğrenme problemlerinde modelin veriyi daha iyi genelleştirmelerine olanak sağlayan düzenlileştirme metotlarıdır. Patlayan gradyan problemi için üretilen bir çözüm değildir ancak dolaylı yoldan problemin çözümüne yardımcı olmaktadırlar. L1 ve L2 düzenlileştiricileri, modeli daha küçük ağırlıklar kullanmaya ve gradyanların genel büyüklüğünü azaltmaya teşvik eden kayıp fonksiyonuna bir ceza terimi ekleyerek bunu önlemeye yardımcı olabilir.

Önceden eğitilmiş modeli kurup öğrenme aktarımı uyguladıktan sonra karşımıza çıkan problemler ve bunları nasıl çözdüğümüz yukarıda detaylıca anlatılmıştır. Bu çözüm yollarını uyguladıktan sonra modelimiz yüzde 90’lara varan bir başarı elde etmiştir.

Kendi tasarladığımız sinir ağı mimarisini ve önceden eğitilmiş modeli öğrenme aktarımı metotuyla ayrı olarak eğittikten sonra deneyimiz tamamlanmıştır.

Deneye İlişkin Sonuç ve Karşılaştırma

Her iki model karşılaştırıldığında farkları model kurulumu, eğitim süreci ve sonrası olmak üzere incelenebilir. Sıfırdan bir sinir ağı tasarlayıp kurmak ve ağın deneyini yapmak çoğu zaman maliyetlidir. Uzun süren bir sinir ağı mimari tasarımının ardından beklenen sonuç gelmeyebilir ve daha iyi sonuçlar çıkarmak için parametrelerde ve mimaride düzenlemeler yapılarak beklenen sonuca yaklaştırılabilir. Önceden eğitilmiş modellerin kullanılmasıyla sinir ağlarının kurulumu da oldukça kolaylaşmıştır. Başarısını kanıtlamış çok katmanlı sinir ağlarıyla çalışmak ve yönetmek, bize oldukça zaman tasarrufu sağladı. Öğrenme aktarımı metotuyla eğitilen önceden eğitilmiş sinir ağı modeli ResNet50, daha az veriyle eğitildiği için model karmaşıklığına rağmen eğitimi oldukça kısa sürdü. Ayrıca daha kısa sürede daha yüksek doğruluk oranı yakalandı. Sonuç olarak öğrenme aktarımı kullanılarak zaman ve başarı bakımından daha optimize modeller elde ettik.

Ürün İçerisinde Testlerinin Yapılması

İlk deneyde Ar-Ge çalışmalarında mevcut yöntemin ürünlerin tahminlerindeki başarısının görülmesi üzerine ürün içerisinde denenmek üzere çalışmalara başlandı.

Ürün içerisinde verilerin çeşidi ve boyutu değiştiğinden dolayı yeni bir deneysel sürece başlanmış oldu. Bundan dolayı birkaç farklı model denendi. İlk safhada önceden eğitilmiş modellerin arasındaki farklı kıyaslamak amacıyla ullanılan modeller ResNet50, VGG16 ve Xception modelleridir. ResNet50 ve Xception arasında bariz bir fark olmamasına karşın diğer modellere kıyasla çok daha iyi sonuçlar vermiştir. ResNet50’nin yaklaşık %90, Xception’un ise %91–93 bandında bir doğruluk oranı verdiği görülmüştür. Böylece en iyi performansı gösterenin Xception olduğuna karar verilmiştir.

İkinci safhada ise ürün içerisinde önceden kullanılan ve yukarıda da bahsedilmiş olan konvülasyonel sinir ağı ve en iyi sonucu veren Xception modeli denenmiştir. Deneyde bir ikili (binary) sınıfa sahip veri seti, bir de 4 adet sınıfa sahip bir veri seti seçilip deneylere başlanmıştır.

İkili sınıfa sahip olan veri setinde konvülasyonel sinir ağı yaklaşık %81 doğruluk oranı vermiştir. Yine aynı veri seti üzerinden Imagenet üzerinden eğitilmiş ve güncellenmiş parametreler Xception modeline verilerek tekrar eğitilmiştir. Xception’un doğruluk oranının %91 olduğu görülmüştür.

4 adet sınıfa sahip veri setinde yazdığımız konvülasyonel sinir ağı %70, Xception modeli ise %91.2 doğruluk oranı vermiştir.

Ürün Testlerinde Sonuç ve Karşılaştırma

Ürün içerisinde önceden kullanılan konvülasyonel sinir ağı ile Xception modeli kıyaslandığında bariz farklılıklar görülmektedir. Bu farklılıklardan ilk göze çarpanı doğruluk oranlarındaki fark olduğu görülmektedir. Xception modelinin bizim tarafımızdan tasarlanan konvülasyonel sinir ağına kıyasla yüzde 25 daha iyi sonuçlar verdiği görülmüştür.

Ürün İçerisindeki Etkisi:

Xception modelini ürün içerisine yerleştirdikten sonra yüzlerce kategori üzerinde eğitilmiştir. Yüzlerce kategorinin bu modelle eğitilmesinin ardından öğrenme aktarımının modelin ürün içerisindeki başarının oldukça yükselttiği görülmüştür. Doğruluk oranı olarak belirlenen eşik değerin altında kalan kategorilerden birçoğunun eşik değeri geçtiğini ve başarılı olarak işaretlendiği görülmüştür. Verisi az olan kategorilerin doğruluğu düşük iken öğrenme aktarımı uygulandıktan sonra yüksek bir başarıya ulaştığı görülmüştür. Yapılan geliştirmelerin ardından geçmişe kıyasla daha az aşırı öğrenme problemiyle karşılaşılmaya başlanmıştır.

Bu yazımızda Artifica Teknoloji bünyesinde çalışan bir veri bilimci gözünden öğrenim aktarımı yaklaşımını şirketimizin bünyesinde nasıl kullandığımızı ve nasıl süreçlerden geçtiğimizi aktarmaya çalıştık. Öğrenme aktarımının yapay zeka modellerine olan katkıları ve nasıl kullandığıyla alakalı deneyimlerimizi paylaştık. Ayrıca derin öğrenme modelleri kurulurken sıklıkla karşılaşılan problemler ve çözümlerine de değinmeye çalıştık.

Artifica Teknolojinin yapay zeka tabanlı ürünü olan AI-Commerce’i geliştirirken geçtiğimiz aşamaları ve karşılaştığımız zorlukları sizinle paylaşmak istedik. Ürün geliştirme sürecimizde yapay zeka tarafında edindiğimiz tecrübelerimizi aktarırken siz de bu serüvene ortak olabilirsiniz. Bir sonraki yazımızda görüşmek üzere.

Müstecep Berca Akbayır

Veri Bilimci

Bu yazının orjinaline erişmek için tıklayın: https://medium.com/@bercaakbayir/%C3%B6%C4%9Frenme-aktariminin-transfer-learning-ger%C3%A7ek-hayat-problemleri%CC%87nde-kullanimi-95c08425bd1e

Kaynakça:

https://dergipark.org.tr/tr/download/article-file/833620

https://medium.com/novaresearchlab/%C3%B6%C4%9Frenme-aktar%C4%B1m%C4%B1-transfer-learning-c0b8126965c4

https://keras.io/guides/transfer_learning/

https://www.spiceworks.com/tech/artificial-intelligence/articles/articles-what-is-transfer-learning/

https://redirect.cs.umbc.edu/courses/471/papers/turing.pdf