Bilgisayar Mühendisi Adayı
Sonuçlar Ekşi Sözlük’te duygu analizi yaparak hizmet sunmayı hedefleyen bu çalışma duygu analizi yöntemleri kullanarak, makine öğrenmesi yoluyla başarılı olduğu için SMO algoritmasını tercih edilmiştir. SMO algoritması ile elde edilen doğruluk yüzdesi daha önce Ekşi Sözlük üzerinde denenmemiş olan duygu analizi yönteminde, polar-nötr sınıflandırmada %58.26, mutlu-mutsuz sınıflandırmada ise %69.61 başarı sağlamıştır. Bu çalışma Ekşi Sözlük…
tez değerlendirmesiProje aşağıdaki temel iki adımda gerçekleştirildikten sonra yayınlanmak üzere internet sitesi Linux sunucu üzerinde kurulu MySQL, PHP ve Apache barındıran bir sunucuda, internet servisi ise Linux tabanlı Ubuntu işletim sistemi üzerine MYSQL ve Tomcat barındıran bir sunucuda yayınlanır. İnternet Sitesi Veri işaretleme aşamasında eksik kalan, projenin ön yüzü için seçilen temada ana sayfa bölümü ve…
ekşisözlük miningBu süreç boyunca elde bulunan eğitim kümesinden veri ambarı tasarımı yapılması hedeflenir. Kelime bazlı frekans hesabı yapılır, kelime kümesi seçilir, seçilen küme ayrı bir tabloda saklanır ve kaynak olarak kullanılır. Veri ambarı söz konusu 2 tablo yardımıyla meydana getirilir ve süreç sonucunda artık veri algoritma girdisi olarak hazır hale gelmiş olur. Kelime Bazlı Frekans Hesabının…
duygu analizi adımlarıÖn işleme işleminin bitmesiyle elde edilen girdi kümesi artık veri madenciliği süreci içerisinde olduğu için algoritmalar ile gerçekleştirilecek olan makine öğrenmesi için kullanılacaktır. Bu algoritmalar girdilerin insan gözüyle işaretlenmiş halini kullanarak bize sonuçlar üretirler. Veri tabanındaki kolonların sonuna bir analiz kolonu eklenerek tipi enum seçilir. Alabileceği değer olarak ‘h’ harfi ile mutluluğu, ‘u’ ile mutsuzluğu…
data clusterVerimiz artık uygun bir ortamda bulunduğu için veri madenciliği ön hazırlık sürecine tabi tutulabilir haldedir. Sırasıyla aşağıdaki adımlar izlenerek veri istenilen şekle sokulur. Gereksiz Girdilerin Silinmesi Veri madenciliği uygulanırken bir getirisi olmayacağını düşünülen girdiler eğitim kümesinden atılmalıdır. Sadece tek kelimeden, bakınız ibaresinden veya linkten oluşan girdiler uygulama alanımıza girmediği için bu aşamada silinmesi gerekir. Projenin…
gereksiz karakterlerin temizlenmesiSürecin ilk aşamasının hedefi olan eğitim kümesini elde etmek için Ekşi Sözlük‘ün herhangi bir UPA’sı olmadığı için küme HTTP istekleri ile elde edilecektir. Bunun için import.io özelleştirilmiş tarayıcısı kullanılacaktır. Eğitim kümesi için planlanan girdi sayısı 10.000’dir. Bu girdiler, Türkiye’nin toplumsal olarak yaşadığı 5 mutsuz gün, 5 mutlu gün ve 10 tane de 2009 yılından günümüze…
eğitim kümesi oluşturmaİnternet Servisleri HTTP protokolü üzerinden hizmet veren fonksiyonlar bütünüdür. Bir kullanıcının HTTP üzerinden bir web servisi kullanmasına denmektedir. HTPP üzerinden yapılan bu çağrımlara karşı sistem XML veya JSON çıktıları üretir. Veri transferi bu çıktılar sayesinde yapıldığı için platform bağımsız bir yapısı vardır. Bu sayede servisi kullanmak istediğiniz program parçasının hangi dilde yazıldığının pek bir önemi…
reful ile rest arasındaki farkWeka makine öğrenmesi algoritmalarının ve veri ön işleme araçlarının bir araya getirildiği, akademik çalışmalarda sıklıkla kullanılan, açık kaynak kodlu bir veri madenciliği programıdır. WEKA Yeni Zelanda Waikito Üniversitesinde, nesne yönelimli programlama dillerinden biri olan Java ile geliştirilmiş ve halen yeni sürümleri geliştirilmeye devam etmektedir. Java programlama dili birçok değişik öğrenme algoritmaları için düzenli bir platform…
örnek weka kullanımıGünlük hayatta kullanılan cihazların mobil türevleriyle hayatın her anına dâhil olmasıyla internette dolaşan duygu ağırlıklı bilgiler oldukça artmıştır. Artık sosyal platformlarda hayatın her dakikasında sayısız duygu içerikli gönderiler paylaşılmaktadır. Bu ham verinin işlenmeden insan gücü ile anlamlandırılması ve sonuçlar çıkarılması mümkün değildir. Duygu analizinde doğru ve çabuk sonuçlar elde etmek için mutlaka bilgisayar destekli sistemlere…
duygu analizi nedirEkşi Sözlük gerek sahip olduğu kullanıcı sayısıyla gerekse de yazarlarının girdiği günlük dinamik veri akışı sayesinde yüksek düzeyde veriye sahip bir platformdur. Bu durum üzerinde veri madenciliği yöntemlerinin uygulamasına mümkün kılar. Sınıflandırma yöntemleri salt yazı üzerinde duygu analizi ve kategorilendirme amaçlı kullanılabilir. Davranışsal analiz ise kullanıcıların sosyal platformlarda davranışsal olarak yaptığı eylemleri inceler.
ham veride veri madenciliği