Bloğum

Bilgisayar Mühendisi Adayı

Bitirme Tezi Sonuçları ve Değerlendirmesi

Sonuçlar Ekşi Sözlük’te duygu analizi yaparak hizmet sunmayı hedefleyen bu çalışma duygu analizi yöntemleri kullanarak, makine öğrenmesi yoluyla başarılı olduğu için SMO algoritmasını tercih edilmiştir. SMO algoritması ile elde edilen doğruluk yüzdesi daha önce Ekşi Sözlük üzerinde denenmemiş olan duygu analizi yönteminde, polar-nötr sınıflandırmada %58.26, mutlu-mutsuz sınıflandırmada ise %69.61 başarı sağlamıştır. Bu çalışma Ekşi Sözlük…

tez değerlendirmesi

Veri Madenciliği Projesinin Gerçekleştirilmesi

Veri Madenciliği Projesinin Gerçekleştirilmesi

Proje aşağıdaki temel iki adımda gerçekleştirildikten sonra yayınlanmak üzere internet sitesi Linux sunucu üzerinde kurulu MySQL, PHP ve Apache barındıran bir sunucuda, internet servisi ise Linux tabanlı Ubuntu işletim sistemi üzerine MYSQL ve Tomcat barındıran bir sunucuda yayınlanır. İnternet Sitesi Veri işaretleme aşamasında eksik kalan, projenin ön yüzü için seçilen temada ana sayfa bölümü ve…

ekşisözlük mining

Duygu Analizi Çalışması

Duygu Analizi Çalışması

Bu süreç boyunca elde bulunan eğitim kümesinden veri ambarı tasarımı yapılması hedeflenir. Kelime bazlı frekans hesabı yapılır, kelime kümesi seçilir, seçilen küme ayrı bir tabloda saklanır ve kaynak olarak kullanılır. Veri ambarı söz konusu 2 tablo yardımıyla meydana getirilir ve süreç sonucunda artık veri algoritma girdisi olarak hazır hale gelmiş olur. Kelime Bazlı Frekans Hesabının…

duygu analizi adımları

Uygulama Metodları: Eğitim Kümesinin İşaretlenmesi

Uygulama Metodları: Eğitim Kümesinin İşaretlenmesi

Ön işleme işleminin bitmesiyle elde edilen girdi kümesi artık veri madenciliği süreci içerisinde olduğu için algoritmalar ile gerçekleştirilecek olan makine öğrenmesi için kullanılacaktır. Bu algoritmalar girdilerin insan gözüyle işaretlenmiş halini kullanarak bize sonuçlar üretirler. Veri tabanındaki kolonların sonuna bir analiz kolonu eklenerek tipi enum seçilir. Alabileceği değer olarak ‘h’ harfi ile mutluluğu, ‘u’ ile mutsuzluğu…

data cluster

Uygulama Metodları: Yazı Ön İşleme

Uygulama Metodları: Yazı Ön İşleme

Verimiz artık uygun bir ortamda bulunduğu için veri madenciliği ön hazırlık sürecine tabi tutulabilir haldedir. Sırasıyla aşağıdaki adımlar izlenerek veri istenilen şekle sokulur. Gereksiz Girdilerin Silinmesi Veri madenciliği uygulanırken bir getirisi olmayacağını düşünülen girdiler eğitim kümesinden atılmalıdır. Sadece tek kelimeden, bakınız ibaresinden veya linkten oluşan girdiler uygulama alanımıza girmediği için bu aşamada silinmesi gerekir. Projenin…

gereksiz karakterlerin temizlenmesi

Uygulama Metodları: Eğitim Kümesinin Elde Edilmesi

Uygulama Metodları: Eğitim Kümesinin Elde Edilmesi

Sürecin ilk aşamasının hedefi olan eğitim kümesini elde etmek için Ekşi Sözlük‘ün herhangi bir UPA’sı olmadığı için küme HTTP istekleri ile elde edilecektir. Bunun için import.io özelleştirilmiş tarayıcısı kullanılacaktır. Eğitim kümesi için planlanan girdi sayısı 10.000’dir. Bu girdiler, Türkiye’nin toplumsal olarak yaşadığı 5 mutsuz gün, 5 mutlu gün ve 10 tane de 2009 yılından günümüze…

eğitim kümesi oluşturma

Tez Metodları: İnternet Servisi (Web Service)

Tez Metodları: İnternet Servisi (Web Service)

İnternet Servisleri HTTP protokolü üzerinden hizmet veren fonksiyonlar bütünüdür. Bir kullanıcının HTTP üzerinden bir web servisi kullanmasına denmektedir. HTPP üzerinden yapılan bu çağrımlara karşı sistem XML veya JSON çıktıları üretir. Veri transferi bu çıktılar sayesinde yapıldığı için platform bağımsız bir yapısı vardır. Bu sayede servisi kullanmak istediğiniz program parçasının hangi dilde yazıldığının pek bir önemi…

reful ile rest arasındaki fark

Tez Metodları: Weka Kullanımı

Tez Metodları: Weka Kullanımı

Weka makine öğrenmesi algoritmalarının ve veri ön işleme araçlarının bir araya getirildiği, akademik çalışmalarda sıklıkla kullanılan, açık kaynak kodlu bir veri madenciliği programıdır. WEKA Yeni Zelanda Waikito Üniversitesinde, nesne yönelimli programlama dillerinden biri olan Java ile geliştirilmiş ve halen yeni sürümleri geliştirilmeye devam etmektedir. Java programlama dili birçok değişik öğrenme algoritmaları için düzenli bir platform…

örnek weka kullanımı

Duygu Analizi

Duygu Analizi

Günlük hayatta kullanılan cihazların mobil türevleriyle hayatın her anına dâhil olmasıyla internette dolaşan duygu ağırlıklı bilgiler oldukça artmıştır. Artık sosyal platformlarda hayatın her dakikasında sayısız duygu içerikli gönderiler paylaşılmaktadır. Bu ham verinin işlenmeden insan gücü ile anlamlandırılması ve sonuçlar çıkarılması mümkün değildir. Duygu analizinde doğru ve çabuk sonuçlar elde etmek için mutlaka bilgisayar destekli sistemlere…

duygu analizi nedir

Ekşi Sözlük’te Veri Madenciliği

Ekşi Sözlük’te Veri Madenciliği

Ekşi Sözlük gerek sahip olduğu kullanıcı sayısıyla gerekse de yazarlarının girdiği günlük dinamik veri akışı sayesinde yüksek düzeyde veriye sahip bir platformdur. Bu durum üzerinde veri madenciliği yöntemlerinin uygulamasına mümkün kılar. Sınıflandırma yöntemleri salt yazı üzerinde duygu analizi ve kategorilendirme amaçlı kullanılabilir. Davranışsal analiz ise kullanıcıların sosyal platformlarda davranışsal olarak yaptığı eylemleri inceler.

ham veride veri madenciliği