A Rule-based Approach for Converting Wikipedia Content into Semantic Relations

A Rule-based Approach for Converting Wikipedia Content into Semantic Relations


Tunga Güngör

Assigned to: 

Yağmur Aydın






In this thesis, we propose a method for conversion from natural language into semantic relations. In this research, we focus on text written in highly unstructured form. The method is based on analysis of grammatical patterns of the sentences chosen from Wikipedia. Regular expressions are used for the generation of grammatical patterns. In addition to the grammatical structure of sentences, we also made use of the named entities to create semantic relations. Experiments on different types of relations showed that 71% and 82% success rates can be obtained for a threshold of 0.50 correctness rate.


Bu tezde, doğal dilden anlamsal ilişkilere dönüşüm için bir yaklaşım ortaya koyuyoruz. Bu çalışmada, büyük oranda yapısal olmayan döküman içeriğine odaklandık. Yöntem, Vikipedi'den seçilen cümlelerin dilbilgisel model analizi üzerine temellenmiştir. Düzenli ifadeler, dilbilgisel modelin yaratılması için kullanılmıştır. Cümlelerin dilbilgisel yapısına ek olarak, anlamsal ilişkilerin yaratımı için adlı varlıklar kullanılmıştır. Farklı türlerdeki ilişkiler üzerinde yapılan deney sonuçlarına göre, 0.5 doğruluk payı üzerinden belirlenen sınıra göre %71 ve %82 oranında başarı görülmüştür.

Contact us

Department of Computer Engineering, Boğaziçi University,
34342 Bebek, Istanbul, Turkey

  • Phone: +90 212 359 45 23/24
  • Fax: +90 212 2872461

Connect with us

We're on Social Networks. Follow us & get in touch.