Unsplashed background img 1

問答系統


KGQA 系統(Knowledge Graph Question Answering)的主要任務是將使用者輸入的問句轉換為查詢語法(例如:SQL、SPARQL),並在Knowledge Graph(KG)上進行答案檢索。從外部的行為上來看,其與目前主流資訊檢索技術有兩點不同:首先是查詢方式為完整而口語化的問句,再來則是其回傳的為高精準度的答案。以Who is the president of America, 使用者不需要思考該使用甚麼樣的問法才能夠得到理想的答案, 只需要用口語化的方式直接提問如「請問誰是美國總統?」即可。而系統在瞭解使用者問句後,會非常清楚地回答「拜登是美國總統」。 面對這種系統,使用者不需要費心去一一檢視搜尋引擎回傳的網頁,對於資訊檢索的效率與資訊的普及都有很大幫助。從系統內部來看,問答系統使用了大量有別於傳統資訊檢索系統自然語言處理技術,如自然語言剖析(Natural Language Parsing)、問題分類(Question Classification)、專名辨識(Named Entity Recognition)等等。


QAwizard 自然語言查詢系統


QAwizard是由中興大學資管系所開發的自然語言查詢系統,主要以DBpedia作為知識庫,用於理解使用者輸入的英文問句並轉換為適用的SPARQL語法,然後系統會自動在DBpedia上進行查詢並向使用者回傳查詢到的答案, 本研究室已將最新版本已升級至QAwizard 1.2。 隨著Transformer、ConvS2S等現代流行的編解碼器崛起,不少學習普遍轉向神經機器翻譯(NMT)架構及生成式AI中的Text-to-SPARQL領域,本研究室也提出了一種新的Multi-Head Conv編碼器並應用於混合式編解碼器架構中, 並利用該架構來訓練一個翻譯模型從而將將自然語言問句翻譯成SPARQL template(一種類似於RDF triple的格式;但知識庫實體由問句字詞所取代),並展現出卓越的翻譯效能。 翻譯完成後,系統通過四個步驟組合出SPARQL查詢語法並進行答案的查詢。這四個步驟分別是實體鏈接(Entity Mapping)、問句分類(Question Type Classification)、 SPARQL生成及查詢(SPARQL Generation and Query)、以及答案篩選(Filtration)。在實體鏈接階段,我們參考其他研究的方法,建立了一個配對資料庫,用於將SPARQL template的單字轉換為可能對應的知識庫實體。 問句分類階段通過問句的疑問詞找出組成SPARQL所需要的Query Form及問句對應的答案類型。 SPARQL生成及查詢階段將匹配好的SPARQL模板與Query Form組合成SPARQL查詢語法,然後在DBpedia上進行查詢。為了配合本研究使用的資料集,我們選擇使用DBpedia的2016-04版本。 最後,答案篩選階段根據問句分類階段找到的答案類型排除查詢結果中不符合條件的答案,只保留符合條件的答案作為系統的輸出。這樣的流程確保了系統能夠有效地理解並回答複雜的自然語言問句。


相關論文


1.2版本負責人

鄭君豪(112)。基於混合式編解碼器架構搭載交換注意力機制在SPARQL翻譯之研究。國立中興大學資訊管理學系所學位論文。


1.1版本負責人

鄭兆翔(112)。基於遞歸神經網路之依存句法分析產生查詢語法之研究。國立中興大學資訊管理學系所學位論文。
蔡佳佑(111)。基於機率圖模型之依存句法分析產生查詢語法之研究。
郭丞芸(111)。基於注意力機制機器翻譯模型產生SPARQL 查詢語法之研究。
林佳慧(111)。使用機器翻譯方法產生查詢語法解決簡單及複雜問題之研究。
林英延(111)。多標籤分類方法應用於問答系統。


1.0版本負責人

歐庭銨(107)。使用兩階段機器學習的自然語言查詢系統
郭欣逸(106)。一個基於語意分析的自然語言查詢系統。國立中興大學資訊管理學系所學位論文。
李欣宜(104)。自然語言問答系統基於DBpedia給予答案與建立新的關係。國立中興大學資訊管理學系所學位論文。



QAwizard is a question answering system over linked data(DBpedia).
Unsplashed background img 2