Knowledge-Driven Multilingual Text Analysis and Transparent Information Retrieval: Language Technology for Industrial Applications
暫譯: 知識驅動的多語言文本分析與透明資訊檢索:工業應用的語言技術
Thurmair, Gregor
- 出版商: Springer
- 出版日期: 2025-10-10
- 售價: $7,890
- 貴賓價: 9.5 折 $7,496
- 語言: 英文
- 頁數: 393
- 裝訂: Hardcover - also called cloth, retail trade, or trade
- ISBN: 3031917405
- ISBN-13: 9783031917400
-
相關分類:
Text-mining
海外代購書籍(需單獨結帳)
商品描述
商品描述(中文翻譯)
本書介紹了進行透明資訊檢索所需的所有組件和知識來源。根據各自的主題,並考慮到它們的互操作性,使用了深度和淺層技術。處理過程從文本數據的分析開始,並將其結果收集在一個多語言概念網絡中,這樣可以實現透明資訊檢索,使用者可以使用母語與系統進行交流,而文件則可以是不同的語言,對使用者來說是透明的。為了達成這一目標,作者研究了進行多語言索引所需的所有文本分析組件,從語言和主題識別等準備工作開始,接著進行句子切分和標記化(包括中文),並描述詞彙分析,還包括多詞條目和命名實體。條目然後在語法層面(通過標記器)和語義層面(通過多語言詞義消歧)進行消歧。分析結果被收集在一個動態的多語言ConceptNet中,這是一種索引結構,擴展了單語關係(如同義詞或主詞-修飾詞鏈接)以及多語關係(翻譯)。除了許多歐洲語言外,土耳其語、阿拉伯語、波斯語和中文也被納入考量。本書最後描述了構建所需資源所需的組件,如爬蟲、雙語術語提取和默認語言註釋的工具。對於每個組件,讀者將找到技術概述、計算處理中的主要挑戰討論、所選技術解決方案的描述以及評估信息。
作者簡介
Gregor Thurmair has a long history and experience in multilingual text processing and machine translation in industrial setups. Starting with the first retrieval and dialogue systems in the 80s, he worked as a researcher, project leader, and technical director both in the development of IR and MT systems (Siemens' METAL, Linguatec's Personal Translator) and in Language Engineering projects for terminology, multilingual text analysis, and translation in several EU Projects. He has more than 50 publications; he was a member of the ELRA board, reviewer for the European Commission, and invited speaker in several conferences (LREC, CLEF, MTSummit).
作者簡介(中文翻譯)
Gregor Thurmair 在多語言文本處理和工業環境中的機器翻譯方面擁有悠久的歷史和豐富的經驗。自1980年代開始,他參與了第一代檢索和對話系統的開發,擔任研究員、專案負責人和技術總監,參與了資訊檢索(IR)和機器翻譯(MT)系統的開發(如西門子的 METAL 和 Linguatec 的 Personal Translator),以及多個歐盟專案中的語言工程專案,專注於術語、多語言文本分析和翻譯。他擁有超過50篇的出版物;曾擔任 ELRA 董事會成員、歐洲委員會的審稿人,並在多個會議(如 LREC、CLEF、MTSummit)中擔任受邀演講者。